El sistema de aprendizaje automático marca los remedios que podrían hacer más daño que bien

El sistema de aprendizaje automático marca los remedios que podrían hacer más daño que bien
Sin comentarios

Las intervenciones rápidas de los profesionales médicos salvan vidas, pero algunos tratamientos de la sepsis también pueden contribuir al deterioro del paciente, por lo que elegir la terapia óptima puede ser una tarea difícil. Por ejemplo, en las primeras horas de una sepsis grave, la administración de demasiado líquido por vía intravenosa puede aumentar el riesgo de muerte del paciente.

La sepsis se cobra la vida de casi 270.000 personas al año solo en Estados Unidos. Para ayudar a los médicos a evitar los remedios que potencialmente pueden contribuir a la muerte de un paciente, investigadores del MIT han desarrollado un modelo de aprendizaje automático que podría usarse para identificar tratamientos que presentan un riesgo mayor que otras opciones.

Sepsis y Machine Learning

La sepsis es la respuesta abrumadora y extrema de su cuerpo a una infección. La sepsis es una emergencia médica que puede ser mortal. Sin un tratamiento rápido, puede provocar daños en los tejidos, falla orgánica e incluso la muerte.

Pero en el estudio, cuando se aplicó a un conjunto de datos de pacientes con sepsis en una unidad de cuidados intensivos de un hospital, el modelo de los investigadores indicó que alrededor del 12 por ciento de los tratamientos administrados a los pacientes que murieron fueron perjudiciales. El estudio también revela que alrededor del 3 por ciento de los pacientes que no sobrevivieron entraron en un callejón sin salida médico hasta 48 horas antes de morir.

Este proyecto de investigación fue impulsado por un artículo de 2019 que escribió Fatemi que exploraba el uso del aprendizaje por refuerzo en situaciones en las que es demasiado peligroso explorar acciones arbitrarias, lo que dificulta generar suficientes datos para entrenar algoritmos de manera efectiva. Estas situaciones, en las que no se pueden recopilar más datos de forma proactiva, se conocen como configuraciones "sin conexión".

En el aprendizaje por refuerzo, el algoritmo se entrena mediante prueba y error y aprende a tomar acciones que maximicen su acumulación de recompensa. Pero en un entorno de atención médica, es casi imposible generar suficientes datos para que estos modelos aprendan el tratamiento óptimo, ya que no es ético experimentar con posibles estrategias de tratamiento.

Entonces, los investigadores le dieron la vuelta al aprendizaje por refuerzo. Utilizaron los datos limitados de la UCI de un hospital para entrenar un modelo de aprendizaje por refuerzo para identificar los tratamientos que se deben evitar, con el objetivo de evitar que un paciente entre en un callejón sin salida médico.

Para desarrollar su enfoque, llamado Dead-end Discovery (DeD), crearon dos copias de una red neuronal. La primera red neuronal se enfoca solo en los resultados negativos, cuando un paciente murió, y la segunda red solo se enfoca en los resultados positivos, cuando un paciente sobrevivió. El uso de dos redes neuronales por separado permitió a los investigadores detectar un tratamiento de riesgo en una y luego confirmarlo con la otra.

Alimentaron las estadísticas de salud del paciente de cada red neuronal y un tratamiento propuesto. Las redes generan un valor estimado de ese tratamiento y también evalúan la probabilidad de que el paciente entre en un callejón sin salida médico. Los investigadores compararon esas estimaciones para establecer umbrales para ver si la situación genera alguna señal de alerta.

Una bandera amarilla significa que un paciente está entrando en un área de preocupación, mientras que una bandera roja identifica una situación en la que es muy probable que el paciente no se recupere.

Temas
Comentarios cerrados
Inicio