Aunque hay avances considerables en el diagnóstico médico realizado mediante algoritmos por ordenadores, todavía es mucho mejor el realizado por los médicos, según un estudio realizado por investigadores de Harvard Medical School, publicado hace tres días en la revista médica JAMA Internal Medicine, con el que se quería evaluar la precisión en el diagnóstico de los médicos y los algoritmos de ordenadores conocidos como verificadores de síntomas (symptom checkers).
El estudio ‘Comparison of Physician and Comptuer Diagnostic Accuracy’ está firmado por el equipo de investigación de Harvard, encabezado por Hanna Semigran, David Levine, y Shantanu Nundy. Éste último declaró un conflicto de interés ya que es uno de los accionistas del Human Diagnosis Proyect. Un proyecto de escala mundial para casar cualquier problema de salud con un posible diagnóstico, para lo cual intenta comprender los datos fundamentales del diagnóstico de manera similar a como el Proyecto del Genoma Humano ha conseguido desvelar la estructura fundamental del código genético. La aplicación Human Dx fue la utilizada para el diagnóstico algorítmico frente al humano médico en el estudio citado.
El trabajo desarrollado en Harvard, aunque muy limitado por la pequeña muestra de posibles escenarios, dada la vasta cantidad de enfermedades, ha mostrado que a pesar de que los ordenadores han multiplicado exponencialmente la capacidad de cálculo, lo que ha permitido por ejemplo que las máquinas ganen a los humanos en ajedrez, todavía están lejos de jubilar a los médicos, siendo estos, según el estudio, mucho más precisos a la hora de diagnosticar una enfermedad sobre la base de una serie de síntomas.
Los resultados muestran que el 72% de los médicos han diagnosticado acertadamente de primeras frente a sólo el 34% cosechado por las 23 aplicaciones informáticas utilizadas, y los galenos han sido mucho mejores médicamente hablando que las máquinas cuando se ha tratado de diagnosticar enfermedades graves y raras. En el estudio 234 médicos internistas tuvieron que evaluar 45 casos clínicos, que recogían enfermedades comunes (26) y menos habituales (19) con diferente grado de severidad.
En cada prueba, No menos de 20 médicos tenían que dar el diagnóstico más probable y otros dos posibles sobre una lista de síntomas, y el resultado fue de 72% de acierto humano frente al 32% de las máquinas. Teniendo en cuenta las tres posibilidades, la superioridad de los expertos humanos fue del 84% frente al 51% de los algoritmos. Las mayores diferencias se produjeron cuando se estudiaron los casos de enfermedades menos comunes y con mayor avance. Los médicos no pudieron realizar exámenes clínicos de los pacientes, sólo trabajaron con síntomas.
Hay que ver cuanto margen de error se eliminaría si el médico trabaja con máquinas de diagnóstico
En cualquier caso, el hecho de que los ‘errores médicos’ en el elemento fundamental para poder sanar a un paciente, que no es otro que un diagnóstico preciso, estén todavía en alrededor del 15% de los casos, probablemente hubiera sido menor si los médicos, no todos ellos de gran experiencia, hubieran tenido acceso al paciente, hace relevante la ayuda de las máquinas para optimizar el diagnóstico médico, haciendo necesario un estudio nuevo sobre cuanto preciso más será el diagnóstico cuando operen juntos hombre y máquina. Todo apunta a que el uso de la Inteligencia Artificial será una herramienta muy relevante para los médicos.
El investigador Ateev Mehrotra ha subrayado que aunque los programas informáticos se han mostrado claramente inferiores en la precisión del diagnóstico considera vital para la medicina desarrollar programas más avanzados. Los resultados no van a disuadir a los ciudadanos de utilizar tecnología médica a su alcance para disponer de un conocimiento de las enfermedades que ayude a mejorar su salud, pero deben tener en cuenta que quedan todavía muchos años de desarrollo de Inteligencia Artificial para que una máquina sustituya en primera instancia al médico de asistencia primaria.