ChatGPT, ¡Felicitaciones! Se ha recibido de médico, aquí tiene su diploma
ChatGPT es una nueva herramienta de la llamada Inteligencia Artificial Generativa que se encuentra revolucionando el mundo de la tecnología... y también de la medicina.
Un mes atrás se publicó un artículo en el que se estudió cuál fue la precisión de ChatGPT para realizar los exámenes que dan los estudiantes de medicina en Estados Unidos. Me refiero al United States Medical Licensing Examination(USMLE). USMLE es una serie de tres exámenes de selección múltiples, llamados USMLE Step 1, USMLE Step 2 CK y USMLE Step 3 (el USMLE Step 2 CS que es un examen práctico que no fue objeto de esta investigación).
En resumidas cuentas, el estudio muestra que ChatGPT tuvo una precisión que estuvo en el rango necesario para aprobar estos exámenes. La precisión fue más alta en los exámenes más avanzados (Step 3 y Step 2 CK) que en el Step 1.
¿Qué es #chatgpt ?
ChatGPT es la herramienta que tiene a todo el mundo de la ciencia de datos e #inteligenciaartificial (IA) hablando desde hace unos meses. ChatGPT fue creado por la empresa #openai (Artificial Intelligence). Open AI es una empresa que se dedica a la investigación en IA. Fue fundada en 2015 por Sam Altman y Elon Musk. En el último año hemos visto avances en la IA que tienen la magnitud de lo que venía llevando años en desarrollarse.
Repasemos: los algoritmos que usa la IA no son nuevos. La #regresión, que es uno de los algoritmos centrales de la AI, fue descripta a comienzos de 1800 por Legendre y luego por Gauss. Las redes neuronales, que son la esencia de la IA o lo que se conoce como deep learning, fueron descriptas en la década de 1940 a partir del trabajo de McCulloch, Pitts y unos años más tarde Frank Rosenblatt. Debió pasar más de medio siglo para ver avances significativos en esta disciplina. Hicieron falta algunos condimentos para que esta tecnología pueda tener el uso masivo que tiene hoy en día. Estos fueron la disponibilidad de datos digitalizados y el poder computacional masivo que hoy existe.
Genéricamente, la IA se utiliza para dos tipos de problemas: clasificación y predicción. ¿Cómo aprende la IA a resolver estos problemas? Aprende a partir de ejemplos: se la expone a una cantidad de situaciones u objetos y mediante el ajuste automático de cálculos matemáticos que ocurren en las redes neuronales, “aprende” acerca de esta situación u objeto.
En los problemas de clasificación la IA diferencia categorías de objetos y clasifica a un determinado objeto a la categoría que corresponde. En cambio, los problemas de predicción son numéricos. Podríamos pensarlos como casos de uso cualitativos (clasificación) y cuantitativos (predicción).
¿Cómo se conectan estos usos con aprobar los USMLE Steps? El avance es que ahora la IA se está usando para crear, no sólo para categorizar y predecir. Crear no era el típico caso de uso de los últimos años. Esta función se ha potenciado con el desarrollo de dos tipos de redes neuronales llamadas GAN (Generative Adversarial Networks) y GPT (Generative Pre-Trained Transformer). Las redes neuronales GAN son utilizadas para generar imágenes, mientras que las GPT para crear texto, tal como usa ChatGPT.
Un hito ocurrió en enero de 2021 cuando Open AI presentó a DALL-E. DALL-E es una IA que genera imágenes a partir de descripciones de textos. Las siguiente es una imagen del sitio de Open AI:
El siguiente hito ocurrió con DALL-E2. DALL-E2 podría crear imágenes reales y artísticas a partir de instrucciones impartidas en lenguaje común. Tanto DALL-E como DALL-E2 tuvieron una gran difusión y sus capacidades fueron objeto de innumerables discusiones.
Ahora fue el turno de ChatGPT. ChatGPT es una IA que ante un pedido escrito, devuelve una respuesta escrita en texto indiferenciable del que puede haber escrito un humano. Es justamente esta la herramienta que rindió los USMLE Steps. ChatGPT es una herramienta genérica de lenguaje que no está entrenada en medicina ni otra disciplina específica.
Los que dimos y aprobamos estos exámenes sabemos el tiempo que lleva prepararse y pasarlos. A mi me llevó entre 4 y 6 horas diarias de estudio entre abril y septiembre del 2005 preparar el Step 1. Me llevó un cuarto de este tiempo preparar el Step 2 CK y el Step 3. Esta dedicación me alcanzó para aprobar sin haberme parecido exámenes muy dificultosos. Entendamos que miles de horas de estudio fueron reemplazadas por unos segundos de ChatGPT. No debería ser coincidencia que ChatGPT obtuvo su puntaje más bajo en el Step 1. Es el examen que contiene los primeros años de la carrera de medicina, es más tedioso para preparar y probablemente internet contenga menos información relacionada a sus contenidos que a los contenidos más clínicos del Step 2 CK y Step 3.
La precisión de ChatGPT estuvo lejos de ser perfecta, pero esto es el comienzo. Y las mejoras están creciendo a ritmo exponencial, no lineal. Posiblemente en unos meses veamos avances que pensamos llevarían años o décadas. Esto ocurre cuando una tecnología se convierte en exponencial, un concepto que es muy poco intuitivo para los seres humanos.
Al día de hoy los principales problemas que tiene ChatGPT son que puede contener errores conceptuales y que si el pedido que se le hace contiene un error, podría elaborar una respuesta sobre una premisa equivocada. Por otro lado, el texto que brinda podría sonar un poco repetitivo dado que se centra en un argumento y suele expresarlo de diferentes maneras.
Veamos dos ejemplos. En el primero le pedí que me cuente los desafíos que tiene el sistema de salud en el mundo en términos del envejecimiento de la población. Esto me respondió:
En otra ocasión le pregunté qué hacer con un paciente con una fibrilación auricular de alta frecuencia y esto me contestó:
Esta es la primera versión de la herramienta que Open AI puso a disposición del público en general. Un detalle no menor es que ChatGPT utiliza lo que se llama reinforced learning, es decir que usa el input humano para mejorar sus respuestas. Uno le puede pedir que re-elabore una respuesta que no nos gusta o que corrija determinado concepto. Este feedback le sirve para mejorar su precisión ante futuros pedidos.
Estamos ante una revolución cuyo resultado no creo que podamos magnificar en este momento. Estarán los que seguirán diciendo que estas herramientas nunca reemplazarán a los humanos, etc, etc. El argumento negacionista tiene muy poco sustento a luz de la evidencia que tenemos a mano.
Es cierto que el entendimiento de la relación causa-efecto constituye un nivel cognitivo humano en el que no veo que la IA vaya a suplir el intelecto humano en el corto plazo. La IA trabaja sobre correlaciones, no sobre causa-efecto. De hecho, el experimento para demostrar causa-efecto es el ensayo clínico randomizado (y el aporte de sentido común).
La IA es el tejido conectivo que estará embebido en cada una de las tareas que hacemos. La innovación que veremos en el corto plazo no tiene un antecedente cercano y quedará a la vista cómo se ve en el día a día una curva de crecimiento tecnológico exponencial.
Por último, ¿reemplazará la IA a los médicos?
Es una pregunta cuya respuesta requeriría una elaboración más profunda. Creo que la IA reemplazará tareas específicas que los médicos realizamos, no creo que todas las tareas que realizamos. Si considero que tendrán una gran ventaja los médicos que sepan cómo hacer uso de estas herramientas tecnológicas frente a aquellos que no sepan cómo aprovecharlas. Es como imaginar la ventaja que tenía un médico hace 200 años cuando comenzó a usar el estetoscopio con respecto al que no lo usaba, o a la superioridad de la que pudo gozar recientemente un profesional usando un ecocardiograma cuando otros sólo se limitaban a auscultar.



