La Ilusión de Objetividad en el Uso de Datos (y cómo tomar decisiones más informadas)
Hoy descubrimos cómo la ilusión de objetividad en los datos puede ocultar sesgos y prejuicios. Cómo podemos tomar decisiones más informadas en un mundo impulsado por la información.
“If You Torture the Data Long Enough, It Will Confess”, Ronald Coase.
Personalmente, siempre creí en la infalibilidad de utilizar datos para comprobar situaciones y tomar decisiones. Confío en las cifras y estadísticas como fuentes objetivas de verdad. Sin embargo, lejos de ser una fuente objetiva de verdad, reconozco que los datos pueden estar cargados de sesgos. Por más que usemos modelos matemáticos complejos para estudiar situaciones o tomar decisiones, si los datos están sesgados nuestra evaluación no será objetiva. Los datos, lejos de ser infalibles, pueden ser portadores inadvertidos de prejuicios y distorsiones.
¿Para qué necesitamos datos?
La razón fundamental detrás de la recopilación de datos es mantener un registro de los acontecimientos. Los datos nos proporcionan información que nos permite entender mejor el mundo que nos rodea y así evaluar problemas y oportunidades. También los datos son un registro que tenemos disponible en nuestra vida cotidiana para tomar decisiones.
Es importante reconocer que los datos por sí solos no garantizan decisiones acertadas o justas. La interpretación y el uso de los datos pueden estar influenciados por sesgos y prejuicios. Todo a nuestro alrededor son datos. Todo aquello que vemos o leemos son datos. El que sean datos, no los hace objetivos. Somos nosotros los que nos encargamos de filtrar aquellos datos que más nos interesan y descartar aquellos que no creemos importantes.
Sesgo de confirmación: cuando los datos refuerzan creencias preexistentes
El sesgo de confirmación es un fenómeno cognitivo en el que las personas tienen la tendencia natural a buscar, interpretar y recordar información de una manera que confirma sus creencias o hipótesis preexistentes, descartando información que contradice esas creencias. Este sesgo puede tener un impacto significativo cuando se trata de datos, dado que las personas tienden a buscar datos que respalden sus puntos de vista o teorías y a evitar aquellos que los desafían. Y al tratarse de datos, se cree que se está siendo objetivo.
En el contexto de la toma de decisiones basada en datos, el sesgo de confirmación puede ser problemático. Si las personas están enfocadas en encontrar datos que validen sus suposiciones previas, se pierde la objetividad y se pueden tomar decisiones sesgadas. Esto puede llevar a la selección selectiva de datos que respaldan una decisión preconcebida, en lugar de considerar una gama completa de evidencia disponible.
Un ejemplo sencillo, pero no menos válido en la actualidad lo representa cualquiera de nosotros que pueda informarse a través de las redes sociales. Es natural que tengamos una tendencia a seguir cuentas y fuentes de noticias que reflejan nuestras creencias políticas y valores personales. Como resultado, el feed de noticias está lleno de contenido que confirma nuestros puntos de vista preexistentes y creencias.
A medida que nos sumergimos en el flujo de noticias que coinciden con lo que ya creemos, cada vez nos volvemos menos propensos a exponernos a diferentes perspectivas. Con el agravante que los algoritmos de las redes sociales están diseñados para optimizar nuestro tiempo de permanencia en ellas, por lo que naturalmente seleccionará más contenido que nos mantenga en uso, reforzando el ciclo.
La solución: ¿más datos y mejores algoritmos para tomar nuestras decisiones?
Lamentablemente no. Más datos no es la solución. Tampoco mejores algoritmos. Podríamos pensar que la inteligencia artificial (IA) es la solución o el gold standard en la toma de decisiones no sesgadas, pero nada más alejado de la realidad. Sólo aquellos que tienen un conocimiento básico de cómo funcionan estas herramientas podrían creer que mejores algoritmos de IA es la solución para la toma de mejores decisiones.
Los algoritmos de IA necesitan datos para entrenarse. Los datos son seleccionados y aportados por seres humanos, que como hemos visto somos sujetos vulnerables a diferentes tipos de sesgos. Entonces, ¿por qué ocurriría que los datos que son seleccionados para entrenar un algoritmo de IA no estén sesgados?
Así como yo hoy estoy decidiendo acerca de qué escribir, los datos que se incluyen en cualquier algoritmo para entrenarse o se incluyen en una presentación, los deciden personas. Los datos no son entidades mágicas que aparecen de la nada. No se inventan a sí solos. Alguien los aporta, recolecta, organiza y presenta. Estas decisiones no son objetivas. Por lo que el uso de datos no son sinónimo de objetividad.
Los riesgos de la IA
La IA es una poderosa herramienta que puede aprender patrones y tomar decisiones basadas en datos. Sin embargo, la IA puede estar sesgada de manera significativa dependiendo de los datos con los que se entrena. Cuando los conjuntos de datos utilizados para el entrenamiento contienen sesgos inherentes o reflejan prejuicios culturales, sociales o históricos, la IA puede absorber y perpetuar esos sesgos. Como he dicho más arriba, los datos son seleccionados y presentados por seres humanos con todos sus sesgos inherentes.
La IA busca identificar patrones en los datos de entrenamiento. Si esos datos contienen desigualdades o prejuicios la IA aprenderá a replicar esos patrones. Con el tiempo, esto puede llevar a la toma de decisiones automatizadas sesgadas en una amplia gama de aplicaciones, desde la contratación de personal hasta la otorgación de préstamos y la administración de justicia. La importancia de abordar estos sesgos en la IA radica en garantizar que las decisiones impulsadas por la tecnología sean justas, equitativas y éticas en lugar de perpetuar prejuicios históricos y sociales.
Cathy O’Neil en su libro “Weapons of math destruction” crítica el impacto perjudicial de algoritmos y modelos en decisiones sociales debido a sesgos y falta de transparencia. Resulta una lectura invalorable para los que alguna vez se han cuestionado el valor objetivo que tienen los datos y su manejo.
¿Cómo ser menos subjetivos?
El sesgo de confirmación es sólo uno de las decenas de sesgos que tenemos los seres humanos. Negarlos es sencillamente negar nuestra naturaleza. Entonces, ¿cómo los neutralizamos? La primera medida es reconocerlos. Debemos saber que aunque no lo querramos y lo neguemos, siempre nuestras decisiones están influenciadas por variables de las que ni siquiera tenemos registro.
Por ejemplo, hace unos años se conoció un trabajo que estudiaba los veredictos de jueces durante las diferentes horas del día. Los veredictos eran más benévolos al comienzo del día y después del almuerzo. Si las personas que deberían ser de las más objetivas para tomar decisiones se ven influenciadas por tener o no el estómago lleno, ¿qué le queda al resto?
Una segunda medida es sincerar si lo que buscamos en los datos es validar una decisión que ya tenemos tomada o no. La mayor parte de las veces no somos indiferentes a lo que los datos van a mostrar. Habitualmente buscamos validar una posición ya tomada previamente. Al ver datos los interpretamos de manera que revaliden nuestra decisión. Un dato de ventas, de costos o de lo que sea puede ser interpretado para bien o para mal dependiendo de quién lo presente y cómo lo presente.
Por último, el mejor antídoto para la subjetividad está en la calidad de nuestras preguntas. La objetividad no está en los datos, si no en la pregunta que buscamos responder con los datos. En el caso de que tengamos que tomar una decisión, debemos preguntarnos y establecer de antemano qué vamos a hacer de acuerdo a lo que encontremos en los datos.
Supongamos que tenemos un resto de dinero que deseamos invertir. Nos asesoramos y nos recomiendan invertir en acciones de Mercado Libre dado que viene presentando resultados económicos cada vez mejores y continúa ganando mercado. Decidimos comprobar por nosotros mismos lo que nos han recomendado antes de tomar la decisión y estudiamos la performace de la empresa.
A esta altura, con una recomendación de un asesor y luego de haber invertido tiempo en comprobar cómo le va a Mercado Libre, es probable que sólo por inercia realicemos la inversión. Una forma de agregar objetividad y evitar la inercia en nuestra decisión, es establecer de antemano un parámetro que nos mueva en una dirección u otra. Podría ser algo así como: si la compañía presenta tres trimestres de resultado económico positivo invertiremos, de lo contrario no. Es bueno escribir este criterio antes de tomar la decisión de manera que no podamos engañarnos una vez que hayamos decidido.
Por supuesto que no hace falta realizar este tipo de predeterminaciones cada vez que vamos a tomar una decisión. Un análisis de este tipo le agrega mucha calidad a aquellas decisiones cuando hay cosas importantes en juego. Lamentablemente, muchas decisiones, aún en circunstancias importantes, se siguen tomando en base a lo que le parece a quien decide y los datos sólo se usan para validar posiciones ya tomadas.
En resumen, en un mundo cada vez más dependiente de los datos, es esencial comprender que su objetividad es una ilusión peligrosa. Los datos son seleccionados y presentados por individuos con sus propias perspectivas y prejuicios y por lo tanto vienen cargados de sesgos. El sesgo de confirmación, donde buscamos datos que respalden nuestras creencias preexistentes, es solo un ejemplo. Para tomar decisiones informadas y éticas, debemos reconocer estos sesgos, establecer criterios objetivos de antemano y ser conscientes de que la verdadera objetividad reside en cómo formulamos preguntas, evaluamos evidencia y aplicamos criterios a la información que recopilamos.