Inteligencia Artificial y Sesgos

La inteligencia artificial está cambiando la manera en la que trabajamos y vivimos cotidianamente. Es una de las tecnologías que está marcando nuestra era, con un enorme potencial de oportunidades.

Los sistemas de machine learning nos ayudan a agrupar, clasificar, detectar anomalías y predecir a partir del análisis de grandes cantidades de datos. Estos sistemas nos ayudan a tomar decisiones, como nunca antes en la historia humana.

Pero en paralelo a estas oportunidades, la inteligencia artificial también presenta desafíos. Uno de ellos es el de los sesgos.

¿Qué son los sesgos?

Según el Diccionario de la Real Academia Española, sesgo es un “error sistemático en el que se puede incurrir cuando al hacer muestreos o ensayos se seleccionan o favorecen unas respuestas frente a otras.” Ni más ni menos.

Los sesgos en los sistemas de machine learning pueden llevarnos a tomar decisiones discriminatorias. Estas decisiones discriminatorias pueden tener un enorme impacto indeseado en la vida de las personas. Por eso es importante.

Para hacer frente a estos desafíos, por lo general se habla de los sesgos en los algoritmos. Sin embargo, el desafío es mucho mayor y no se reduce sólo a los algoritmos, sino que incluye a todo el modelo de machine learning, incluyendo a los datos.

¿Sesgos en los algoritmos o en los modelos de machine learning?

Los algoritmos y la etapa de modelado son sólo una parte de un modelo de machine learning. De hecho, si uno utiliza algoritmos ya creados, la etapa de modelado representa quizá el 20/40% del tiempo de un proyecto de este tipo. El 60/80% restante se invierte en los datos. Si uno crea su propio algoritmo, esto cambia, por supuesto.

Por eso, podemos decir que los datos son la materia prima de un modelo de machine learning. Si los datos son buenos, el modelo será bueno. Si los datos son malos, el modelo será malo. Si los datos están sesgados, por más que tengamos el mejor algoritmo, el modelo estará sesgado.

Los datos son la materia prima de un modelo de machine learning.

Esto plantea desafíos en cuanto a comprender, preparar, modelar y procesar los datos y que los mismos hagan sentido para responder a los objetivos y necesidades del proyecto para el cual se está desarrollando un modelo de machine learning.

Algunos de los desafíos más comunes son cómo estructurar los datos, qué hacer con los valores nulos, cómo balancear datasets desbalanceados. Cada decisión de este tipo va a tener una consecuencia directa en el modelo de machine learning.

Luego, además de los posibles sesgos en los datos y en los algoritmos, hay que evaluar la dicotomía entre sesgo y varianza que se presenta al momento de evaluar el modelo, lo que también se conoce como underfitting y overfitting.

Y, desde ya, hay que considerar los sesgos propios de los algoritmos que estemos usando.

La reciente Ley española 15/2022

Recientemente España sancionó la Ley 15/2022 sobre regulación “integral para la igualdad de trato y la no discriminación”, haciendo hincapié en los sesgos de los algoritmos. La norma establece que las administraciones públicas deben favorecer la puesta en marcha de mecanismos para que los algoritmos involucrados en la toma de decisiones que utilicen tengan en cuenta criterios de minimización de sesgos, transparencia y rendición de cuentas, siempre que sea factible técnicamente. Estos mecanismos deben abordar el potencial impacto discriminatorio de los algoritmos. Además, las administraciones públicas deberán promover la realización de evaluaciones de impacto que determinen el posible sesgo discriminatorio.

Por su parte, la cláusula VIII de la Carta Europea de Derechos Digitales específicamente promueve la adopción de medidas específicas para garantizar la ausencia de sesgos de género en los datos y algoritmos usados.

En similar sentido, la Estrategia Nacional de Inteligencia Artificial española también advierte sobre el entrenamiento de los modelos de inteligencia artificial con datos sesgados, que pueden no ser representativos del universo que se desea explorar.

Si el conjunto de datos son de calidad, el modelo de machine learning será bueno. Si el conjunto de datos son malos, el modelo será malo. Si los datos están sesgados, por más que tengamos el mejor algoritmo, el modelo estará sesgado.

Como comenté al comienzo, la inteligencia artificial está marcando nuestra era y tiene un enorme potencial, pero también plantea desafíos. El desarrollo de legislaciones adecuadas y de modelos de IA que aborden estos desafíos de manera integral es clave. Por eso es importante hacer hincapié en los sesgos de los modelos de machine learning en general y no sólo de los algoritmos, pues estos últimos sólo representan una parte de aquéllos. El desafío nos convoca para lograr que esta tecnología tenga un impacto positivo en la vida de las personas y en el funcionamiento de la sociedad. 

  • ¿Estamos ante el comienzo del legaltech o ya vimos todo su potencial?

    Continuar leyendo
  • ¿Estamos ante el comienzo del legaltech o ya vimos todo su potencial?

    Continuar leyendo

Leave A Comment