La tecnología en las últimas décadas ha avanzado a pasos agigantados. En la actualidad, las máquinas y los programas informáticos son capaces de realizar tareas y actividades que por años pertenecieron solo al terreno de la ciencia ficción.

Entre ellas, nos encontramos con elementos como el reconocimiento facial, que permite a la tecnología identificar individuos basada en combinaciones de marcadores únicos que ubica en sus facciones. Sin embargo, las cosas no solo se han quedado acá.

Convierte imágenes y videos en caricaturas con Cartoonizer

En la actualidad, se entrena a estos algoritmos e inteligencias artificiales para que no solo puedan identificar a la persona, sino también sus emociones. Por ahora, esta última se trata de una tecnología naciente, que aún no ha sido tan desarrollada.

Sin embargo, ya se vislumbran los primeros inconvenientes que su uso podría traer si estas no son “educadas” apropiadamente. Ya que, esto traería como consecuencia la manifestación de un sesgo demográfico que haría sus resultados menos fiables.

La situación

El equipo de investigación conformado por Tian Xu, Jennifer White y Hatice Gunes, de la Universidad de Cambridge, y Sinan Kalkan, de la Universidad Técnica de Medio Oriente, ha tomado como propia la tarea de evaluar esta posibilidad.

Con esto en mente, han puesto el ojo sobre un par de software de reconocimiento de emociones que se encuentran en desarrollo en la actualidad. Luego, sometieron a un estudio a cada uno, para poder determinar el nivel de diversidad u homogeneidad demográfica que había en ellos.

Debido a esto, les fue posible no solo intuir sino comprobar que, efectivamente, las bases de datos con las que se alimentan estos sistemas no son lo suficientemente heterogéneas. Como resultado, el algoritmo, que automáticamente da prioridad a la información o contenidos mayoritarios, ofrece rendimientos deficientes cuando debe tratar con las minorías vagamente registradas en su sistema.

Los acusados

Para poder mostrar el reflejo de su investigación, se enfocaron principalmente en dos bases de datos de código abierto: RAF-DB y CelebA. La primera tiene en su haber miles de imágenes de internet, todas con diversas expresiones faciales diferenciadas según sus atributos particulares. Por su parte, la segunda tiene más de 200 mil imágenes correspondientes con más de 10 mil individuos. A su vez, estas se clasifican según 40 distintos tipos de atributos. En ambos casos, el equipo quiso averiguar si su sistema de detección de emociones era igual de eficiente sin importar variables demográficas como la edad, el género y la étnia.

RAF-DB

La primera en ser evaluada fue RAF-DB y mostró una notable falta de heterogeneidad. De hecho, en su base de datos, más de 77% de los individuos registrados eran caucásicos. Por lo que, el restante 23% quedaba disperso entre otras fisiologías étnicas (15% asiáticos y 7% afroamericanos) Igualmente, las mujeres superaron a los hombres al ser más del 50% de la muestra. Del mismo modo, los rostros jóvenes fueron mucho más frecuentes.

Colorea fotos en blanco y negro con la inteligencia artificial de Image Colorizer

En resumen, con una base de datos “sesgada” como esta, en donde la información básica no es equitativa para todos los integrantes de la muestra, es imposible conseguir resultados igualmente eficientes para detectar las emociones de una persona. En estos casos, como era de esperarse, con individuos caucásicos el algoritmo fue mucho más exitoso que con personas asiáticas, por ejemplo.

CelebA

Por su parte, CelebA comenzó la división de su base de datos de una forma particular: personas sonrientes y personas que no sonríen. Acá, rápidamente fue posible ubicar la primera desigualdad. Más del 61% de la muestra contaba con mujeres que no sonreían, mientras que los hombres sin sonrisa eran apenas un 39%. Por lo que, desde el inicio, es claro que, con esta base de datos, será más fácil identificar las emociones en las féminas que en los hombres. De hecho, la precisión para el caso de las mujeres jóvenes en esta plataforma era de casi un 94%.

¿Uniformizar la variedad?

“Hasta la fecha, existe una gran variedad y cantidad de conjuntos de datos para tareas de reconocimiento de expresiones faciales. Sin embargo, prácticamente ninguno de estos conjuntos de datos se ha adquirido con la consideración de contener imágenes y videos que se distribuyen uniformemente entre la población humana en términos de atributos sensibles como el género, la edad y el origen étnico”.

Esto comentaron los cuatro autores dentro de su estudio. Comentan que, si se espera crear sistemas debidamente eficientes para el reconocimiento de emociones, es necesario que las bases de datos –los pilares para el funcionamiento de los algoritmos– vuelvan algo común la variedad.

En pocas palabras, una buena base de datos para este tipo de trabajo no debería tener mayorías. En específico, se plantea que este realmente debería conformarse por pequeños pero representativos grupos que permitan armar una imagen general más diversa y completa de la variedad humana, tomando en cuenta atributos como la edad, la etnia y el género.

¡Atención!

Justo ahora, la investigación de estos académicos se encuentra presentada en el repositorio de Arxiv.org. Esto debido a que no se trata todavía de un estudio totalmente probado, sino de una presentación preliminar.

Este reloj permite calcular la edad en función del microbioma intestinal

Antes de ser aceptado, sus resultados deberán ser comprobados y avalados por sus pares y colegas de la comunidad científica. Como, por ahora, esto no ha pasado, no es posible tomar sus resultados como una verdad absoluta. Sin embargo, sí se los puede ver como lo que son, un reflejo muy cercano y fidedigno de una tendencia que se ha mantenido constante en el desarrollo de este tipo de sistemas y afines en el mundo de la tecnología. Por lo que, incluso si aún no ha recibido el visto bueno final, esta se trata de una investigación que vale la pena revisar.

Referencia:

Investigating Bias and Fairness in FacialExpression Recognition: https://arxiv.org/pdf/2007.10075.pdf

Más en TekCrispy