Un grupo de investigadores de Google y la Universidad de Stanford desarrollaron un modelo de red neuronal llamado ACE, que básicamente utiliza el aprendizaje automático para  tomar decisiones a través de los clasificadores de imágenes.

El estudio publicado por el grupo de investigadores describe un modelo de red neuronal llamado ACE que aprende a través de los conceptos visuales extraídos de una serie de imágenes. Dicha tecnología es poderosa pues será capaz de describir a personas invidentes todos los detalles de una imagen.

Google

ACE utiliza una red neuronal entrenada y un grupo de imágenes que serán los datos de entrada a traducir. El clasificador de imágenes analiza el concepto visual de la gráfica segmentando la imagen por sus texturas y objetos. El modelo de aprendizaje automático puede agrupar los elementos similares y los traduce en un concepto superior, según la documentación presentada.

Así lo explican los investigadores en el documento oficial:

Verificamos el significado y la coherencia a través de experimentos humanos y validamos aún más que de hecho llevan señales sobresalientes para la predicción. [Nuestro] método … agrupa automáticamente las características de entrada en conceptos de alto nivel; conceptos significativos que aparecen como ejemplos coherentes y son importantes para la predicción correcta de las imágenes en las que están presentes.

Google

Google Inception V3

Para verificar la eficacia de su investigación, los científicos utilizaron el modelo de aprendizaje automático Inception V3 de Google, que no es más que un clasificador de imágenes inteligente alimentado a través de una base de datos ImageNet.

El modelo de reconocimiento de imágenes es muy utilizado actualmente y Google asegura que “alcanza una exactitud superior al 78.1%” en ImageNet. Inception se basa en el documento original: Reformulación de la arquitectura de Inception para la visión artificial de Szegedy y otros estudios que científicos realizaron durante años.

Inception seleccionó un grupo de 100 clases de imágenes de cerca de 1,000 clases en el conjunto de datos para aplicar ACE. Al parecer los conceptos tomados en cuenta se basaron un modelo que actuaba como la intuición humana: “por ejemplo, que un logotipo de la policía era más importante para detectar una camioneta de la policía que el asfalto en el suelo”.

Aunque aún falta mucho por recorrer en el desarrollo de ACE, el hecho que pueda tomar decisiones a través de un concepto “más humano”, por decirlo de alguna forma lo convierte en un estudio extraordinario acerca de la forma en que la inteligencia artificial podría alcanzar a interpretar el comportamiento humano. No obstante, ños investigadores reconocen que ACE no es en absoluto perfecto: lucha por extraer de manera significativa conceptos excepcionalmente complejos o difíciles, pero sin duda es una forma de promover el uso optimizado del aprendizaje automático en la sociedad.