Los generadores de imágenes IA no paran de ser el centro de atención en el mundo, incluso algunos se han preguntado si también podría resultar de ayuda para los robots. Sabemos que estas herramientas IA han sido usados por muchos para diversos motivos: participar en un concurso de arte o simplemente para crear imágenes más creativas para anuncios de marketing. Sea lo que sea, estos programas no paran de ser la sensación en el mundo actual.

Uno de los que han sido fascinados por ellos es Yilun Du. Quien es un estudiante de doctorado del Departamento de Ingeniería Eléctrica y Ciencias de la Computación. Du desarrolló recientemente un nuevo método que hace que los modelos como DALL-E 2 sean más creativos y tengan una mejor comprensión de la escena.

Así que tomaremos algunas de las ideas de Du y le prestaremos especial atención a las contribuciones que podrían realizar estos modelos.

Más datos sobre los generadores de imágenes IA, ¿podrían contribuir con los robots y el mundo?

Algo importante que ha señalado Du es que los generadores de imágenes IA se alimentan de la creatividad humana para funcionar. Recordemos que ellos son capaces de producir todas esas imágenes porque han estudiado las que han realizado millones de humanos. Así que podríamos decir que la IA se alimenta del humano para poder seguir renovándose.

También tengamos presente que estas funcionan bajo los modelos de difusión, esto les permite convertir texto en imágenes asombrosas en solo unos minutos. Pero, ¿de qué más podría llegar a ser capaz ahora? Antes de ello, recordemos algunas de sus limitaciones: Du dice que: “cuando se intentan generar combinaciones poco frecuentes de palabras que tú o yo en nuestro trabajo mental podemos imaginar muy fácilmente, estos modelos no pueden”.

Un ejemplo de esto: si dices «pon un tenedor encima de un plato», eso sucede todo el tiempo. En cambio, si dices, «pon un plato encima de un tenedor»,allí es donde viene los problemas. Debido a que el programa no podrá hacerlo.  

En resumen: si estos generadores de imágenes reciben indicaciones de lenguaje natural muy complicadas, no hay forma en que este pueda representar con precisión todos los detalles de los componentes.

generadores de imágenes
Vía Jose Luis Olivares/MIT and the researchers

Las aplicaciones de estos generadores de imágenes IA más allá del texto

Hace poco, el investigador Du creó un nuevo método que utiliza múltiples modelos para crear imágenes más complejas con una mejor comprensión del arte generativo. Pero, ¿esto podría aplicarse fuera de los dominios de la imagen a texto?

Du dicen que: “Cuando les das a estos modelos descripciones de escenas muy complicadas, en realidad no pueden generar correctamente imágenes que coincidan con ellas”. Esa limitación lo inspiró para hacer mucho más. Como solución, estos modelos pueden “componer muchos modelos independientes diferentes juntos y hacer que cada modelo individual represente una parte de la escena que desea describir”.

Hacer esto permite que estos modelos generen escenas más complicadas. Además, este enfoque se puede aplicar generalmente en una variedad de dominios diferentes. He aquí algunos de ellos:

  • Los generadores de imágenes IA pueden usarse para crear diferentes comportamientos de robots diversos.
  • Estos modelos también serían perfectos para sintetizar formas 3D.
  • Incluso para permitir una mejor comprensión de la escena o diseñar nuevos materiales. Por ejemplo, estos podrían componer múltiples factores deseados y generar el material exacto que necesitas para una aplicación en particular.
  • Otro aspecto increíble de estos generadores de imágenes IA es que también podrían usarse para generar diferentes trayectorias de robots. Y, al componer diferentes modelos juntos, pueden generar trayectorias con diferentes combinaciones de habilidades.
  • De manera similar, si alguien quiere diseñar proteínas, puede especificar diferentes funciones o aspectos.

¿Qué te parecen las diversas posibilidades que podrían traer estos modelos? ¿Quisieras añadir una más?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *