Redimensionar imágenes es un proceso más que conocido y ocupado en nuestros días a través de distintas herramientas. Pero como hemos comentado en otras entregas, siempre es más sencillo reducir el tamaño de una imagen. Cuando se trata de ampliarlas, el proceso es mucho más complicado, aunque no imposible. Esto queda de manifiesto con el trabajo de Google para generar imágenes de Alta Fidelidad a partir de imágenes con poca resolución.

Se trata de un desarrollo en marcha que involucra dos modelos que amplían el tamaño de cualquier imagen con resultados realmente impresionantes, basados en IA.

Los modelos desarrollados por Google para generar imágenes de Alta Fidelidad

El primero de los modelos desarrollados por Google para ampliar imágenes hasta hacerlas de Alta Fidelidad a partir de otras más pequeñas, lleva por nombre SR3. Estas siglas hablan de Súper Resolución de Imagen vía Refinamiento Repetido, pero ¿quiere decir? Para explicarlo de forma sencilla, imaginemos que insertemos una imagen de muy poca resolución en la herramienta. Lo que hace la IA es un proceso de corrupción de la imagen agregando ruido hasta cubrirla completamente. A partir de esto, lleva a cabo el proceso contrario, retirando el ruido y usándolo para construir una imagen en alta resolución usando como guía la que insertamos previamente.

Pero el equipo de Google siguió adelante en la generación de imágenes de Alta Fidelidad. En ese sentido, comenzaron a desarrollar otro modelo que llamaron CDM: Class Conditional ImageNet Generator. Aquí concentran un proceso en cascada que comienza con un modelo generando imágenes en baja resolución, seguido el SR3 que mencionamos antes. De esta manera, es posible llevar imágenes de 32×32 píxeles hasta 1024×1024 con resultados increíbles.

Estas noticias de parte de la sección de Inteligencia Artificial de Google representan un gran avance en el trabajo sobre imágenes. Si bien las posibilidades son múltiples, Google aún no ha comentado nada respecto a cómo podrían llegar estos modelos de generación y mejoramiento de imágenes a los usuarios finales.

Escribir un comentario