19 de junio de 2023

Snap Research presenta un nuevo modelo de difusión de texto a imagen para la IA generativa

En un nuevo documento, Snap Research presenta un método para el modelo en dispositivo más rápido disponible con generación de imágenes en menos de dos segundos.

En Snap, nos inspiran las nuevas características y productos que mejoran la creatividad y dan vida a la imaginación, todo ello gracias a la tecnología de IA generativa. Si bien hay un gran interés en estas experiencias, debido a su compleja arquitectura técnica, requieren mucho tiempo, recursos y potencia de procesamiento para que cobren vida, particularmente en los dispositivos móviles.

Es por eso que hoy nos complace compartir que Snap Research ha desarrollado un nuevo modelo llamado SnapFusion que acorta el tiempo de ejecución del modelo desde la entrada de texto hasta la generación de imágenes en dispositivos móviles a menos de dos segundos, el tiempo más rápido publicado hasta la fecha por la comunidad académica.

Snap Research logró este avance al optimizar la arquitectura de red y el proceso de eliminación de ruido, lo que lo hace increíblemente eficiente, al tiempo que mantiene la calidad de la imagen. Por lo tanto, ahora es posible ejecutar el modelo para generar imágenes basadas en indicaciones de texto y recuperar imágenes claras y nítidas en cuestión de segundos en el dispositivo móvil en lugar de minutos u horas, como lo presenta otra investigación.

Si bien este modelo aún está en una etapa inicial, este trabajo tiene el potencial de impulsar experiencias de IA generativa de alta calidad en dispositivos móviles en el futuro. Para leer más sobre este avance, consulta nuestro documento más detallado aquí.

Volver a Noticias