19 Juni 2023

Snap Research Memperkenalkan Model Difusi Teks-ke-Gambar yang Baru untuk AI generatif

Dalam makalah baru, Snap Research menyajikan metode untuk model di perangkat tercepat yang tersedia dengan pembuatan gambar dalam waktu kurang dari dua detik.

Di Snap, kami terinspirasi oleh fitur dan produk baru yang meningkatkan kreativitas dan membawa imajinasi menjadi hidup, semuanya diaktifkan oleh teknologi AI generatif. Meskipun ada minat besar pada pengalaman ini, karena arsitektur teknisnya yang kompleks, dibutuhkan waktu, sumber daya, dan kekuatan pemrosesan yang luar biasa untuk menbuat jadi hidup — terutama di seluler.

Itulah sebabnya hari ini, kami dengan senang hati membagikan bahwa Snap Research telah mengembangkan model baru yang disebut SnapFusion yang mempersingkat waktu proses model dari input teks ke pembuatan gambar di seluler menjadi kurang dari dua detik — waktu tercepat yang diterbitkan hingga saat ini oleh komunitas akademik.

Snap Research mencapai terobosan ini dengan mengoptimalkan arsitektur jaringan dan proses denoisasi, membuatnya sangat efisien, sambil mempertahankan kualitas gambar. Jadi, sekarang dimungkinkan untuk menjalankan model untuk menghasilkan gambar berdasarkan petunjuk teks, dan mendapatkan kembali gambar yang jelas dan tajam hanya dalam hitungan detik di seluler bukan menit atau jam, seperti yang disajikan oleh penelitian lainnya.

Meskipun masih awal untuk model ini, karya ini memiliki potensi untuk meningkatkan pengalaman AI generatif berkualitas tinggi di ponsel di masa depan. Untuk membaca selengkapnya tentang terobosan ini, silakan lihat makalah kami yang lebih terperinci di sini.

Kembali ke Berita