Snap Research presenterar en ny diffusionsmodell av text-till-bild för Generative AI

På Snap inspireras vi av de nya funktionerna och produkterna som ökar kreativiteten och ger fantasier liv, samtliga möjliggjorda av generativ AI-teknik. Även om det finns ett enormt intresse för dessa upplevelser på grund av deras komplexa tekniska arkitektur så kräver de enormt mycket tid, resurser och processkraft för att komma till liv, särskilt på mobilen.

Det är därför vi idag är glada att berätta att Snap Research har utvecklat en ny modell som heter SnapFusion som förkortar modellens generators körtid från text till bild på mobilen till under två sekunder – den snabbaste tid som den akademiska världen hittills har publicerat.

Snap Research uppnådde detta genombrott genom att optimera nätverksarkitekturen och processen för att få bort så mycket bildbrus som möjligt, vilket gör den otroligt effektiv samtidigt som bildkvaliteten bibehålls. Så nu är det möjligt att köra modellen för att generera bilder baserat på korta texter och få tillbaka skarpa bilder av bra kvalitet på bara några sekunder på mobilen, snarare än på minuter eller timmar som annan forskning erbjuder.

Även om den här modellen fortfarande är ung har detta arbete potential att skapa högkvalitativa generativa AI-upplevelser på mobilen i framtiden. För att läsa mer om detta genombrott kan du kolla in vår mer detaljerade uppsats här.

Tillbaka till Nyheter