Il team di ricerca di Snap sta per presentare durante la prossima settimana in New Orleans alla 2022 Computer Vision and Pattern Recognition Conference. Quest'anno, alla CVPR, il nostro team condividerà sette nuovi paper accademici, insieme ai più importanti ricercatori del mondo, che mostrano risultati nei campi dell'immagine, del video, della sintesi degli oggetti e dei metodi di manipolazione degli oggetti.
Abbiamo lavorato a stretto contatto con tirocinanti e istituzioni accademiche esterne su questo lavoro per creare notevoli risultati nella tecnologia di sintesi video. Questi sviluppi possono informare ciò che portiamo alla nostra community di Snapchatter in tutto il mondo.
Il lavoro presentato nei nostri paper si basa sui seguenti sviluppi: il nostro team ha creato rappresentazioni video implicite, che portano a una sintesi video d'avanguardia su una serie di attività, mantenendo al contempo requisiti computazionali modesti. Vengono quindi presentati due nuovi problemi nel settore: la sintesi video multimodale e gli ambienti riproducibili.
Ad esempio, il paper CLIP-NeRF è il risultato di una ricerca collaborativa per studiare la manipolazione dei campi di radiazione neurale. I campi di radiazione neurale consentono di rendere gli oggetti utilizzando reti neurali, senza il bisogno di pipeline grafiche sofisticate. I risultati di questo lavoro possono aiutare a migliorare i modi in cui le risorse digitali sono create per l'uso in esperienze di realtà aumentata. Inoltre, questo paper di PartGlot esplora il modo in cui le macchine possono comprendere meglio le forme e gli oggetti intorno a noi utilizzando modelli linguistici.
Siamo entusiasti del potenziale di questo lavoro per sbloccare la creatività della nostra Community e degli autori di tutti i nostri prodotti e piattaforme in futuro.
PARTECIPERAI AL CVPR?
Il nostro team ci sarà, vieni a salutarci! Se desideri scoprire di più sui nostri paper, il team e i prodotti, fermati allo stand #1322 durante l'Expo (dal 21 giugno al 23 giugno) o contattaci via e-mail a conferences@snap.com
PAPER CVPR 2022
Scritto da e in collaborazione con Snap Research
Ambienti riproducibili: Manipolazione video nello spazio e nel tempo
Willi Menapace, Stéphane Lathuilière, Aliaksandr Siarohin, Christian Theobalt, Sergey Tulyakov, Vladislav Golyanik, Elisa Ricci Sessione poster: martedì 21 giugno 2022 14:30 – 17:00
ID del paper: 2345 | ID del poster: 99b
Mostrami cosa e spiegami come: sintesi video tramite il condizionamento multimodale Ligong Han, Jian Ren, Hsin-Ying Lee, Francesco Barbieri, Kyle Olszewski, Shervin Minaee, Dimitris Metaxas, Sergey Tulyakov
Sessione poster: martedì 21 giugno 2022 14:30 – 17:00
ID del paper: 3594 | ID del poster: 102b
CLIP-NeRF: Manipolazione guidata di testo e immagini dei campi di radiazione neurale
Can Wang, Menglei Chai, Mingming He, Dongdong Chen, Jing Liao Sessione poster: martedì 21 giugno 2022 | 14:30 – 17:00
ID del paper: 6311 | ID del poster: 123b
StyleGAN-V: Un generatore di video continuo con il costo, la qualità delle immagini e i vantaggi di StyleGAN2
Ivan Skorokhodov, Sergey Tulyakov, Mohamed Elhoseiny
Sessione poster: martedì 21 giugno 2022 | 14:30 – 17:00
ID del paper: 5802 | ID del poster: 103b
Raffigurazioni di immagini diversificate tramite inversione GAN
Yen-Chi Cheng, Chieh Hubert Lin, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Ming-Hsuan Yang
Sessione poster: giovedì 23 giugno 2022 | 10:00-12:30
ID del paper: 5449 | ID del poster: 79a
PartGlot: Imparare la segmentazione di parti della forma dai giochi di riferimento del linguaggio
Ian Huang,Juil Koo, Panos Achlioptas, Leonidas Guibas, Minhyuk Sung
Sessione poster: venerdì 24 giugno 2022 8:30 - 10:18
ID del paper: 3830 | ID del poster: 49a
I trasformatori multimodali sono robusti per la modalità mancante?
Mengmeng Ma, Jian Ren, Long Zhao, Davide Testuggine, Xi Peng
Sessione poster: venerdì 24 giugno 2022 | 10:00 - 12:30
ID del paper: 7761 | ID del poster: 212a