Sisimulan ng Research team ng Snap ang linggo sa New Orleans sa 2022 Computer Vision at Pattern RecognitionConference. Ngayong taon sa CVPR, magbabahagi ang aming team ng pitong bagong akademikong papeles, kasama ng mga nangungunang mananaliksik sa mundo, na nagpapakita ng mga tagumpay sa kabuuan ng imahe, video, object synthesis at object manipulation method.
Mahigpit kaming nakipagtulungan sa mga intern at mga panlabas na institusyong pang-akademiko sa gawaing ito upang gumawa ng makabuluhang mga tagumpay sa teknolohiya ng video synthesis. Ang mga pag-unlad na ito ay maaaring magpaalam sa huli kung ano ang dinadala namin sa aming komunidad ng mga Snapchatter sa buong mundo.
Ang gawaing ipinakita sa aming mga papel ay batay sa mga sumusunod na pag-unlad: Ang aming team ay nakabuo ng mga implicit na representasyon ng video, na nagreresulta sa makabagong synthesis ng video sa iba't ibang gawain, habang pinapanatili ang katamtamang mga kinakailangan sa pag-compute. Pagkatapos ay ipinakilala namin ang dalawang bagong problema sa domain: multimodal video synthesis at mga puwedeng laruin na kapaligiran.
Halimbawa, ang papel na CLIP-NeRFay isang collaborative na pagsisikap sa pananaliksik upang pag-aralan ang pagmamanipula ng mga field ng Neural Radiance. Ginagawang posible ng mga field ng Neural Radiance na mag-render ng mga bagay gamit ang mga neural network, nang hindi nangangailangan ng mga sopistikadong graphics pipeline. Ang mga natuklasan mula sa gawaing ito ay maaaring makatulong na ipaalam ang mga pagpapabuti sa mga paraan ng paggawa ng mga digital na asset para magamit sa mga karanasan sa augmented reality. At, tinutuklasan ng papel na ito ng PartGlot kung paano mas mauunawaan ng mga makina ang mga hugis at bagay sa paligid natin gamit ang mga modelo ng wika.
Nasasabik kami sa potensyal ng gawaing ito na i-unlock ang pagkamalikhain ng aming komunidad at mga creator sa aming mga produkto at plataporma sa hinaharap.
PUPUNTA SA CVPR?
Ang aming team ay nasa site kaya't halina't mangumusta! Kung gusto mong matuto pa tungkol sa aming mga papeles, team, at produkto, pumunta sa booth #1322 sa panahon ng Expo (Hunyo 21 - Hunyo 23) o mag-email sa conferences@snap.com
2022 CVPR NA MGA PAPELES
Isinulat ni at sa pakikipagtulungan sa Snap Research
Mga Napaglalaruang Kapaligiran: Pagmamanipula ng Video sa Kalawakan at Oras
Willi Menapace, Stéphane Lathuilière, Aliaksandr Siarohin, Christian Theobalt, Sergey Tulyakov, Vladislav Golyanik, Elisa Ricci Poster Session: Martes, Hunyo 21, 2022 2:30NH – 5:00NH
Paper ID: 2345 | Poster ID: 99b
Ipakita sa Akin Ano at Sabihin Sa Akin Paano: Video Synthesis sa pamamagitan ng Multimodal Conditioning Ligong Han, Jian Ren, Hsin-Ying Lee, Francesco Barbieri, Kyle Olszewski, Shervin Minaee, Dimitris Metaxas, Sergey Tulyakov
Poster Session: Martes, Hunyo 21, 2022 2:30NH – 5:00NH
Paper ID: 3594 | Poster ID: 102b
CLIP-NeRF: Text-at-Image Driven Manipulation ng Neural Radiance Fields
Can Wang, Menglei Chai, Mingming He, Dongdong Chen, Jing Liao Poster Session: Martes, Hunyo 21, 2022 | 2:30NH – 5:00NH
Paper ID: 6311 | Poster ID: 123b
StyleGAN-V: Isang Tuloy-tuloy na Video Generator na may Presyo, Kalidad ng Larawan at Perks ng StyleGAN2
Ivan Skorokhodov, Sergey Tulyakov, Mohamed Elhoseiny
Poster Session: Martes, Hunyo 21, 2022 | 2:30NH – 5:00NH
Paper ID: 5802 | Poster ID: 103b
Diverse Image Outpainting sa pamamagitan ng GAN Inversion
Yen-Chi Cheng, Chieh Hubert Lin, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Ming-Hsuan Yang
Poster Session: Huwebes, Hunyo 23, 2022 | 10:00NU-12:30 NH
Paper ID: 5449 | Poster ID: 79a
PartGlot: Pagkatuto ng Shape Part Segmentation mula sa Language Reference Games
Ian Huang,Juil Koo, Panos Achlioptas, Leonidas Guibas, Minhyuk Sung
Poster Session: Biyernes, Hunyo 24, 2022 8:30 NU - 10:18 NU
Paper ID: 3830 | Poster ID: 49a
Matatag ba ang Multimodal Transformers sa Nawawalang Modalidad?
Mengmeng Ma, Jian Ren, Long Zhao, Davide Testuggine, Xi Peng
Poster Session: Biyernes, Hunyo 24, 2022 | 10:00NU - 12:30 NH
Paper ID: 7761 | Poster ID: 212a