Snap की रिसर्च टीम न्यू ऑरलियन्स में 2022 कंप्यूटर विज़न और पैटर्न रेकग्निशन कॉन्फ्रेंस से सप्ताह की शुरुआत कर रही है। इस साल CVPR में, हमारी टीम दुनिया के प्रमुख शोधकर्ताओं के साथ सात नए अकादमिक पेपर शेयर करेगी, जो इमेज, वीडियो, ऑब्जेक्ट सिंथेसिस और ऑब्जेक्ट मैनिपुलेशन विधियों में सफलता दिखाते हैं।
हमने इस काम पर इंटर्न और बाहरी शैक्षणिक संस्थानों के साथ मिलकर काम किया है ताकि वीडियो सिंथेसिस तकनीक में महत्वपूर्ण लाभ प्राप्त किया जा सके। ये विकास अंततः सूचित कर सकते हैं कि हम अपने दुनिया भर के Snap चैटर्स की कम्युनिटी लिए क्या लाते हैं।
हमारे पेपर्स में प्रस्तुत कार्य निम्नलिखित विकास पर आधारित है: हमारी टीम ने निहित वीडियो प्रस्तुतीकरण बनाया है, जिसके परिणामस्वरूप मामूली कम्प्यूटेशनल आवश्यकताओं को बनाए रखते हुए विभिन्न कार्यों पर अत्याधुनिक वीडियो सिंथेसिस होता है। फिर हम डोमेन में दो नई समस्याएं पेश करते हैं: मल्टीमॉडल वीडियो सिंथेसिस और प्लेएबल एनवायरनमेंट।
उदाहरण के लिए, CLIP-NeRF पेपर न्यूरल रेडिएंस फ़ील्ड के हेरफेर का अध्ययन करने के लिए एक सहयोगी अनुसंधान प्रयास था। न्यूरल रेडियंस फ़ील्ड परिष्कृत ग्राफ़िक्स पाइपलाइनों की आवश्यकता के बिना, न्यूरल नेटवर्क का उपयोग करके वस्तुओं को प्रस्तुत करना संभव बनाते हैं। इस कार्य से प्राप्त निष्कर्ष, ऑगमेंटेड रिएलिटी अनुभवों में उपयोग किए जाने वाले डिजिटल एसेट्स के निर्माण के तरीकों में सुधार करने में मदद कर सकते हैं। और, यह PartGlot पेपर इस बात की पड़ताल करता है कि भाषा मॉडल का उपयोग करके मशीनें हमारे आस-पास के आकार और वस्तुओं को बेहतर ढंग से कैसे समझ सकती हैं।
हम भविष्य में अपने उत्पादों और प्लेटफार्मों पर अपनी कम्युनिटी और रचनाकारों की रचनात्मकता को अनलॉक करने के लिए इस काम की क्षमता को लेकर बहुत उत्साहित हैं।
CVPR के लिए जा रहे हैं?
हमारी टीम साइट पर होगी तो आएं नमस्ते कहें! अगर आप हमारे पेपर्स, टीम और उत्पादों के बारे में अधिक जानना चाहते हैं, तो एक्सपो के दौरान बूथ #1322 पर रुकें (21 जून - 23 जून) या conferences@snap.com पर ईमेल करें
2022 CVPR पेपर्स
Snap रिसर्च द्वारा और उसके सहयोग से लिखित
प्लेएबल एनवायरनमेंट: अंतरिक्ष और समय में वीडियो हेरफेर
विली मेनापेस, स्टीफ़न लाथुइलिएरे, अलिकसंद्र सियारोहिन, क्रिश्चियन थियोबाल्ट, सर्गेई टुल्याकोव, व्लादिस्लाव गोल्यानिक, एलिसा रिक्की पोस्टर सेशन: मंगलवार, 21 जून, 2022 दोपहर 2:30 बजे से शाम 5:00 बजे तक
पेपर आईडी: 2345 | पोस्टर आईडी: 99b
मुझे दिखाएं कि क्या और कैसे करना है: मल्टीमॉडल कंडीशनिंग के जरिए वीडियो सिंथेसिस लिगोंग हान, जियान रेन, सिन-यिंग ली, फ्रांसेस्को बारबेरी, काइल ओल्स्ज़वेस्की, शेरविन मिने, दिमित्रिस मेटाक्सस, सर्गेई तुल्याकोव
पोस्टर सेशन: मंगलवार, 21 जून, 2022 दोपहर 2:30 बजे से शाम 5:00 बजे तक
पेपर आईडी: 3594 | पोस्टर आईडी: 102बी
CLIP-NeRF: न्यूरल रेडियंस फ़ील्ड के टेक्स्ट और इमेज संचालित हेरफेर
कैन वैंग, मंगलेई चाई, मिंगमिंग हे, डोंगडोंग चेन, जिंग लिआओ पोस्टर सेशन: मंगलवार, 21 जून, 2022 | दोपहर 2:30 बजे से शाम 5:00 बजे तक
पेपर आईडी: 6311 | पोस्टर आईडी: 123बी
StyleGAN-V: StyleGAN2 की कीमत, इमेज गुणवत्ता और सुविधाओं के साथ एक सतत वीडियो जेनरेटर
इवान स्कोरोखोडोव, सर्गेई टुल्याकोव, मोहम्मद एल्होसिनी
पोस्टर सेशन: मंगलवार, 21 जून, 2022 | 2:30 बजे से शाम 5:00 बजे तक
पेपर आईडी: 5802 | पोस्टर आईडी: 103बी
GAN इंवरज़न के माध्यम से विविध इमेज आउटपेंटिंग
येन-ची चेंग, चिएः हुबर्ट लीन, शिन-यिंग ली, जीआन रेन, सर्गेई तुलयकोव, मिंग शुआन यांग
पोस्टर सेशन: गुरूवार, 23 जून, 2022 | सुबह 10:00 से दोपहर 12:30 बजे तक
पेपर आईडी: 5449 | पोस्टर आईडी: 79ए
PartGlot: भाषा संदर्भ खेलों से आकार भाग विभाजन सीखना
इयान हुआंग, जुइल कू, पैनोस एकलियोप्टस, लियोनिडास गुइबास, मिन्ह्युक सुंग
पोस्टर सेशन: शुक्रवार, 24 जून, 2022 सुबह 8:30 बजे से 10:18 बजे तक
पेपर आईडी: 3830 | पोस्टर आईडी: 49ए
क्या मल्टीमॉडल ट्रांसफॉर्मर लापता मोडैलिटी के लिए मजबूत हैं?
मेंगमेंग मा, जीआन रेन, लॉन्ग ज़हाओ, डेविड टेस्टउजिन, ज़ी पेंग
पोस्टर सेशन: शुक्रवार, 24 जून, 2022 | सुबह 10:00 बजे से दोपहर 12:30 बजे तक
पेपर आईडी: 7761 | पोस्टर आईडी: 212ए