ทีมวิจัยของ Snap กำลังเริ่มต้นการประชุม Computer Vision and Pattern Recognition Conference ปี 2022 ซึ่งจัดขึ้นนานหนึ่งสัปดาห์ในนิวออร์ลีนส์ที่ CVPR ในปีนี้ ทีมของเราจะบอกเล่าเกี่ยวกับเอกสารวิชาการใหม่เจ็ดฉบับร่วมกับนักวิจัยชั้นนำของโลก ซึ่งจะชี้ให้เห็นถึงการค้นพบต่างๆ โดยใช้รูปภาพ วิดีโอ การสังเคราะห์และการจัดการวัตถุ
เราได้ทำงานร่วมกับผู้ฝึกงานและสถาบันวิชาการภายนอกทั้งหลายอย่างใกล้ชิดในการนี้เพื่อให้ได้ผลลัพธ์ที่ดีในเรื่องเทคโนโลยีการสังเคราะห์วิดีโอผลการพัฒนาต่างๆ เหล่านี้สามารถบอกได้ว่าในท้ายที่สุดเราจะมอบสิ่งใดให้แก่ชุมชนชาว Snapchatter ทั่วโลกของเรา
เนื้อหาที่นำเสนออยู่ในเอกสารของเราถูกอ้างอิงมาจากการพัฒนาต่างๆ ทีมของเราได้สร้างตัวแทนวิดีโอแบบเป็นนัยซึ่งทำให้เกิดการสังเคราะห์วิดีโอที่ทันสมัยสำหรับงานต่างๆ ขณะที่ยังคงเป็นไปตามข้อกำหนดง่ายๆ เกี่ยวกับคอมพิวเตอร์จากนั้นเราอธิบายถึงปัญหาใหม่สองประการภายในโดเมน การสังเคราะห์วิดีโอหลายรูปแบบและสภาพแวดล้อมที่ใช้งานได้
ตัวอย่างเช่น เอกสาร CLIP-NeRF เป็นงานวิจัยร่วมที่ต้องการศึกษาเกี่ยวกับการดำเนินการของ Neural Radiance FieldsNeural Radiance Fields ช่วยให้สามารถสร้างวัตถุต่างๆ โดยใช้โครงข่ายประสาทเทียมและไม่ต้องใช้ไปป์ไลน์กราฟิกที่ซับซ้อนได้ผลการค้นพบจากงานวิจัยนี้จะช่วยให้ทราบถึงหนทางในการพัฒนาปรับปรุงวิธีที่จะสร้างสรรค์เนื้อหาดิจิทัลเพื่อใช้งานกับประสบการณ์ความเป็นจริงเสริม (AR)ส่วนเอกสาร PartGlot ช่วยอธิบายว่าเครื่องจักรสามารถทำความเข้าใจรูปร่างและวัตถุต่างๆ รอบตัวเราได้ดีขึ้นจากการใช้โมเดลภาษาต่างๆ ได้อย่างไร
เรารู้สึกตื่นเต้นเกี่ยวกับศักยภาพของงานวิจัยนี้ซึ่งจะช่วยเปิดประตูความคิดสร้างสรรค์ภายในชุมชนของเราและผู้สร้างสำหรับผลิตภัณฑ์และแพลตฟอร์มทั้งหมดของเราในอนาคต
ไปที่ CVPR หรือเปล่า?
ทีมของเราจะประจำอยู่ในสถานที่ เชิญมาทักทายกันได้!หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับเอกสาร ทีมงาน และผลิตภัณฑ์ของเรา เชิญแวะมาที่บูธหมายเลข 1322 ในช่วงงานเอ็กซ์โป (21 – 23 มิถุนายน) หรือส่งอีเมลมายัง conferences@snap.com
เอกสาร CVPR ปี 2022
เขียนโดยร่วมมือกับ Snap Research
Playable Environments: Video Manipulation in Space and Time
Willi Menapace, Stéphane Lathuilière, Aliaksandr Siarohin, Christian Theobalt, Sergey Tulyakov, Vladislav Golyanik, Elisa Ricci เซสชันโปสเตอร์: วันอังคารที่ 21 มิถุนายน 2022 เวลา 14.30 น. – 17.00 น.
หมายเลขเอกสาร: 2345 | หมายเลขโปสเตอร์: 99b
Show Me What and Tell Me How: Video Synthesis via Multimodal Conditioning Ligong Han, Jian Ren, Hsin-Ying Lee, Francesco Barbieri, Kyle Olszewski, Shervin Minaee, Dimitris Metaxas, Sergey Tulyakov
เซสชันโปสเตอร์: วันอังคารที่ 21 มิถุนายน 2022 เวลา 14.30 น. – 17.00 น.
หมายเลขเอกสาร: 3594 | หมายเลขโปสเตอร์: 102b
CLIP-NeRF: Text-and-Image Driven Manipulation of Neural Radiance Fields
Can Wang, Menglei Chai, Mingming He, Dongdong Chen, Jing Liao เซสชันโปสเตอร์: วันอังคารที่ 21 มิถุนายน 2022 | 14.30 น. – 17.00 น.
หมายเลขเอกสาร: 6311| หมายเลขโปสเตอร์: 123b
StyleGAN-V: A Continuous Video Generator with the Price, Image Quality and Perks of StyleGAN2
Ivan Skorokhodov, Sergey Tulyakov, Mohamed Elhoseiny
เซสชันโปสเตอร์: วันอังคารที่ 21 มิถุนายน 2022| 14.30 น. – 17.00 น.
หมายเลขเอกสาร: 5802| หมายเลขโปสเตอร์: 103b
Diverse Image Outpainting via GAN Inversion
Yen-Chi Cheng, Chieh Hubert Lin, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Ming-Hsuan Yang
เซสชันโปสเตอร์: วันพฤหัสบดีที่ 23 มิถุนายน 2022 | 10.00 น. - 12.30 น.
หมายเลขเอกสาร: 5449 | หมายเลขโปสเตอร์: 79a
PartGlot: Learning Shape Part Segmentation from Language Reference Games
Ian Huang, Juil Koo, Panos Achlioptas, Leonidas Guibas, Minhyuk Sung
เซสชันโปสเตอร์: วันศุกร์ที่ 24 มิถุนายน 2022 เวลา 08.30 น. - 10.18 น.
หมายเลขเอกสาร: 3830 | หมายเลขโปสเตอร์: 49a
Are Multimodal Transformers Robust to Missing Modality?
Mengmeng Ma, Jian Ren, Long Zhao, Davide Testuggine, Xi Peng
เซสชันโปสเตอร์: วันศุกร์ที่ 24 มิถุนายน 2022 | 10.00 น. - 12.30 น.
หมายเลขเอกสาร: 77761 | หมายเลขโปสเตอร์: 212a