10 اگست، 2025

Snap ریسرچ 2025

کانفرنسز اور ایونٹس

Snap ریسرچ ٹیم AR اور جنریٹو AI، سفارشی سسٹمز، اور ذاتی نوعیت کے تخلیقی ٹولز میں جدت طرازی کی قیادت کر رہی ہے۔

2025 میں، ہم کئی معروف صنعتی کانفرنسوں اور ایونٹس میں اپنے کام کی نمائش کر رہے ہیں۔

گزشتہ ایونٹس:

SIGGRAPH 2025-- وینکوور، کینیڈا 10 اگست سے 14 اگست تک

نیسٹڈ اٹینشن: تصوراتی ذاتی نوعیت کے لیے سیمینٹک-اویئر اٹینشن ویلیوز

نیسٹڈ اٹینشن ایک نیا طریقہ ہے جو امیج جنریشن ماڈلز میں شناخت کے تحفظ کو بڑھانے میں مدد کرتا ہے، جس سے مختلف اسٹائلز اور مناظر میں مخصوص مضامین کی زیادہ مستقل اور درست تصاویر بنتی ہیں۔ سیمینٹک-اویئر اٹینشن اسٹرکچر متعارف کروا کر، ماڈل مختلف اسٹائلز اور مناظر میں شناخت کو بہتر طور پر محفوظ رکھتا ہے۔ اس سے ذاتی نوعیت کی تصاویر بنانا ممکن ہو جاتا ہے، یہاں تک کہ مختلف مضامین - جیسے ایک شخص اور اس کے پالتو جانور - کو ایک تصویر میں ملانا بھی ممکن ہے۔

InstantRestore: شیئرڈ-امیج اٹینشن کے ساتھ سنگل-اسٹیپ پرسنلائزڈ فیس ریسٹوریشن

یہ مقالہ InstantRestore متعارف کراتا ہے، جو ایک ڈفیوژن ماڈل کے ذریعے ایک ہی فارورڈ پاس کا استعمال کرتے ہوئے خراب چہرے کی تصاویر کو بحال کرنے کا ایک طریقہ ہے۔ اس کا مقصد شناخت کے لیے مخصوص خصوصیات کو برقرار رکھنا ہے، جو پورٹریٹ فوٹو کو بہتر بنانے کے لیے موثر شناخت سے آگاہ بحالی کی حمایت کرتا ہے۔

سنگل ویڈیوز سے ڈائنامک تصورات کی ذاتی نوعیت

Set-and-Sequence ویڈیو جنریشن ماڈلز کے لیے ایک نیا فریم ورک ہے جو "ڈائنامک تصورات" کے ساتھ ویڈیوز بنانے کے چیلنج سے نمٹتا ہے - ایسی اکائیاں جن کی تعریف نہ صرف ان کی ظاہری شکل سے ہوتی ہے بلکہ وقت کے ساتھ ان کے منفرد موشن پیٹرن سے بھی ہوتی ہے، جیسے سمندر کی لہریں یا ٹمٹماتی ہوئی الاؤ۔ Set-and-Sequence یہ سیکھ کر حقیقت پسندانہ ویڈیو پرسنلائزیشن کو قابل بناتا ہے کہ متحرک مضامین وقت کے ساتھ کیسا برتاؤ کرتے ہیں، جس سے مستقل حرکت، منظر کی تشکیل، اور کراس-سین بلینڈنگ کی اجازت ملتی ہے۔

DuetGen: ہائیرارکیکل ماسکڈ ماڈلنگ کے ذریعے موسیقی سے چلنے والی دو افراد کی ڈانس جنریشن

DuetGen براہ راست موسیقی سے مطابقت پذیر دو افراد کی ڈانس موشنز بنانے کا ایک فریم ورک ہے۔ یہ انٹرایکٹو کوریوگرافی کی ماڈلنگ کے چیلنج سے نمٹتا ہے، جیسے ڈانس پارٹنرز کے درمیان مربوط حرکت اور جسمانی تعامل۔ یہ نظام اینیمیشن، ورچوئل اوتار، اور ڈیجیٹل پرفارمنس میں ایپلی کیشنز کے لیے حقیقت پسندانہ ڈوئیٹ ڈانس جنریشن کو قابل بناتا ہے۔

فیصلہ کن بنیں: ملٹی سبجیکٹ جنریشن کے لیے شور سے پیدا ہونے والے لے آؤٹس

ہمارا کام 'فیصلہ کن بنیں' پیچیدہ تصاویر میں بصری غلطیوں یا غیر ارادی ملاوٹ کے بغیر متعدد الگ الگ مضامین کو درست طریقے سے بنانے کے چیلنج سے نمٹتا ہے۔ 'فیصلہ کن بنیں' ایک چھوٹا نیورل نیٹ ورک متعارف کراتا ہے جو ڈینوائزنگ کے دوران شور سے پیدا ہونے والے مقامی لے آؤٹ کی پیش گوئی اور اسے بہتر بناتا ہے، اس بات کی رہنمائی کرتا ہے کہ ہر مضمون کو امیج جنریشن کے ابتدائی مراحل سے کہاں ظاہر ہونا چاہیے۔ یہ متعدد مخصوص مضامین کے ساتھ انتہائی تفصیلی تصاویر بنانے کی اجازت دیتا ہے، جس سے ان کے درمیان واضح حدود اور قدرتی کمپوزیشن کو یقینی بنایا جاتا ہے۔

KDD 2025-- ٹورنٹو، اونٹاریو، کینیڈا 3 اگست سے 7 اگست تک

GiGL: Snapchat پر بڑے پیمانے پر گراف نیورل نیٹ ورکس

GiGL بڑے پیمانے پر گراف پر گراف نیورل نیٹ ورکس (GNNs) کی تربیت اور چلانے کے لیے ایک اوپن سورس لائبریری ہے، جو لاکھوں نوڈز اور اربوں کناروں کو سپورٹ کرتی ہے۔ GIGL کو Snap پر کلیدی مشین لرننگ ایپلی کیشنز میں استعمال کیا جاتا ہے، بشمول صارف کی ترقی، مواد کی درجہ بندی، اور اشتہارات۔

تعاون پر مبنی فلٹرنگ میں ویٹ ڈیکے کے کردار پر: ایک مقبولیت کا تناظر

یہ مقالہ PRISM (میگنیٹیوڈز کو ایمبیڈ کرنے کے لیے مقبولیت سے آگاہ ابتدائی حکمت عملی) متعارف کراتا ہے۔ PRISM ایمبیڈنگ ویٹ ڈیکے کے استعمال کو ختم کرتا ہے، جو سفارشی ماڈل کی تربیت میں ایک عام لیکن مہنگی تکنیک ہے، اور اس کے بجائے اسے تربیت کے آغاز میں ایک واحد ہلکے حساب سے بدل دیتا ہے۔ PRISM تیز، لاگو کرنے میں آسان ہے، جو زیادہ موثر سفارشی نظاموں کا باعث بنتا ہے۔

کراس ڈومین سیکوینشل سفارش کے لیے سیلف اٹینشن پر نظرثانی

یہ کام AutoCDSR متعارف کراتا ہے، جو اس بات کو بہتر بنانے کا ایک طریقہ ہے کہ ایسے نظام مختلف تعامل کے ڈومینز میں صارف کے رویوں کی پیش گوئی کیسے کرتے ہیں، شور یا غیر متعلقہ سگنلز کو کم کرتے ہوئے موثر علم کے اشتراک کو فروغ دے کر۔ AutoCDSR سفارشی ترتیبات میں ذاتی نوعیت کی درستگی اور مضبوطی کو بہتر بناتا ہے۔

SnapGen: موبائل آلات کے لیے ہائی-ریزولوشن ٹیکسٹ-ٹو-امیج ماڈلز کو قابو میں کرنا موثر آرکیٹیکچرز اور تربیت کے ساتھ موبائل آلات کے لیے Snap AI T2I ماڈل

SnapGen ایک اعلیٰ کارکردگی والا ٹیکسٹ-ٹو-امیج ریسرچ ماڈل ہے جو براہ راست موبائل آلات پر چلنے کے لیے ڈیزائن کیا گیا ہے، جو دو سیکنڈ سے بھی کم وقت میں اعلیٰ معیار کی تصاویر بناتا ہے۔ اس میں ڈیوائس پر امیج جنریشن کے لیے درکار کمپیوٹ اور میموری کو ڈرامائی طور پر کم کرنے کی صلاحیت ہے۔

SnapGen-V: ایک موبائل ڈیوائس پر پانچ سیکنڈ کے اندر پانچ سیکنڈ کی ویڈیو بنانا

SnapGen-V ہمارے SnapGen ماڈل کو صرف پانچ سیکنڈ میں موبائل آلات پر براہ راست پانچ سیکنڈ کی ویڈیوز بنانے کے لیے توسیع دیتا ہے۔ یہ ٹیکسٹ-ٹو-امیج ماڈلنگ میں ہماری پیشرفت پر مبنی، تیز، آن-ڈیوائس ویڈیو جنریشن کو پہنچ میں لاتا ہے۔

4Real-Video: سیکھنے کے قابل عمومی فوٹو-ریئلسٹک 4D ویڈیو ڈفیوژن

4Real-Video ریسرچ ماڈل بھرپور تفصیلات اور قدرتی حرکت کے ساتھ حقیقت پسندانہ 4D ویڈیوز بناتا ہے، جنہیں متعدد زاویوں سے دیکھا جا سکتا ہے۔ اس ٹیکنالوجی میں عمیق VR اور اگلی نسل کے کہانی سنانے کے تجربات میں ممکنہ ایپلی کیشنز ہیں۔

اسٹیبل فلو: ٹریننگ فری امیج ایڈیٹنگ کے لیے اہم لیئرز

ہمارا اسٹیبل فلو ریسرچ ماڈل طاقتور امیج ایڈیٹنگ کو قابل بناتا ہے، جیسے پیچیدہ تربیت یا اعلیٰ درجے کے ہارڈ ویئر کی ضرورت کے بغیر اشیاء کو شامل کرنا یا ہٹانا۔ یہ نقطہ نظر کسی کو بھی آسانی سے تصاویر میں ترمیم کرنے کی اجازت دیتا ہے، کسی تکنیکی مہارت کی ضرورت نہیں ہے۔

Omni-ID: جنریٹو ٹاسکس کے لیے ڈیزائن کردہ جامع شناختی نمائندگی

ہمارا Omni-ID ریسرچ ماڈل مختلف زاویوں اور تاثرات میں کسی شخص کے چہرے کی ایک جامع نمائندگی بناتا ہے، جس سے زیادہ حقیقت پسندانہ اور ذاتی نوعیت کی AI اور AR جنریشنز کو ممکن بنایا جاتا ہے۔

PrEditor3D: تیز اور درست 3D شکل کی ترمیم

PrEditor3D ہماری تحقیقی ٹیموں کے ذریعہ تیار کردہ ایک ٹول ہے جو کم سے کم ان پٹ کے ساتھ 3D ماڈلز کی فوری اور درست ترمیم کی اجازت دیتا ہے، 3D مواد کی تخلیق کے عمل کو آسان بناتا ہے کہ 3D شکلوں کو کس طرح جوڑ توڑ اور ایڈجسٹ کیا جاتا ہے۔ ایپلی کیشن میں، PrEditor3D میں اینیمیٹرز اور لینزز تخلیق کاروں کے لیے اپنے وژن کو مؤثر طریقے سے زندہ کرنا آسان بنانے کی صلاحیت ہے، جس سے زیادہ بھرپور اور زیادہ عمیق AR تجربات حاصل ہوتے ہیں۔

موڈیلٹیز کا موزیک: ملٹی موڈل گراف لرننگ کے لیے ایک جامع بینچ مارک

MM-Graph ملٹی موڈل گراف لرننگ کے لیے پہلا بینچ مارک متعارف کراتا ہے، جس میں موجودہ بینچ مارکس میں بصری معلومات کے اہم فرق کو دور کرنے کے لیے بصری اور متنی دونوں ڈیٹا کو شامل کیا گیا ہے۔ یہ زیادہ جامع ماڈل کی تشخیص کی اجازت دیتا ہے اور گراف لرننگ سسٹمز میں جدت کو آگے بڑھاتا ہے جو زیادہ بھرپور، حقیقی دنیا کے ان پٹس کو سمجھ سکتے ہیں۔

ویڈیو الکیمسٹ

ایک ٹیکسٹ پرامپٹ اور حوالہ جاتی تصاویر کے ایک سیٹ کے ساتھ، ویڈیو الکیمسٹ وسیع ٹیوننگ یا اصلاح کے بغیر ویڈیوز بنانے کی صلاحیت کو قابل بناتا ہے۔ ایپلی کیشن میں یہ حسب ضرورت ظاہری شکلوں اور پس منظر کے ساتھ ویڈیو کی ذاتی نوعیت کو ہموار کرے گا، تخلیقی صلاحیتوں کو بڑھاتے ہوئے وقت کی بچت کرے گا۔

وقت کا خیال رکھیں: عارضی طور پر کنٹرول شدہ ملٹی ایونٹ ویڈیو جنریشن

مائنڈ دی ٹائم AI سے تیار کردہ ویڈیوز میں درست وقتی کنٹرول متعارف کراتا ہے۔ یہ تخلیق کاروں کو واقعات کی ترتیب اور وقت کا حکم دینے کی اجازت دے گا۔ یہ ویڈیو جنریشن میں زیادہ منظم، مربوط کہانی سنانے کے قابل بناتا ہے۔

ڈفیوژن ٹرانسفارمرز کے ساتھ ویڈیو موشن ٹرانسفر

ویڈیو موشن ٹرانسفر ایک ڈفیوژن ریسرچ ماڈل کا استعمال کرتے ہوئے ایک ویڈیو سے دوسری ویڈیو میں حقیقت پسندانہ حرکت کو منتقل کرنے کا ایک طریقہ ہے۔ ایپلی کیشن میں یہ ماڈل پیچیدہ سیٹ اپ کی ضرورت کے بغیر، حوالہ جاتی ویڈیوز سے حرکت منتقل کرکے حقیقت پسندانہ حرکت کے ساتھ آسانی سے ویڈیوز بنا سکتا ہے۔

ونڈر لینڈ: ایک ہی تصویر سے 3D مناظر کو نیویگیٹ کرنا

ونڈر لینڈ صرف ایک تصویر سے تفصیلی 3D مناظر بناتا ہے، 3D مناظر کی تخلیق کو آسان بناتا ہے، اور متعدد زاویوں یا وسیع وسائل کی ضرورت کے بغیر تیز اور زیادہ موثر ڈیزائن کی اجازت دیتا ہے۔

AC3D: ویڈیو ڈفیوژن ٹرانسفارمرز میں 3D کیمرہ کنٹرول کا تجزیہ اور بہتری

AC3D ویڈیو جنریشن ماڈلز کے اندر کیمرہ کنٹرول کو بہتر بناتا ہے، ہموار، زیادہ حقیقت پسندانہ حرکت کو قابل بناتا ہے۔ یہ تخلیق کاروں کو ویڈیوز میں کیمرے کی نقل و حرکت پر زیادہ لچک دیتا ہے، اور تیار کردہ مناظر کے معیار اور حقیقت پسندی کو بہتر بناتا ہے۔

٭یہاں بیان کردہ تمام ماڈلز اور کام صرف تحقیقی مقاصد کے لیے ہیں۔

یہ پوسٹ اپ ڈیٹ ہوتی رہے گی۔

خبروں کی طرف واپس جائیں

رابطہ کریں

پریس کی درخواستوں کے لیے، ایمیل کریں press@snap.com۔
دیگر تمام پوچھ گچھ کے لیے، براہ کرم ہماری سپورٹ سائٹ پر جائیں۔