10 ఆగస్టు, 2025

Snap పరిశోధన 2025

సదస్సులు & ఈవెంట్‌లు

Snap పరిశోధన బృందం AR & ఉత్పాదక AI, సిఫార్సు సిస్టమ్‌లు, మరియు వ్యక్తిగతీకరించిన సృజనాత్మక సాధనాలలో ఆవిష్కరణలకు నాయకత్వం వహిస్తోంది.

2025లో, మేము అనేక ప్రముఖ పరిశ్రమ సదస్సులు & ఈవెంట్‌లలో మా పనిని ప్రదర్శిస్తున్నాము.

గత ఈవెంట్‌లు:

SIGGRAPH 2025-- వాంకోవర్, కెనడా ఆగస్టు 10 నుండి ఆగస్టు 14 వరకు

నెస్టెడ్ అటెన్షన్: కాన్సెప్ట్ వ్యక్తిగతీకరణ కోసం సెమాంటిక్-అవేర్ అటెన్షన్ విలువలు

నెస్టెడ్ అటెన్షన్ అనేది ఒక కొత్త పద్ధతి, ఇది ఇమేజ్ జనరేషన్ మోడల్‌లలో గుర్తింపు పరిరక్షణను మెరుగుపరచడంలో సహాయపడుతుంది, విభిన్న శైలులు మరియు దృశ్యాలలో నిర్దిష్ట విషయాల యొక్క మరింత స్థిరమైన మరియు ఖచ్చితమైన చిత్రాలను సృష్టిస్తుంది. సెమాంటిక్-అవేర్ అటెన్షన్ నిర్మాణాన్ని ప్రవేశపెట్టడం ద్వారా, మోడల్ విభిన్న శైలులు మరియు దృశ్యాలలో గుర్తింపును మెరుగ్గా సంరక్షిస్తుంది. ఇది వ్యక్తిగతీకరించిన చిత్రాలను సృష్టించడం సాధ్యం చేస్తుంది, ఒక వ్యక్తి మరియు వారి పెంపుడు జంతువు వంటి విభిన్న విషయాలను ఒకే చిత్రంలో కలపడం కూడా సాధ్యమవుతుంది.

ఇన్‌స్టంట్‌రిస్టోర్: షేర్డ్-ఇమేజ్ అటెన్షన్‌తో సింగిల్-స్టెప్ పర్సనలైజ్డ్ ఫేస్ రిస్టోరేషన్

ఈ పేపర్ ఇన్‌స్టంట్‌రిస్టోర్‌ను పరిచయం చేస్తుంది, ఇది డిఫ్యూజన్ మోడల్ ద్వారా ఒకే ఫార్వర్డ్ పాస్‌ను ఉపయోగించి క్షీణించిన ముఖ చిత్రాలను పునరుద్ధరించే పద్ధతి. ఇది గుర్తింపు-నిర్దిష్ట లక్షణాలను నిలుపుకోవడం లక్ష్యంగా పెట్టుకుంది, పోర్ట్రెయిట్ ఫోటో మెరుగుదల కోసం సమర్థవంతమైన గుర్తింపు-అవగాహన పునరుద్ధరణకు మద్దతు ఇస్తుంది.

ఒకే వీడియోల నుండి డైనమిక్ కాన్సెప్ట్‌ల వ్యక్తిగతీకరణ

సెట్-అండ్-సీక్వెన్స్ అనేది వీడియో జనరేషన్ మోడల్‌ల కోసం ఒక కొత్త ఫ్రేమ్‌వర్క్, ఇది "డైనమిక్ కాన్సెప్ట్‌లు" ఉన్న వీడియోలను రూపొందించే సవాలును పరిష్కరిస్తుంది – సముద్రపు అలలు లేదా మినుకుమినుకుమనే మంట వంటి వాటి రూపాన్ని బట్టి మాత్రమే కాకుండా, కాలక్రమేణా వాటి ప్రత్యేకమైన చలన నమూనాల ద్వారా కూడా నిర్వచించబడిన ఎంటిటీలు. డైనమిక్ సబ్జెక్ట్‌లు కాలక్రమేణా ఎలా ప్రవర్తిస్తాయో నేర్చుకోవడం ద్వారా సెట్-అండ్-సీక్వెన్స్ వాస్తవిక వీడియో వ్యక్తిగతీకరణను అనుమతిస్తుంది, ఇది స్థిరమైన చలనం, దృశ్య కూర్పు మరియు క్రాస్-సీన్ బ్లెండింగ్‌ను అనుమతిస్తుంది.

డ్యూయెట్‌జెన్: హైరార్కికల్ మాస్క్డ్ మోడలింగ్ ద్వారా సంగీతంతో నడిచే ఇద్దరు వ్యక్తుల డ్యాన్స్ జనరేషన్

డ్యూయెట్‌జెన్ అనేది సంగీతం నుండి నేరుగా సింక్రొనైజ్ చేయబడిన ఇద్దరు వ్యక్తుల నృత్య కదలికలను రూపొందించడానికి ఒక ఫ్రేమ్‌వర్క్. ఇది డ్యాన్స్ భాగస్వాముల మధ్య సమన్వయ కదలిక మరియు భౌతిక పరస్పర చర్యల వంటి ఇంటరాక్టివ్ కొరియోగ్రఫీని మోడలింగ్ చేసే సవాలును పరిష్కరిస్తుంది. ఈ సిస్టమ్ యానిమేషన్, వర్చువల్ అవతార్‌లు మరియు డిజిటల్ ప్రదర్శనలలో అప్లికేషన్‌ల కోసం వాస్తవిక యుగళ నృత్య ఉత్పత్తిని అనుమతిస్తుంది.

నిర్ణయాత్మకంగా ఉండండి: బహుళ-విషయ ఉత్పత్తి కోసం నాయిస్-ప్రేరిత లేఅవుట్‌లు

మా పని 'బి డిసైసివ్' అనేది దృశ్యపరమైన తప్పులు లేదా అనుకోని మిశ్రమం లేకుండా సంక్లిష్ట చిత్రాలలో బహుళ విభిన్న విషయాలను ఖచ్చితంగా రూపొందించే సవాలును పరిష్కరిస్తుంది. 'బి డిసైసివ్' అనేది ఒక చిన్న న్యూరల్ నెట్‌వర్క్‌ను పరిచయం చేస్తుంది, ఇది డీనోయిజింగ్ సమయంలో నాయిస్-ప్రేరిత ప్రాదేశిక లేఅవుట్‌ను అంచనా వేస్తుంది మరియు మెరుగుపరుస్తుంది, ఇమేజ్ జనరేషన్ యొక్క ప్రారంభ దశల నుండి ప్రతి విషయం ఎక్కడ కనిపించాలో మార్గనిర్దేశం చేస్తుంది. ఇది బహుళ నిర్దిష్ట విషయాలతో అత్యంత వివరణాత్మక చిత్రాలను సృష్టించడానికి అనుమతిస్తుంది, వాటి మధ్య స్పష్టమైన సరిహద్దులు మరియు సహజ కూర్పులను నిర్ధారిస్తుంది.

KDD 2025-- టొరంటో, అంటారియో, కెనడా ఆగస్టు 3 నుండి ఆగస్టు 7 వరకు

GiGL: Snapchatలో భారీ-స్థాయి గ్రాఫ్ న్యూరల్ నెట్‌వర్క్‌లు

GiGL అనేది భారీ-స్థాయి గ్రాఫ్‌లపై గ్రాఫ్ న్యూరల్ నెట్‌వర్క్‌లను (GNNలు) శిక్షణ ఇవ్వడానికి మరియు అమలు చేయడానికి ఒక ఓపెన్-సోర్స్ లైబ్రరీ, ఇది వందల మిలియన్ల నోడ్‌లు మరియు బిలియన్ల అంచులకు మద్దతు ఇస్తుంది. వినియోగదారుల పెరుగుదల, కంటెంట్ ర్యాంకింగ్ మరియు ప్రకటనలతో సహా కీలకమైన మెషిన్ లెర్నింగ్ అప్లికేషన్‌లలో GIGL Snapలో ఉపయోగించబడుతుంది.

సహకార ఫిల్టరింగ్‌లో వెయిట్ డికే పాత్రపై: ఒక ప్రజాదరణ దృక్పథం

ఈ పేపర్ PRISM (ఎంబెడ్డింగ్ మాగ్నిట్యూడ్స్ కోసం పాపులారిటీ-అవేర్ ఇనిషియలైజేషన్ స్ట్రాటజీ)ని పరిచయం చేస్తుంది. PRISM సిఫార్సు మోడల్ శిక్షణలో ఒక సాధారణ కానీ ఖరీదైన టెక్నిక్ అయిన ఎంబెడ్డింగ్ వెయిట్ డికే వాడకాన్ని తొలగిస్తుంది, మరియు బదులుగా శిక్షణ ప్రారంభంలో ఒకే తేలికపాటి గణనతో దాన్ని భర్తీ చేస్తుంది. PRISM వేగవంతమైనది, వర్తింపజేయడం సులభం, ఇది మరింత సమర్థవంతమైన సిఫార్సు సిస్టమ్‌లకు దారితీస్తుంది.

క్రాస్-డొమైన్ సీక్వెన్షియల్ సిఫార్సు కోసం స్వీయ-శ్రద్ధను పునఃపరిశీలించడం

ఈ పని AutoCDSRను పరిచయం చేస్తుంది, ఇది శబ్దంతో కూడిన లేదా అసంబద్ధమైన సంకేతాలను తగ్గించేటప్పుడు సమర్థవంతమైన జ్ఞాన భాగస్వామ్యాన్ని ప్రోత్సహించడం ద్వారా, అటువంటి సిస్టమ్‌లు విభిన్న ఇంటరాక్షన్ డొమైన్‌లలో వినియోగదారు ప్రవర్తనలను ఎలా అంచనా వేస్తాయో మెరుగుపరచడానికి ఒక పద్ధతి. AutoCDSR సిఫార్సు సెట్టింగ్‌లలో వ్యక్తిగతీకరణ యొక్క ఖచ్చితత్వం మరియు పటిష్టతను మెరుగుపరుస్తుంది.

SnapGen: మొబైల్ పరికరాల కోసం అధిక-రిజల్యూషన్ టెక్స్ట్-టు-ఇమేజ్ మోడల్‌లను మచ్చిక చేసుకోవడం సమర్థవంతమైన ఆర్కిటెక్చర్‌లు మరియు శిక్షణతో మొబైల్ పరికరాల కోసం Snap AI T2I మోడల్

SnapGen అనేది మొబైల్ పరికరాల్లో నేరుగా పనిచేసేలా రూపొందించిన అధిక-పనితీరు గల టెక్స్ట్-టు-ఇమేజ్ పరిశోధన మోడల్, ఇది రెండు సెకన్ల కంటే తక్కువ సమయంలో అధిక-నాణ్యత చిత్రాలను రూపొందిస్తుంది. ఇది పరికరంలో ఇమేజ్ జనరేషన్ కోసం అవసరమైన కంప్యూట్ మరియు మెమరీని గణనీయంగా తగ్గించే సామర్థ్యాన్ని కలిగి ఉంది.

SnapGen-V: మొబైల్ పరికరంలో ఐదు సెకన్లలో ఐదు-సెకన్ల వీడియోను రూపొందించడం

SnapGen-V మా SnapGen మోడల్‌ను కేవలం ఐదు సెకన్లలో మొబైల్ పరికరాల్లో నేరుగా ఐదు-సెకన్ల వీడియోలను రూపొందించడానికి విస్తరిస్తుంది. ఇది టెక్స్ట్-టు-ఇమేజ్ మోడలింగ్‌లో మా పురోగతిపై ఆధారపడి, వేగవంతమైన, పరికరంలో వీడియో జనరేషన్‌ను అందుబాటులోకి తెస్తుంది.

4Real-Video: సాధారణీకరించదగిన ఫోటో-రియలిస్టిక్ 4D వీడియో డిఫ్యూజన్‌ను నేర్చుకోవడం

4Real-Video పరిశోధన మోడల్ బహుళ కోణాల నుండి చూడగలిగే, గొప్ప వివరాలు మరియు సహజ కదలికలతో వాస్తవిక 4D వీడియోలను రూపొందిస్తుంది. ఈ టెక్నాలజీకి లీనమయ్యే VR మరియు నెక్స్ట్-జెన్ కథన అనుభవాలలో సంభావ్య అప్లికేషన్‌లు ఉన్నాయి.

స్టేబుల్ ఫ్లో: శిక్షణ-రహిత ఇమేజ్ ఎడిటింగ్ కోసం కీలకమైన లేయర్‌లు

మా స్టేబుల్ ఫ్లో పరిశోధన మోడల్ సంక్లిష్టమైన శిక్షణ లేదా హై-ఎండ్ హార్డ్‌వేర్ అవసరం లేకుండా వస్తువులను జోడించడం లేదా తీసివేయడం వంటి శక్తివంతమైన ఇమేజ్ ఎడిటింగ్‌ను అనుమతిస్తుంది. ఈ విధానం ఎవరైనా సాంకేతిక నైపుణ్యం అవసరం లేకుండా సులభంగా ఫోటోలను ఎడిట్ చేయడానికి అనుమతిస్తుంది.

ఓమ్ని-ID: ఉత్పాదక పనుల కోసం రూపొందించిన సంపూర్ణ గుర్తింపు ప్రాతినిధ్యం

మా ఓమ్ని-ID పరిశోధన మోడల్ వివిధ కోణాలు మరియు వ్యక్తీకరణలలో ఒక వ్యక్తి ముఖం యొక్క సమగ్ర ప్రాతినిధ్యాన్ని నిర్మిస్తుంది, ఇది మరింత వాస్తవిక మరియు వ్యక్తిగతీకరించిన AI మరియు AR తరాలను అనుమతిస్తుంది.

PrEditor3D: వేగవంతమైన మరియు ఖచ్చితమైన 3D ఆకార సవరణ

PrEditor3D అనేది మా పరిశోధన బృందాలు అభివృద్ధి చేసిన ఒక సాధనం, ఇది కనీస ఇన్‌పుట్‌తో 3D మోడల్‌లను త్వరగా మరియు ఖచ్చితంగా సవరించడానికి అనుమతిస్తుంది, 3D ఆకారాలను ఎలా మార్చాలి మరియు సర్దుబాటు చేయాలో సరళీకృతం చేయడం ద్వారా 3D కంటెంట్ సృష్టి ప్రక్రియను క్రమబద్ధీకరిస్తుంది. అప్లికేషన్‌లో, PrEditor3D యానిమేటర్‌లు మరియు లెన్స్ సృష్టికర్తలు తమ దృష్టిని సమర్థవంతంగా జీవం పోయడాన్ని సులభతరం చేసే సామర్థ్యాన్ని కలిగి ఉంది, ఇది మరింత గొప్ప మరియు లీనమయ్యే AR అనుభవాలకు దారితీస్తుంది.

పద్ధతుల మొజాయిక్: మల్టీమోడల్ గ్రాఫ్ లెర్నింగ్ కోసం ఒక సమగ్ర బెంచ్‌మార్క్

MM-గ్రాఫ్ మల్టీ-మోడల్ గ్రాఫ్ లెర్నింగ్ కోసం మొదటి బెంచ్‌మార్క్‌ను పరిచయం చేస్తుంది, ప్రస్తుత బెంచ్‌మార్క్‌లలో దృశ్య సమాచారం యొక్క ముఖ్యమైన అంతరాన్ని పరిష్కరించడానికి దృశ్య మరియు పాఠ్య డేటా రెండింటినీ పొందుపరుస్తుంది. ఇది మరింత సమగ్రమైన మోడల్ మూల్యాంకనాన్ని అనుమతిస్తుంది మరియు వాస్తవ-ప్రపంచ ఇన్‌పుట్‌లను అర్థం చేసుకోగల గ్రాఫ్ లెర్నింగ్ సిస్టమ్‌లలో ఆవిష్కరణను నడిపిస్తుంది.

వీడియో ఆల్కెమిస్ట్

టెక్స్ట్ ప్రాంప్ట్ మరియు రిఫరెన్స్ చిత్రాల సెట్‌తో, వీడియో ఆల్కెమిస్ట్ విస్తృతమైన ట్యూనింగ్ లేదా ఆప్టిమైజేషన్ లేకుండా వీడియోలను రూపొందించగల సామర్థ్యాన్ని అనుమతిస్తుంది. అప్లికేషన్‌లో ఇది కస్టమ్ రూపాలు మరియు నేపథ్యాలతో వీడియో వ్యక్తిగతీకరణను క్రమబద్ధీకరిస్తుంది, సృజనాత్మకతను పెంచుతూ సమయాన్ని ఆదా చేస్తుంది.

సమయాన్ని గమనించండి: తాత్కాలికంగా-నియంత్రిత బహుళ-ఈవెంట్ వీడియో జనరేషన్

మైండ్ ది టైమ్ AI- రూపొందించిన వీడియోలలోకి ఖచ్చితమైన తాత్కాలిక నియంత్రణను పరిచయం చేస్తుంది. ఇది సృష్టికర్తలు సంఘటనల క్రమాన్ని మరియు సమయాన్ని నిర్దేశించడానికి అనుమతిస్తుంది. ఇది వీడియో జనరేషన్‌లో మరింత నిర్మాణాత్మక, పొందికైన కథనాన్ని అనుమతిస్తుంది.

డిఫ్యూజన్ ట్రాన్స్‌ఫార్మర్‌లతో వీడియో మోషన్ ట్రాన్స్‌ఫర్

వీడియో మోషన్ ట్రాన్స్‌ఫర్ అనేది డిఫ్యూజన్ రీసెర్చ్ మోడల్‌ని ఉపయోగించి ఒక వీడియో నుండి మరొక వీడియోకి వాస్తవిక కదలికను బదిలీ చేసే పద్ధతి. అప్లికేషన్‌లో ఈ మోడల్ సంక్లిష్టమైన సెటప్‌లు అవసరం లేకుండా, రిఫరెన్స్ వీడియోల నుండి కదలికను బదిలీ చేయడం ద్వారా వాస్తవిక కదలికతో వీడియోలను సులభంగా సృష్టించగలదు.

వండర్‌ల్యాండ్: ఒకే చిత్రం నుండి 3D దృశ్యాలను నావిగేట్ చేయడం

వండర్‌ల్యాండ్ కేవలం ఒక ఫోటో నుండి వివరణాత్మక 3D దృశ్యాలను సృష్టిస్తుంది, 3D దృశ్యాల సృష్టిని సులభతరం చేస్తుంది మరియు బహుళ కోణాలు లేదా విస్తృతమైన వనరులు అవసరం లేకుండా వేగవంతమైన మరియు మరింత సమర్థవంతమైన డిజైన్‌ను అనుమతిస్తుంది.

AC3D: వీడియో డిఫ్యూజన్ ట్రాన్స్‌ఫార్మర్‌లలో 3D కెమెరా నియంత్రణను విశ్లేషించడం మరియు మెరుగుపరచడం

AC3D వీడియో జనరేషన్ మోడల్‌లలో కెమెరా నియంత్రణను మెరుగుపరుస్తుంది, సున్నితమైన, మరింత వాస్తవిక కదలికను అనుమతిస్తుంది. ఇది సృష్టికర్తలకు వీడియోలలో కెమెరా కదలికలపై మరింత సౌలభ్యాన్ని ఇస్తుంది మరియు రూపొందించిన దృశ్యాల నాణ్యత మరియు వాస్తవికతను మెరుగుపరుస్తుంది.

*ఇక్కడ వివరించిన అన్ని నమూనాలు మరియు పని పరిశోధన ప్రయోజనాల కోసం మాత్రమే.

ఈ పోస్ట్ అప్‌డేట్ చేయబడుతూనే ఉంటుంది.

వార్తలకు తిరిగి వెల్దాం

సంప్రదించండి

ప్రెస్ అభ్యర్థనల కోసం, ఇమెయిల్press@snap.com.
అన్ని ఇతర విచారణల కోసం, దయచేసి మా మద్దతు సైట్‌నిసందర్శించండి.