
Snap పరిశోధన 2025
సదస్సులు & ఈవెంట్లు
Snap పరిశోధన బృందం AR & ఉత్పాదక AI, సిఫార్సు సిస్టమ్లు, మరియు వ్యక్తిగతీకరించిన సృజనాత్మక సాధనాలలో ఆవిష్కరణలకు నాయకత్వం వహిస్తోంది.
2025లో, మేము అనేక ప్రముఖ పరిశ్రమ సదస్సులు & ఈవెంట్లలో మా పనిని ప్రదర్శిస్తున్నాము.
గత ఈవెంట్లు:

SIGGRAPH 2025-- వాంకోవర్, కెనడా ఆగస్టు 10 నుండి ఆగస్టు 14 వరకు
నెస్టెడ్ అటెన్షన్: కాన్సెప్ట్ వ్యక్తిగతీకరణ కోసం సెమాంటిక్-అవేర్ అటెన్షన్ విలువలు
నెస్టెడ్ అటెన్షన్ అనేది ఒక కొత్త పద్ధతి, ఇది ఇమేజ్ జనరేషన్ మోడల్లలో గుర్తింపు పరిరక్షణను మెరుగుపరచడంలో సహాయపడుతుంది, విభిన్న శైలులు మరియు దృశ్యాలలో నిర్దిష్ట విషయాల యొక్క మరింత స్థిరమైన మరియు ఖచ్చితమైన చిత్రాలను సృష్టిస్తుంది. సెమాంటిక్-అవేర్ అటెన్షన్ నిర్మాణాన్ని ప్రవేశపెట్టడం ద్వారా, మోడల్ విభిన్న శైలులు మరియు దృశ్యాలలో గుర్తింపును మెరుగ్గా సంరక్షిస్తుంది. ఇది వ్యక్తిగతీకరించిన చిత్రాలను సృష్టించడం సాధ్యం చేస్తుంది, ఒక వ్యక్తి మరియు వారి పెంపుడు జంతువు వంటి విభిన్న విషయాలను ఒకే చిత్రంలో కలపడం కూడా సాధ్యమవుతుంది.
ఇన్స్టంట్రిస్టోర్: షేర్డ్-ఇమేజ్ అటెన్షన్తో సింగిల్-స్టెప్ పర్సనలైజ్డ్ ఫేస్ రిస్టోరేషన్
ఈ పేపర్ ఇన్స్టంట్రిస్టోర్ను పరిచయం చేస్తుంది, ఇది డిఫ్యూజన్ మోడల్ ద్వారా ఒకే ఫార్వర్డ్ పాస్ను ఉపయోగించి క్షీణించిన ముఖ చిత్రాలను పునరుద్ధరించే పద్ధతి. ఇది గుర్తింపు-నిర్దిష్ట లక్షణాలను నిలుపుకోవడం లక్ష్యంగా పెట్టుకుంది, పోర్ట్రెయిట్ ఫోటో మెరుగుదల కోసం సమర్థవంతమైన గుర్తింపు-అవగాహన పునరుద్ధరణకు మద్దతు ఇస్తుంది.
ఒకే వీడియోల నుండి డైనమిక్ కాన్సెప్ట్ల వ్యక్తిగతీకరణ
సెట్-అండ్-సీక్వెన్స్ అనేది వీడియో జనరేషన్ మోడల్ల కోసం ఒక కొత్త ఫ్రేమ్వర్క్, ఇది "డైనమిక్ కాన్సెప్ట్లు" ఉన్న వీడియోలను రూపొందించే సవాలును పరిష్కరిస్తుంది – సముద్రపు అలలు లేదా మినుకుమినుకుమనే మంట వంటి వాటి రూపాన్ని బట్టి మాత్రమే కాకుండా, కాలక్రమేణా వాటి ప్రత్యేకమైన చలన నమూనాల ద్వారా కూడా నిర్వచించబడిన ఎంటిటీలు. డైనమిక్ సబ్జెక్ట్లు కాలక్రమేణా ఎలా ప్రవర్తిస్తాయో నేర్చుకోవడం ద్వారా సెట్-అండ్-సీక్వెన్స్ వాస్తవిక వీడియో వ్యక్తిగతీకరణను అనుమతిస్తుంది, ఇది స్థిరమైన చలనం, దృశ్య కూర్పు మరియు క్రాస్-సీన్ బ్లెండింగ్ను అనుమతిస్తుంది.
డ్యూయెట్జెన్: హైరార్కికల్ మాస్క్డ్ మోడలింగ్ ద్వారా సంగీతంతో నడిచే ఇద్దరు వ్యక్తుల డ్యాన్స్ జనరేషన్
డ్యూయెట్జెన్ అనేది సంగీతం నుండి నేరుగా సింక్రొనైజ్ చేయబడిన ఇద్దరు వ్యక్తుల నృత్య కదలికలను రూపొందించడానికి ఒక ఫ్రేమ్వర్క్. ఇది డ్యాన్స్ భాగస్వాముల మధ్య సమన్వయ కదలిక మరియు భౌతిక పరస్పర చర్యల వంటి ఇంటరాక్టివ్ కొరియోగ్రఫీని మోడలింగ్ చేసే సవాలును పరిష్కరిస్తుంది. ఈ సిస్టమ్ యానిమేషన్, వర్చువల్ అవతార్లు మరియు డిజిటల్ ప్రదర్శనలలో అప్లికేషన్ల కోసం వాస్తవిక యుగళ నృత్య ఉత్పత్తిని అనుమతిస్తుంది.
నిర్ణయాత్మకంగా ఉండండి: బహుళ-విషయ ఉత్పత్తి కోసం నాయిస్-ప్రేరిత లేఅవుట్లు
మా పని 'బి డిసైసివ్' అనేది దృశ్యపరమైన తప్పులు లేదా అనుకోని మిశ్రమం లేకుండా సంక్లిష్ట చిత్రాలలో బహుళ విభిన్న విషయాలను ఖచ్చితంగా రూపొందించే సవాలును పరిష్కరిస్తుంది. 'బి డిసైసివ్' అనేది ఒక చిన్న న్యూరల్ నెట్వర్క్ను పరిచయం చేస్తుంది, ఇది డీనోయిజింగ్ సమయంలో నాయిస్-ప్రేరిత ప్రాదేశిక లేఅవుట్ను అంచనా వేస్తుంది మరియు మెరుగుపరుస్తుంది, ఇమేజ్ జనరేషన్ యొక్క ప్రారంభ దశల నుండి ప్రతి విషయం ఎక్కడ కనిపించాలో మార్గనిర్దేశం చేస్తుంది. ఇది బహుళ నిర్దిష్ట విషయాలతో అత్యంత వివరణాత్మక చిత్రాలను సృష్టించడానికి అనుమతిస్తుంది, వాటి మధ్య స్పష్టమైన సరిహద్దులు మరియు సహజ కూర్పులను నిర్ధారిస్తుంది.

KDD 2025-- టొరంటో, అంటారియో, కెనడా ఆగస్టు 3 నుండి ఆగస్టు 7 వరకు
GiGL: Snapchatలో భారీ-స్థాయి గ్రాఫ్ న్యూరల్ నెట్వర్క్లు
GiGL అనేది భారీ-స్థాయి గ్రాఫ్లపై గ్రాఫ్ న్యూరల్ నెట్వర్క్లను (GNNలు) శిక్షణ ఇవ్వడానికి మరియు అమలు చేయడానికి ఒక ఓపెన్-సోర్స్ లైబ్రరీ, ఇది వందల మిలియన్ల నోడ్లు మరియు బిలియన్ల అంచులకు మద్దతు ఇస్తుంది. వినియోగదారుల పెరుగుదల, కంటెంట్ ర్యాంకింగ్ మరియు ప్రకటనలతో సహా కీలకమైన మెషిన్ లెర్నింగ్ అప్లికేషన్లలో GIGL Snapలో ఉపయోగించబడుతుంది.
సహకార ఫిల్టరింగ్లో వెయిట్ డికే పాత్రపై: ఒక ప్రజాదరణ దృక్పథం
ఈ పేపర్ PRISM (ఎంబెడ్డింగ్ మాగ్నిట్యూడ్స్ కోసం పాపులారిటీ-అవేర్ ఇనిషియలైజేషన్ స్ట్రాటజీ)ని పరిచయం చేస్తుంది. PRISM సిఫార్సు మోడల్ శిక్షణలో ఒక సాధారణ కానీ ఖరీదైన టెక్నిక్ అయిన ఎంబెడ్డింగ్ వెయిట్ డికే వాడకాన్ని తొలగిస్తుంది, మరియు బదులుగా శిక్షణ ప్రారంభంలో ఒకే తేలికపాటి గణనతో దాన్ని భర్తీ చేస్తుంది. PRISM వేగవంతమైనది, వర్తింపజేయడం సులభం, ఇది మరింత సమర్థవంతమైన సిఫార్సు సిస్టమ్లకు దారితీస్తుంది.
క్రాస్-డొమైన్ సీక్వెన్షియల్ సిఫార్సు కోసం స్వీయ-శ్రద్ధను పునఃపరిశీలించడం
ఈ పని AutoCDSRను పరిచయం చేస్తుంది, ఇది శబ్దంతో కూడిన లేదా అసంబద్ధమైన సంకేతాలను తగ్గించేటప్పుడు సమర్థవంతమైన జ్ఞాన భాగస్వామ్యాన్ని ప్రోత్సహించడం ద్వారా, అటువంటి సిస్టమ్లు విభిన్న ఇంటరాక్షన్ డొమైన్లలో వినియోగదారు ప్రవర్తనలను ఎలా అంచనా వేస్తాయో మెరుగుపరచడానికి ఒక పద్ధతి. AutoCDSR సిఫార్సు సెట్టింగ్లలో వ్యక్తిగతీకరణ యొక్క ఖచ్చితత్వం మరియు పటిష్టతను మెరుగుపరుస్తుంది.

SnapGen: మొబైల్ పరికరాల కోసం అధిక-రిజల్యూషన్ టెక్స్ట్-టు-ఇమేజ్ మోడల్లను మచ్చిక చేసుకోవడం సమర్థవంతమైన ఆర్కిటెక్చర్లు మరియు శిక్షణతో మొబైల్ పరికరాల కోసం Snap AI T2I మోడల్
SnapGen అనేది మొబైల్ పరికరాల్లో నేరుగా పనిచేసేలా రూపొందించిన అధిక-పనితీరు గల టెక్స్ట్-టు-ఇమేజ్ పరిశోధన మోడల్, ఇది రెండు సెకన్ల కంటే తక్కువ సమయంలో అధిక-నాణ్యత చిత్రాలను రూపొందిస్తుంది. ఇది పరికరంలో ఇమేజ్ జనరేషన్ కోసం అవసరమైన కంప్యూట్ మరియు మెమరీని గణనీయంగా తగ్గించే సామర్థ్యాన్ని కలిగి ఉంది.
SnapGen-V: మొబైల్ పరికరంలో ఐదు సెకన్లలో ఐదు-సెకన్ల వీడియోను రూపొందించడం
SnapGen-V మా SnapGen మోడల్ను కేవలం ఐదు సెకన్లలో మొబైల్ పరికరాల్లో నేరుగా ఐదు-సెకన్ల వీడియోలను రూపొందించడానికి విస్తరిస్తుంది. ఇది టెక్స్ట్-టు-ఇమేజ్ మోడలింగ్లో మా పురోగతిపై ఆధారపడి, వేగవంతమైన, పరికరంలో వీడియో జనరేషన్ను అందుబాటులోకి తెస్తుంది.
4Real-Video: సాధారణీకరించదగిన ఫోటో-రియలిస్టిక్ 4D వీడియో డిఫ్యూజన్ను నేర్చుకోవడం
4Real-Video పరిశోధన మోడల్ బహుళ కోణాల నుండి చూడగలిగే, గొప్ప వివరాలు మరియు సహజ కదలికలతో వాస్తవిక 4D వీడియోలను రూపొందిస్తుంది. ఈ టెక్నాలజీకి లీనమయ్యే VR మరియు నెక్స్ట్-జెన్ కథన అనుభవాలలో సంభావ్య అప్లికేషన్లు ఉన్నాయి.
స్టేబుల్ ఫ్లో: శిక్షణ-రహిత ఇమేజ్ ఎడిటింగ్ కోసం కీలకమైన లేయర్లు
మా స్టేబుల్ ఫ్లో పరిశోధన మోడల్ సంక్లిష్టమైన శిక్షణ లేదా హై-ఎండ్ హార్డ్వేర్ అవసరం లేకుండా వస్తువులను జోడించడం లేదా తీసివేయడం వంటి శక్తివంతమైన ఇమేజ్ ఎడిటింగ్ను అనుమతిస్తుంది. ఈ విధానం ఎవరైనా సాంకేతిక నైపుణ్యం అవసరం లేకుండా సులభంగా ఫోటోలను ఎడిట్ చేయడానికి అనుమతిస్తుంది.
ఓమ్ని-ID: ఉత్పాదక పనుల కోసం రూపొందించిన సంపూర్ణ గుర్తింపు ప్రాతినిధ్యం
మా ఓమ్ని-ID పరిశోధన మోడల్ వివిధ కోణాలు మరియు వ్యక్తీకరణలలో ఒక వ్యక్తి ముఖం యొక్క సమగ్ర ప్రాతినిధ్యాన్ని నిర్మిస్తుంది, ఇది మరింత వాస్తవిక మరియు వ్యక్తిగతీకరించిన AI మరియు AR తరాలను అనుమతిస్తుంది.
PrEditor3D: వేగవంతమైన మరియు ఖచ్చితమైన 3D ఆకార సవరణ
PrEditor3D అనేది మా పరిశోధన బృందాలు అభివృద్ధి చేసిన ఒక సాధనం, ఇది కనీస ఇన్పుట్తో 3D మోడల్లను త్వరగా మరియు ఖచ్చితంగా సవరించడానికి అనుమతిస్తుంది, 3D ఆకారాలను ఎలా మార్చాలి మరియు సర్దుబాటు చేయాలో సరళీకృతం చేయడం ద్వారా 3D కంటెంట్ సృష్టి ప్రక్రియను క్రమబద్ధీకరిస్తుంది. అప్లికేషన్లో, PrEditor3D యానిమేటర్లు మరియు లెన్స్ సృష్టికర్తలు తమ దృష్టిని సమర్థవంతంగా జీవం పోయడాన్ని సులభతరం చేసే సామర్థ్యాన్ని కలిగి ఉంది, ఇది మరింత గొప్ప మరియు లీనమయ్యే AR అనుభవాలకు దారితీస్తుంది.
పద్ధతుల మొజాయిక్: మల్టీమోడల్ గ్రాఫ్ లెర్నింగ్ కోసం ఒక సమగ్ర బెంచ్మార్క్
MM-గ్రాఫ్ మల్టీ-మోడల్ గ్రాఫ్ లెర్నింగ్ కోసం మొదటి బెంచ్మార్క్ను పరిచయం చేస్తుంది, ప్రస్తుత బెంచ్మార్క్లలో దృశ్య సమాచారం యొక్క ముఖ్యమైన అంతరాన్ని పరిష్కరించడానికి దృశ్య మరియు పాఠ్య డేటా రెండింటినీ పొందుపరుస్తుంది. ఇది మరింత సమగ్రమైన మోడల్ మూల్యాంకనాన్ని అనుమతిస్తుంది మరియు వాస్తవ-ప్రపంచ ఇన్పుట్లను అర్థం చేసుకోగల గ్రాఫ్ లెర్నింగ్ సిస్టమ్లలో ఆవిష్కరణను నడిపిస్తుంది.
టెక్స్ట్ ప్రాంప్ట్ మరియు రిఫరెన్స్ చిత్రాల సెట్తో, వీడియో ఆల్కెమిస్ట్ విస్తృతమైన ట్యూనింగ్ లేదా ఆప్టిమైజేషన్ లేకుండా వీడియోలను రూపొందించగల సామర్థ్యాన్ని అనుమతిస్తుంది. అప్లికేషన్లో ఇది కస్టమ్ రూపాలు మరియు నేపథ్యాలతో వీడియో వ్యక్తిగతీకరణను క్రమబద్ధీకరిస్తుంది, సృజనాత్మకతను పెంచుతూ సమయాన్ని ఆదా చేస్తుంది.
సమయాన్ని గమనించండి: తాత్కాలికంగా-నియంత్రిత బహుళ-ఈవెంట్ వీడియో జనరేషన్
మైండ్ ది టైమ్ AI- రూపొందించిన వీడియోలలోకి ఖచ్చితమైన తాత్కాలిక నియంత్రణను పరిచయం చేస్తుంది. ఇది సృష్టికర్తలు సంఘటనల క్రమాన్ని మరియు సమయాన్ని నిర్దేశించడానికి అనుమతిస్తుంది. ఇది వీడియో జనరేషన్లో మరింత నిర్మాణాత్మక, పొందికైన కథనాన్ని అనుమతిస్తుంది.
డిఫ్యూజన్ ట్రాన్స్ఫార్మర్లతో వీడియో మోషన్ ట్రాన్స్ఫర్
వీడియో మోషన్ ట్రాన్స్ఫర్ అనేది డిఫ్యూజన్ రీసెర్చ్ మోడల్ని ఉపయోగించి ఒక వీడియో నుండి మరొక వీడియోకి వాస్తవిక కదలికను బదిలీ చేసే పద్ధతి. అప్లికేషన్లో ఈ మోడల్ సంక్లిష్టమైన సెటప్లు అవసరం లేకుండా, రిఫరెన్స్ వీడియోల నుండి కదలికను బదిలీ చేయడం ద్వారా వాస్తవిక కదలికతో వీడియోలను సులభంగా సృష్టించగలదు.
వండర్ల్యాండ్: ఒకే చిత్రం నుండి 3D దృశ్యాలను నావిగేట్ చేయడం
వండర్ల్యాండ్ కేవలం ఒక ఫోటో నుండి వివరణాత్మక 3D దృశ్యాలను సృష్టిస్తుంది, 3D దృశ్యాల సృష్టిని సులభతరం చేస్తుంది మరియు బహుళ కోణాలు లేదా విస్తృతమైన వనరులు అవసరం లేకుండా వేగవంతమైన మరియు మరింత సమర్థవంతమైన డిజైన్ను అనుమతిస్తుంది.
AC3D: వీడియో డిఫ్యూజన్ ట్రాన్స్ఫార్మర్లలో 3D కెమెరా నియంత్రణను విశ్లేషించడం మరియు మెరుగుపరచడం
AC3D వీడియో జనరేషన్ మోడల్లలో కెమెరా నియంత్రణను మెరుగుపరుస్తుంది, సున్నితమైన, మరింత వాస్తవిక కదలికను అనుమతిస్తుంది. ఇది సృష్టికర్తలకు వీడియోలలో కెమెరా కదలికలపై మరింత సౌలభ్యాన్ని ఇస్తుంది మరియు రూపొందించిన దృశ్యాల నాణ్యత మరియు వాస్తవికతను మెరుగుపరుస్తుంది.
*ఇక్కడ వివరించిన అన్ని నమూనాలు మరియు పని పరిశోధన ప్రయోజనాల కోసం మాత్రమే.
ఈ పోస్ట్ అప్డేట్ చేయబడుతూనే ఉంటుంది.
సంప్రదించండి
ప్రెస్ అభ్యర్థనల కోసం, ఇమెయిల్press@snap.com.
అన్ని ఇతర విచారణల కోసం, దయచేసి మా మద్దతు సైట్నిసందర్శించండి.