Universitatea Stanford și Meta construiesc un AI capabil de interacțiuni fizice. Cum va funcționa sistemul


Universitatea Stanford și Meta construiesc un sistem de Inteligență Artificială capabil să aibă interacțiuni fizice. Acest AI poate genera mișcări naturale și conectează oamenii cu obiectele virtuale.

Noul sistem, numit CHOIS (Controlable Human-Object Interaction Synthesis), folosește cele mai recente tehnici de model de difuzie condiționată pentru a produce interacțiuni perfecte și precise, cum ar fi „ridicați masa deasupra capului, mergeți și lăsați masa jos”.

Lucrarea, publicată într-o lucrare despre arXiv, oferă o privire asupra unui viitor în care ființele virtuale pot înțelege și răspunde la comenzile limbajului la fel de fluid ca oamenii. Cercetătorii de la Standford și Meta trebuiau să se asigure că mișcările generate sunt realiste și sincronizate, menținând un contact adecvat între mâinile umane și obiecte, iar mișcarea obiectului avea o relație cauzală cu acțiunile umane. Este un pas semnificativ înainte în crearea AI care poate înțelege și interacționa cu lumea fizică într-o manieră asemănătoare omului.

Cum va funcționa sistemul

Sistemul CHOIS se remarcă prin abordarea sa unică de a sintetiza interacțiunile om-obiect într-un mediu 3D. În esență, CHOIS utilizează un model de difuzie condiționată, care este un tip de model generativ care poate simula secvențe detaliate de mișcare. Când i se oferă o stare inițială a pozițiilor umane și a obiectelor, împreună cu o descriere în limbaj a sarcinii dorite, CHOIS generează o secvență de mișcări care culminează cu finalizarea sarcinii. De exemplu, dacă instrucțiunea este de a muta o lampă mai aproape de o canapea, CHOIS înțelege această directivă și creează o animație realistă a unui avatar uman care ridică lampa și o plasează lângă canapea.


În domeniile AI și robotică, CHOIS reprezintă un pas uriaș către sisteme mai autonome și mai conștiente de context. Roboții, adesea limitați de rutine preprogramate, ar putea folosi un sistem precum CHOIS pentru a înțelege mai bine lumea reală și pentru a executa sarcini descrise în limbajul uman. Acest lucru ar putea fi deosebit de transformator pentru roboții de servicii din domeniul sănătății, ospitalității sau medii domestice, unde capacitatea de a înțelege și de a îndeplini o gamă largă de sarcini într-un spațiu fizic este crucială.

Citește și

Exit mobile version