Zuckerberg plănuiește să folosească miliardele de date de la utilizatorii Facebook și Instagram pentru a dezvolta un nou model „puternic” de Inteligență Artificială

De Sandu Maria | Aleph (12.02.2024) 5.883

CEO-ul Meta vrea să folosească miliardele de date de la utilizatorii Facebook și Instagram pentru a dezvolta un nou model „puternic” de Inteligență Artificială.
În același fel în care OpenAI „și-a dat foc la valiză” prin utilizarea datelor de la artiști și scriitori pentru a-și antrena modelele de A.I., Facebook riscă o lovitură de reputație pentru exploatarea datelor utilizatorilor din întreaga lume.
Orice text care reprezintă dialog uman este crucială pentru antrenarea chatboților, motiv pentru care Zuckerberg se bazează pe secțiunea de comentarii.

Pentru mulți oameni, Facebook reprezintă nucleul internetului, iar numărul său de utilizatori este în creștere, potrivit ultimelor rapoarte financiare de la Meta Platforms Inc.

Mark Zuckerberg nu sărbătorește doar această creștere, scrie Bloomberg. Zuckerberg vrea să profite de datele utilizatorilor pe care le-a strâns în Facebook și Instagram pentru a crea o inteligență artificială puternică și „generală”. Deși sună bine, iar Meta are toate resursele pentru a face asta, miliardele sale de utilizatori ar putea plăti cu propria siguranță și confidențialitate.

Anunțul lui Zuckerberg

„Următoarea mișcare cheie este să învățăm din datele unice și din feedback-ul din produsele noastre…Pe Facebook și Instagram, există sute de miliarde de poze distribuite și zeci de miliarde de videoclipuri publice, despre care estimăm că sunt mai mari decât bazele de date din „Common Crawl”. De asemenea, oamenii distribuie cantități uriașe de texte scrise în secțiunea de comentarii pe platformele noastre”.

Comentariul lui Zuckerberg privind baza de date din „Common Crawl” i-a surprins pe „observatorii” din presa tech, pentru că arhiva menționată este deja uriașă, cu 250 de miliarde de pagini web, însumând 17 ani. Este una dintre cele mai mari și cele mai populare depozite de internet folosite pentru antrenarea sistemelor A.I. în prezent. Când OpenAI a lansat modelul GPT-3 în 2020, aproape 60% din textul folosit pentru antrenarea sistemului a provenit din Common Crawl.

Însă datele Meta sunt și mai mari, ceea ce înseamnă că ar putea un construi un A.I. și mai „smart” – studiile arată că antrenarea modelelor A.I. pe mai multe date tinde să le facă și mai capabile și exacte. Această formula a funcționat miraculous pentru OpenAI, care, de-a lungul timpului, a mărit cantitatea de date folosite pentru a crea modele precum ChatGPT.

Dacă Zuckerberg își dorește să creeze un chatbot și mai puternic, cantitatea de date de care dispune este în mod special prețioasă, pentru că mare parte din ea provine din secțiunea de comentarii. Orice text care reprezintă dialog uman este crucială pentru antrenarea așa-zișilor agenți conversaționali, motiv pentru care OpenAI s-a orientat către forumul Reddit pentru a-și construi faimosul chatbot.

E ușor să-ți dai seama când Zuckerberg are o nouă ambiție – fie că e vorba de roboți, crypto sau metaverse. Cea mai nouă ambiție a CEO-ului pare „măreață” – să construiască „o inteligență artificială generală”, sau sisteme de software care egalează sau depășesc inteligența umană. Cu toate datele de care dispune, obiectivul lui Zuckerberg pare realizabil. Singura problemă este ce impact ar putea avea asupra noastră, restul lumii.

Ciudat este, scrie Bloomberg, că în același mesaj în care Zuckerberg a spus că echipa sa lucrează la acest model A.I. „de mai bine de un deceniu”, abia acum vor folosi datele utilizatorilor ca „următoarea mișcare cheie”.

Bloomberg ridică întrebarea : „De ce nu a făcut-o Meta până acum?” Poate pentru că utilizarea datelor nu este atât de directă. Ar reprezenta încă o încălcare a confidențialității celor 3 miliarde de utilizatori ai Facebook și 1,5 miliarde de utilizatori ai Instagram. În același fel în care OpenAI „și-a dat foc la valiză” prin utilizarea datelor de la artiști și scriitori pentru a-și antrena modelele de A.I., Facebook riscă o lovitură de reputație pentru exploatarea datelor utilizatorilor din întreaga lume. Nu doar că asta ar ridica întrebări etice, dar ar necesita și practici stricte de manipulare a datelor și respectarea legilor globale de protecție a datelor, intrând totodată în vizorul autorităților europene de reglementare.

O altă problemă este „părtinirea” și „toxicitatea” datelor. OpenAI s-a confruntat cu această problemă în utilizarea arhivei „Common Crawl”, al cărei depozit vast includea pagini web pornografice precum adultmovietop100.com și adelaide-femaleescorts.webcam, conform unui studiu din 2021 al Universității din Montreal. Același studiu spune că între 4% și 6% din toate site-urile web din Common Crawl au inclus insulte rasiale, discurs instigator la ură sau teorii ale conspirației cu acuzații rasiale.

În timp ce software-ul Facebook pentru moderarea conținutului a devenit mai bun la blocarea discursului instigator la ură și conspirațiilor, nu este perfect, și tinde să fie chiar mai rău în țări din afară SUA. Anumite postări de pe Facebook sunt raportate ca fiind „toxice”, însă nu mai sunt revizuite de oameni și sunt lăsate pe platformă.

Când Zuckerberg a declarat că datele Meta sunt mai mari decât cele de la „Common Crawl”, s-a referit probabil la arhiva istorică a companiei, care include și conținut politic exagerat și știri false care au fost lăsate pe platformă înainte ca Zuckerberg să facă „curat” prin ele.

Toată munca care trebuie depusă pentru manipularea și verificarea atentă a datelor ar putea explica de ce Zuckerberg a vorbit abia acum despre „valorificarea muntelui de date” de care dispune. Dacă nu o face corect, riscă să retrăiască coșmarul criticilor publice despre modul în care Facebook a gestionat știrile false și conținutul dăunător.

Totuși, dacă se știe ceva concret despre Zuckerberg, este că are o obsesie de „Cezar” pentru succes și dominație.

După ce a fost audiat 24 de ore în Washington, D.C, în fața unor părinți care l-au acuzat că i-a determinat pe copiii lor să-și facă rău sau să se sinucidă, Zuckerberg a anunțat unul dintre cele mai de succes trimestre din istoria Meta, continuând cu vestea că va folosi datele oamenilor pentru a dezvolta un model de A.I. extrem de puternic.

Actualitatea acestor evenimente, concluzionează Bloomberg, ar trebui să ne reamintească tuturor că drumul Facebook spre îmbogățire i-a rănit pe mulți – la fel cum ar putea face și dezvoltarea unui nou model de A.I. puternic.

Citește și

Organe umane imprimate 3D. Metoda ar putea rezolva criza transplantului de organe
Pas major în cercetare. Un test de sânge ar putea prezice riscul de demență cu mai mult de un deceniu înainte ca afecțiunea să fie diagnosticată
A.I., antrenată să gândească ca Einstein. Învățarea automată ar putea revoluționeze știința

Etichete: facebook, instagram, inteligenta artificiala, meta, zuckerberg