OpenAI își extinde accesul la date. A transcris peste un milion de ore de videoclipuri de pe YouTube pentru a antrena GPT-4

Atât Google, cât și OpenAI și-au antrenat modelele lingvistice folosindu-se de filmările de pe YouTube, fără înștiințarea expresă a creatorilor de conținut.

OpenAI ar fi folosit două instrumente de A.I. pentru a procesa conținutul filmărilor de pe YouTube. Primul pas pentru dezvoltatorul ChatGPT a fost să folosească modelul audio Whisper pentru a transcrie filmările de pe platforma video deținută de Google – peste un milion de ore de conținut au fost procesate astfel.

Google spune că nu are confirmarea acțiunilor OpenAI, dar sursele citate de The New York Times susțin că gigantul american știa, dar nu a luat nicio măsură împotrivă. Google, la rândul ei, și-a antrenat A.I.-ul folosind filmările YouTube, după ce și-a actualizat politica în iunie 2023 pentru a-și permite singur acest lucru. Informația iese la iveală la câteva zile după ce YouTube a spus că procesarea filmărilor sale de OpenAI ar contraveni regulilor platformei, dar că Google poate face acest lucru.

Citește și

Exit mobile version