OpenAI i Google fan servir milions de vídeos de YouTube amb drets per entrenar la IA
OpenAI, l'empresa creadora de ChatGPT i de Sora, hauria transcrit milions d'hores de vídeos de YouTube per entrenar els seus models d'intel·ligència artificial (IA).
Ho ha avançat en exclusiva The New York Times, que explica que, fins i tot, va crear expressament un programa, anomenat Whisper, amb aquesta finalitat.
El diari emmarca aquest moviment d'OpenAI en la cursa frenètica de les grans tecnològiques per desenvolupar sistemes millors d'IA abans que la competència. I també en la situació que qualifica de "problema de subministrament", a la qual s'ha arribat després d'haver esgotat "totes les reserves fiables" de textos en anglès disponibles a internet.
Parla d'una "caça desesperada" de noves dades digitals, necessàries per aconseguir programes de més qualitat, que escriguin millor o generin imatges més bones.
I per obtenir aquestes dades, el Times assegura que ha pogut comprovar que "empreses tecnològiques com OpenAI, Google i Meta han agafat dreceres, ignorat polítiques corporatives i debatut sobre com saltar-se la llei".
Afegeix que té constància de converses entre treballadors d'OpenAI sobre com transcriure vídeos de YouTube podria anar contra les normes d'aquesta plataforma, que prohibeixen utilitzar els vídeos per a altres aplicacions.
El diari nord-americà recull testimonis que asseguren que Greg Brockman, president d'OpenAI, va formar part de l'equip de transcripció i que va intervenir personalment en la tria de vídeos.
Google contra YouTube, de la qual és propietària
Un cas més paradoxal és el de Google que, segons el Times, també ha transcrit vídeos de YouTube per entrenar Gemini, el seu model d'IA. Amb una diferència: és la propietària de la plataforma, cosa que no li ha impedit dur a terme una pràctica que violaria el copyright dels creadors que hi han confiat i pujat vídeos.
Google, a més, ha modificat els seus termes de servei, en part, almenys, per poder utilitzar continguts penjats per usuaris, assegura el Times, que ha tingut accés a un document intern.
El debat sobre els drets d'autor dels continguts utilitzats per entrenar o enriquir els models d'IA no és nou. El mateix Times té en marxa una demanda contra OpenAI i Microsoft per violació de drets d'autor. Acusa l'empresa d'IA i el seu principal inversor d'utilitzar milions de textos del diari per millorar el seu model.
YouTube parla de "clara violació"
Precisament, en una entrevista recent en el portal d'informació econòmica i tecnològica Bloomberg, el director executiu de YouTube, Neal Mohan, remarcava que "descarregar les transcripcions o parts dels vídeos" pujats a la plataforma "és una violació clara dels nostres termes d'ús".
Mohan, que es refereix sobretot a l'ús de vídeos de YouTube per entrenar Sora, el programa de generació de vídeos d'OpenAI, admet que no té informació confirmada que l'empresa dirigida per Sam Altman hagi utilitzat continguts de la plataforma.
Preguntat per l'ús dels vídeos de YouTube per part de Google, Mohan ha assegurat que aquesta pràctica es fa respectant els contractes individuals de la plataforma amb els creadors que hi pengen vídeos, contractes en els quals s'especifica si es permet o no l'ús d'aquell contingut per entrenar IA.
Meta, entre enfrontar-se a demandes i comprar una gran editorial
Meta, propietària de Facebook i Instagram, també ha considerat la possibilitat d'utilitzar material amb drets d'autor, segons el Times, encara que això li suposi enfrontar-se a demandes, en considerar que es trigaria massa temps a negociar les llicències corresponents.
Documents interns obtinguts pel Times també mostren que directius, advocats i enginyers de Meta també han debatut sobre la possibilitat de comprar l'editorial Simon & Schuster, una de les més grans dels Estats Units, per poder accedir als seus fons.
- ARXIVAT A:
- Tecnologia Xarxes socials Intel·ligència artificial