Společnost NVIDIA údajně bez povolení trénovala své AI modely na videích z YouTube a Netflixu
Velmi nepříjemnému obvinění nyní čelí společnost NVIDIA. Ta zřejmě pro účely tréninku umělé inteligence využívala spoustu obsahu chráněného autorskými právy. V pondělí prý společnost s majetkem 2,4 bilionu dolarů požádala své pracovníky, aby stáhli videa z YouTube, Netflixu a dalších datových souborů za účelem vývoje komerčních projektů AI. Tento výrobce grafických karet si již dříve vysloužil pověst společnosti, která udělá vše pro to, aby si zajistila dominantní postavení na trhu v oblasti umělé inteligence.
Výcvik se údajně týkal vývoje modelů pro produkty, jako je generátor 3D světa Omniverse, systémy pro samořiditelná auta a snahy o vytvoření digitálního člověka.
NVIDIA se nicméně snažila svůj postup obhájit a tvrdí, že neudělala nic, co by bylo v rozporu a autorskými právy. Nicméně YouTube s tím nesouhlasí. Mluvčí Jack Malon odkázal na dubnový článek agentury Bloomberg, v němž generální ředitel Neal Mohan uvedl, že použití YouTube k trénování modelů umělé inteligence by bylo jasným porušením jejích podmínek.
Kromě videí z YouTube a Netflixu NVIDIA údajně instruovala pracovníky, aby model trénovali na databázi filmových trailerů MovieNet, interních knihovnách záběrů z videoher a souborech videodat z Githubu WebVid a InternVid-10M. Druhá jmenovaná je datová sada obsahující 10 milionů ID videí na YouTube.
Některá data, na kterých společnost NVIDIA údajně trénovala, byla označena jako vhodná pouze pro akademické (nebo jiné nekomerční) použití. HD-VG-130M, knihovna 130 milionů videí z YouTube, obsahuje licenci k použití, která uvádí, že je určena pouze pro akademický výzkum. Společnost NVIDIA však tato nařčení údajně smetla ze stolu a vyjádřila se tak, že tento obsah je vhodný pro její komerční produkty umělé inteligence.
Zdroj: engadget.com