Foto: Unsplash

Google může nově používat veřejně dostupná data k trénování svých AI modelů

Společnost Google aktualizovala své zásady ochrany osobních údajů a uvedla, že může používat veřejně dostupná data, která jí pomáhají trénovat modely umělé inteligence. Technologický gigant o víkendu změnil znění svých zásad a zaměnil „modely umělé inteligence“ za „jazykové modely“. Uvedl také, že může veřejně dostupné informace používat nejen k vytváření funkcí, ale i plnohodnotných produktů, jako jsou Překladač Google, Bard a funkce Cloud AI. Aktualizací svých zásad dává uživatelům najevo, že cokoli, co zveřejní online, může být použito k tréninku Barda, jeho budoucích verzí a jakéhokoli dalšího generativního AI produktu, který Google vyvíjí.

Google není jedinou velkou společností, která využívá informace zveřejněné online k trénování svých jazykových modelů pro projekty generativní umělé inteligence. Nedávno byla podána hromadná žaloba proti společnosti OpenAI, která ji obviňuje z toho, že bez předchozího souhlasu shromažďuje obrovské množství osobních údajů z internetu (včetně soukromých informací) k trénování svých modelů GPT. Jak poznamenává Search Engine Journal, v budoucnu se pravděpodobně dočkáme mnoha podobných žalob, protože stále více společností vyvíjí vlastní produkty generativní umělé inteligence a potřebuje data, na nichž je bude trénovat.

Někteří majitelé velkých platforem již podnikli kroky, aby boomu generativní AI buď zabránili, nebo z něj profitovali. Reddit začal zpoplatňovat přístup ke svému API, což vedlo k tomu, že klienti třetích stran o víkendu ukončili svou činnost. A například Twitter zavedl omezení počtu tweetů, které uživatel za den uvidí (podle vyjádření Elona Muska právě kvůli omezení sběru dat třetími stranami).

Zdroj: engadget.com