Foto: Unsplash

OpenAI plánuje shromažďovat data třetích stran pro trénink AI

Společnost OpenAI zavádí nový partnerský program s cílem shromažďovat soubory dat od třetích stran, které má v plánu využít k trénování modelů umělé inteligence. Iniciativa nazvaná OpenAI Data Partnerships bude vyhledávat obsáhlé soukromé a veřejné informace, které podle ní ještě nejsou veřejnosti snadno dostupné online. Společnost uvádí, že data, která bude shromažďovat, nemusí být nutně kvantitativní nebo v textových formátech, program se zaměří také na obrázky, zvuky nebo videa.

Společnost uvedla, že potřebuje informace o jakémkoli tématu, v libovolném jazyce, nicméně měly by vyjadřovat „lidský záměr“, což přirovnává k dlouhým esejům nebo přepisům rozhovorů. Očekává se, že tyto údaje shromážděné společností OpenAI pomohou společnosti vylepšit nástroje, jako je technologie automatického rozpoznávání řeči, která se používá k přepisu mluvených slov. Tato iniciativa je také v souladu s nedávným rozšířením ChatGPT o podporu hlasových dotazů, které umožňují navázat konverzaci s uživateli.

Pokud se soukromá nebo veřejná organizace chce programu zúčastnit, může její zástupce odeslat formulář na webových stránkách společnosti a sdílet informace o typu a objemu dat, která hodlá sdílet.

ChatGPT již zaznamenal rekordy v prudce rostoucí uživatelské základně. Po celém světě má přibližně 100 milionů aktivních uživatelů týdně, což znamená, že ochrana soukromí bude pro tento nástroj i nadále středem zájmu. Již dříve se zaměstnanci společnosti Samsung dostali do nepříjemné situace kvůli úniku citlivých údajů do modelu umělé inteligence.

Zdroj: engadget.com