Foto: se svolením DeepMind

Genie 2 společnosti Google DeepMind dokáže vytvářet interaktivní 3D světy

Modely umělé inteligence schopné generovat simulované prostředí v reálném čase jsou jednou z nejpůsobivějších aplikací strojového učení. V posledním roce došlo v této oblasti k velkému posunu a v této souvislosti společnost Google DeepMind ve oznámila nový AI model Genie 2. Tam, kde se jeho předchůdce omezoval na generování 2D světů, dokáže nový model vytvářet 3D světy.

Genie 2 není herní engine, ale jde o difuzní model, který generuje obrazy, jak se hráč (buď člověk, nebo agent umělé inteligence) pohybuje světem, který software simuluje. Při generování snímků může Genie 2 odvozovat další obrazy o prostředí, což mu dává možnost modelovat vodu, kouř či jiné fyzikální efekty. Model se také neomezuje pouze na vykreslování scén z pohledu třetí osoby, ale zvládá i pohled z první osoby a izometrický pohled. Vše, co potřebuje ke své práci, je jediná obrazová výzva, kterou poskytne buď vlastní model Imagen 3 společnosti Google, nebo obrázek něčeho z reálného světa.

Genie 2 si navíc dokáže zapamatovat části simulované scény i poté, co opustí hráčovo zorné pole, a dokáže tyto prvky přesně rekonstruovat, jakmile se stanou opět viditelnými. Jde o jedinečnou schopnost, která chybí jiným AI modelům, jako je například Oasis, který měl problémy zapamatovat si rozložení úrovní Minecraftu, které generoval v reálném čase.

Existují ale i omezení, co všechno Genie 2 dokáže. DeepMind tvrdí, že model zvládne generovat konzistentní světy po dobu až 60 sekund, ale většina příkladů, které společnost sdílela, trvají podstatně kratší dobu (asi 10 až 20 sekund). Navíc se objevují podivné artefakty a kvalita obrazu se zhoršuje, čím déle musí Genie 2 udržovat iluzi konzistentního světa.

Společnost DeepMind neuvedla žádné podrobnosti o tom, jak Genie 2 trénovala, kromě toho, že se opírala o velké množství videodat. Nelze také očekávat, že by společnost DeepMind v dohledné době uvolnila Genie 2 pro veřejnost. Společnost zatím model vidí především jako nástroj pro trénování a vyhodnocování dalších agentů umělé inteligence, včetně vlastního algoritmu SIMA, a jako něco, co by umělci a designéři mohli používat k rychlému prototypování a realizaci svých nápadů.

Zdroj: engadget.com