Foto: se svolením Google

Google představil systém umělé inteligence, který umí velmi realisticky převádět text na obraz

Společnost Google se pochlubila novým systémem umělé inteligence Imagen, který dokáže vytvářet obrázky na základě zadaného textu. Podstata spočívá v tom, že uživatelé mohou zadat libovolný popisný text a umělá inteligence jej promění v obrázek. Společnost uvádí, že tento systém (vytvořený týmem Brain ve společnosti Google Research) nabízí „vysoký stupeň fotorealismu a hlubokou schopnost porozumění jazyku“.

Ačkoli to není poprvé, co se s podobnými modely umělé inteligence setkáváme (existují také DALL-E od OpenAI, VQ-GAN+CLIP či Latent Diffusion Models), Imagen společnosti Google se snaží vytvářet realističtější obrázky. Aby mohli výzkumníci posoudit Imagen v porovnání s ostatními modely pro převod textu na obraz, vytvořili benchmark nazvaný DrawBench, jenž zahrnuje 200 textových částí, které byly zadány do každého modelu. K posouzení každého obrázku byli přizváni také lidští hodnotitelé. Ti oproti ostatním podobným systémům upřednostnili Imagen, a to jak z hlediska kvality vzorků, tak z hlediska sladění obrázku a textu.

Stojí však za zmínku, že příklady zobrazené na webových stránkách Imagenu jsou kurátorské. Jako takové tedy mohou být nejlepšími z nejlepších obrázků, které model vytvořil. Nemusí přesně odrážet většinu vizualizací, které vygeneroval.

Stejně jako DALL-E, ani Imagen není přístupný veřejnosti. Společnost Google si myslí, že zatím není vhodný pro takové použití, a to například proto, že modely pro převod textu na obrázek využívají velkých souborů dat, které jsou převzaty z webu a mohou obsahovat řadu problematických témat (např. rasismus, pornografii apod.). Imagen tak může vytvářet obrázky, které odrážejí i nejrůznější stereotypy, předsudky a nežádoucí postoje. Výzkumníci navíc upozorňují, že existuje možnost zneužití, pokud by byl Imagen zpřístupněn veřejnosti ve stávající podobě.

Imagen si však můžete v omezené míře vyzkoušet. Na webových stránkách si také můžete prohlédnout nejlepší výsledky, kterých Imagen dosáhl.

Zdroj: engadget.com