Foto: stability.ai

Stable Diffusion 3 bude údajně schopný generovat obrázky s textem

Stability AI, startup stojící za nástrojem Stable Diffusion, který využívá generativní umělou inteligenci k vytváření obrázků z textu, ve čtvrtek odhalil novou generaci softwaru – model Stable Diffusion 3. Stability AI tvrdí, že nový model, který zatím není dostupný pro veřejnost, bude mít oproti starší generaci hned několik vylepšení. V první řadě bude vytvářet mnohem kvalitnější obrázky, poté bude schopný lépe porozumět textovému zadání od uživatele a údajně prý bude umět generovat a vkládat text do obrázků. To předchozí modely Stable Diffusion neuměly.

Generální ředitel společnosti Stability AI Emad Mosque zveřejnil na X několik ukázek z nového modelu:

Oznámení přichází několik dní poté, co největší konkurent Stability AI, společnost OpenAI, představila Soru, zcela nový model umělé inteligence schopný generovat téměř realistická videa ve vysokém rozlišení na základě jednoduchých textových podnětů. Sora, která také zatím není k dispozici pro širokou veřejnost, vyvolala obavy, a to kvůli své schopnosti vytvářet realisticky vypadající deepfake videa.

Společnost OpenAI uvedla, že spolupracuje s odborníky na dezinformace, aby nástroj otestovala, než jej zpřístupní široké veřejnosti. Stability AI uvedla, že postupuje stejně. “[Podnikli jsme] a nadále podnikáme přiměřené kroky, abychom zabránili zneužití nástroje Stable Diffusion 3, napsala společnost v příspěvku na blogu na svých webových stránkách. “Díky spolupráci s výzkumníky, odborníky a naší komunitou očekáváme, že s blížícím se veřejným vydáním modelu budeme dále Stable Diffiusion inovovat.”

Není jasné, kdy bude Stable Diffusion 3 uvolněn pro veřejnost, ale do té doby se ale mohou zájemci zapsat na čekací listinu.

Zdroj: www.engadget.com