https://images.unsplash.com/photo-1621768216002-5ac171876625?q=80&w=2074&auto=format&fit=crop&ixlib=rb-4.0.3&ixid=M3wxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHx8fA%3D%3D

Apple vydal vlastní AI model, který umí upravovat obrázky na základě textových příkazů

Pátek 09. 02. 2024

Samuel

Ačkoli Apple prozatím nepatří mezi špičkové hráče na poli umělé inteligence, nový open source model umělé inteligence pro úpravu obrázků ukazuje, čím je společnost schopna do této oblasti přispět. Model nazvaný MLLM-Guided Image Editing (MGIE) využívá multimodální velké jazykové modely (MLLM) k interpretaci textových příkazů při manipulaci s obrázky. Jinými slovy, nástroj má schopnost upravovat fotografie na základě textových příkazů, které uživatel zadá.

Společnost vyvinula MGIE společně s výzkumníky z Kalifornské univerzity v Santa Barbaře. MLLM mají schopnost transformovat jednoduché nebo nejednoznačné textové pokyny do podrobnějších a jasnějších instrukcí, kterými se může řídit samotný editor fotografií. Například pokud chce uživatel upravit fotografii feferonkové pizzy, aby vypadala zdravěji, MLLM to může interpretovat jako „přidat zeleninovou ozdobu“ a fotografii takto upravit.

Kromě provádění zásadních změn na obrázcích může MGIE také fotografie ořezávat, měnit jejich velikost a otáčet je, stejně jako zvyšovat jejich jas, kontrast a vyvážení barev, a to vše prostřednictvím textových pokynů. Umí také upravovat konkrétní oblasti fotografie a může například upravit vlasy, oči a oblečení osoby na ní nebo odstranit prvky v pozadí.

Apple model uvolnil prostřednictvím GitHubu, ale zájemci si mohou vyzkoušet také demo verzi, která je v současné době umístěna na webu Hugging Face Spaces. Společnost Apple bohužel zatím neuvedla, zda něco z tohoto projetu začlení do některého ze svých produktů.

Zdroj: engadget.com