Vylepšené generování obrázků v ChatGPT přitahuje pozornost i kritiku

Zahraničí

Vylepšené generování obrázků v ChatGPT přitahuje pozornost i kritiku
Aplikace ChatGPT. Foto: Jan Vlach
GALERIE collections

Brno - OpenAI představila novou verzi modelu ChatGPT, která výrazně vylepšuje generování obrázků. Realističtější výstupy přitáhly pozornost veřejnosti i odborníků, kteří upozorňují na možné dopady na kreativní profese.

Společnost OpenAI spustila novou funkci svého jazykového modelu ChatGPT. Ten nově zvládá nejen odpovídat na otázky nebo psát texty, ale také generovat obrázky. Krátce po zveřejnění se tato možnost stala jedním z nejpoužívanějších prvků celé platformy. Uživatelé si nechávají vytvářet vizuály podle vlastních představ a zájem o novinku byl natolik velký, že došlo k přetížení serverů společnosti.

„Je super vidět, že si lidé obrázky v ChatGPT tak oblíbili, ale naše GPU se taví,“ uvedl generální ředitel OpenAI Sam Altman na sociální síti X. Kvůli vysoké zátěži firma dočasně omezila generování obrázků, aby systém mohla technicky posílit.

Nový nástroj, označovaný jako 4o Image Generation, funguje na základě textového zadání. Uživatel může popsat, co si přeje – například prostředí, styl obrázku nebo konkrétní postavy – a model podle toho vygeneruje vizuální výstup. Výsledky se pohybují od fotorealistických scén až po stylizované ilustrace, například v podobě kreslených postaviček nebo takzvaného anime. Mezi oblíbenými styly se rychle objevily i výstupy připomínající tvorbu studia Ghibli, což otevřelo diskusi o autorských právech a inspiraci.

Obrázky lze navíc dále upravovat nebo měnit. Uživatel si může nechat vytvořit různé varianty jednoho návrhu, doplnit části obrázku, nebo vložit vlastní předlohu, kterou model upraví podle zadání. Podle OpenAI je model navržen tak, aby se zabránilo zneužití, například ke generování vizuálů reálných osob nebo nevhodného obsahu.

Karl Marx s nákupními taškami vygenerovaný umělou inteligencí.
Karl Marx s nákupními taškami vygenerovaný umělou inteligencí. Foto: OpenAI

Novinku sledují i odborníci z praxe. Brand stratég Adam Slaběňák z agentury X Production popisuje jednu z možností využití takto: „Nová verze ChatGPT-4o přidává ke generování obrazových výstupů možnosti pracovat s vlastním produktem. AI zachová produkt samotný, ale vygeneruje vše ostatní podle našich představ.“ Upozorňuje ale také na to, že tímto způsobem značky ztrácejí čas na přemýšlení o účelu a kvalitě svého sdělení. „Rychlost, se kterou nyní dokážou značky generovat obsah, je jako když nejdřív vystřelíte a až potom se ptáte,“ dodává.

Podle fotografa Jiřího Hlouška ze stejné agentury se technologie výrazně posunula, ale lidská práce zatím neztrácí význam. „Firemní portréty, produktové focení, eventy nebo svatby – tam bude člověk stále potřeba. Je to podobné jako s hudbou. I když většina lidí poslouchá hudbu online, pořád existují ti, kteří si kupují vinylové desky.“

Delfíni v metru generováni umělou inteligencí.
Delfíni v metru generováni umělou inteligencí. Foto: OpenAI

Nad širšími dopady se zamýšlí také designér Jakub Červenka, který pracuje ve filmovém a herním průmyslu. Podle něj bude řada firem hledat úspory právě prostřednictvím umělé inteligence, což může znamenat méně pracovních příležitostí pro tvůrce. „AI nahrazuje hlavně jednodušší, začátečnické úkoly. Pro mladé lidi, kteří se chtějí prosadit v kreativních profesích, to může být problém, protože právě tyto úkoly dřív sloužily jako vstupní brána do oboru.“ Zároveň upozorňuje na právní nejistotu kolem způsobu, jakým se modely učí. „AI se trénuje na obsahu bez souhlasu autorů a zákony na tohle prostě nejsou připravené. Výsledkem jsou pak sporné případy, jako nedávný příval obrázků ve stylu Ghibli, který zaplavil internet," uvedl Červenka.

Funkce generování obrázků je aktuálně dostupná pro uživatele různých verzí ChatGPT, včetně bezplatné varianty. OpenAI plánuje v nejbližší době zpřístupnit nástroj také pro firmy, školy a vývojáře prostřednictvím dalších služeb a rozhraní. Vizuální model je schopen vytvářet ilustrace i fotorealistické výstupy na základě textového zadání, což otevírá nové možnosti pro rychlou tvorbu obrazového obsahu. Zároveň se objevují otázky spojené s autorskými právy, dopady na pracovní trh a využitelností v konkrétních profesích. Jak a v jakém rozsahu se tyto nástroje v praxi prosadí, zůstává zatím předmětem dalšího vývoje.

Další články o AI