OpenAI odhaluje vylepšený generátor obrázků, DALL-E 3, v době zvyšujícího se napětí v oblasti AI

V posledních letech se světem technologií prohnala vlna inovací umělé inteligence. Mezi ty nejvýraznější patří bezpochyby technologie generování obrázků podle textových příkazů, kam můžeme zařadit např. Midjourney, Stable Diffusion nebo DALL-E. Konkrétně DALL-E, pocházející od společnosti OpenAI se stal v centru pozornosti odborníků i veřejnosti. V průběhu minulých měsíců se nástroj DALL-E byl spíše hráčem v pozadím za Midjourney. To by se ale nyní mělo změnit s tím, jak vychází nová verze generativního AI modelu, která slibuje generování obrázků přímo uprostřed ChatGPT.

Obrázek 1 – Zdroj: OpenAI Blog, DALL-E 3

Rozšíření aplikace do ChatGPT

Ve středu zveřejnila technologická společnost OpenAI první náhled na svou novou iteraci nástroje DALL-E, software schopný generovat vizuální obsah z textových instrukcí. OpenAI současně odhalilo svůj záměr integrovat tento pokročilý nástroj do svého již etablovaného chatového robota ChatGPT. Tento strategický krok má za cíl rozšířit aplikace a dosah tohoto kontroverzního nástroje, a to v momentě, kdy se legislativní orgány stále častěji zabývají potenciálními etickými a právními důsledky používání umělé inteligence.

Nově vylepšený nástroj od OpenAI, DALL-E 3, představuje průlom v oblasti generování obrázků pomocí umělé inteligence. Jeho zvýšená schopnost pochopit uživatelské instrukce znamená, že může vytvářet vizuální obsah, který je nejen více v souladu s požadavky uživatele, ale také obsahuje text, který je snadněji čitelný a srozumitelný. Dřívější verze těchto nástrojů často bojovaly s chybami v interpretaci, což vedlo k nejasnostem v generovaných obrazech.

„Neformální uživatelé se mohou přihlásit k chatbotu a požádat o něco docela neurčitého,“ řekl Aditya Ramesh, vedoucí týmu DALL-E 3, během ukázky pro majitele firmy, který testoval různá loga pro svůj podnik s názvem Mountain Ramen.

Obrázek 2 – Zdroj: OpenAI Blog, DALL-E 3

DALL-E 3 bude dostupné již v říjnu pro předplatitele

Ačkoli DALL-E 3 je v současné době k dispozici pouze malému okruhu uživatelů pro pilotní testování, plány na jeho zpřístupnění širší veřejnosti prostřednictvím platformy ChatGPT v říjnu naznačují jeho rychlou adopci. Tato expanze může výrazně zvýšit interakci uživatelů s touto pokročilou technologií.

V období narůstající konkurence se startup z San Francisca, OpenAI, ocitá ve složité pozici. Přestože jeho dřívější produkty, jako je DALL-E a vlajkový chatbot, zaznamenaly pokles popularity, gigantický technologický kolos, Google, pokračuje ve vývoji a uvedení svých produktů založených na umělé inteligenci na trh. Společnost OpenAI reaguje na tento vývoj inovací: integrují svůj nejnovější generátor obrázků DALL-E 3 do ChatGPT, což nabízí novou funkci, která má potenciál posílit jeho konverzační platformu a navýšit svou konkurenceschopnost.

Opatrnost nade vše

Po svém debutu v minulém roce získaly nástroje, jako jsou DALL-E 2, Midjourney a Stable Diffusion, rychle na popularitě. Tyto sofistikované AI řešení fascinovaly svým schopnostem generování vizuálního obsahu a byly velmi přístupné i těm, kteří neměli hluboké technické znalosti. Různé odvětví, od reklamních agentur po tvůrce videoher, nástroje objaly a vytvářely pomocí nich jedinečné a vizuálně poutavé kampaně.

Přesto, s rostoucí popularitou AI technologií, jako je generování obrázků z textu, je zde rovněž rostoucí potřeba regulací. Existuje zde totiž obava ohledně potenciálních dopadů těchto technologií, zejména v kontextu schopnosti vytvářet realistické a přesvědčivé vizuální obsahy, což by mohlo mít vážné sociální a politické důsledky.

Obrázek 3 – Zdroj: OpenAI Blog, DALL-E 3

Jak se technologie umělé inteligence rychle vyvíjejí, stává se rozpoznání manipulovaného obsahu, jako jsou deepfakes, a ochrana duševního vlastnictví stále více probíraným tématem. Výzkumná vědkyně Margaret Mitchell upozornila na význam těchto nástrojů v kontextu současných technologických výzev.

Transparentnost v čele se systémovou kartou

Tým stojící za vývojem DALL-E 3 si je vědom potenciálních rizik spojených s jejich technologií a zvolil proaktivní přístup k jejich řešení. Spolupráce s „červeným týmem“ externích specialistů je součástí jejich strategie ke zmírnění těchto hrozeb. OpenAI se zavázalo k transparentnosti, což bude demonstrováno zveřejněním systémové karty. Tato karta bude obsahovat důležité informace o vývoji, optimalizaci a testování modelu z hlediska bezpečnosti, poskytujíc tak uživatelům klíčové informace o možných rizicích a bezpečnostních protokolech spojených s použitím DALL-E 3.

Inovace v oblasti umělé inteligence neustále posouvají hranice toho, co je technologicky možné. DALL-E 3 od OpenAI představuje nejen pokrok v generování obrázků, ale také vyvolává řadu otázek ohledně etiky, autorských práv a potenciálního zneužití. Jak ukazuje náš přehled, OpenAI je si vědomo těchto výzev a snaží se je aktivně řešit. Avšak s rychlým rozvojem takových technologií je nezbytné, aby se veřejnost, zákonodárci a experti zapojili do diskuse o tom, jak je správně a bezpečně využívat. Jaké budou další kroky v oblasti AI a jaký dopad budou mít na naši společnost, je stále otevřená otázka.

Závěrem lze říct, že OpenAI vstoupilo na scénu s novou verzí svého inovativního nástroje DALL-E 3, která nyní nabízí vylepšené chápání uživatelských příkazů a je schopná efektivněji překládat text do obrázků. Klíčovou novinkou je ale jeho integrace do populárního chatbotu ChatGPT. Tato aktualizace, která bude zpřístupněna předplatitelům ChatGPT v říjnu, má potenciál zvýšit počet uživatelů. V kontextu zvyšujícího se konkurenčního tlaku, zejména ze strany technologických gigantů jako je Google, se OpenAI snaží udržet krok a expandovat svůj tržní podíl. Tímto tahem zdůrazňuje svůj závazek k inovacím a potvrzuje svou pozici lídra v oblasti umělé inteligence.