Nástroj od Googlu na generování a úpravu obrázků je nyní plně dostupný a přichází také s dalšími novinkami.
Plná dostupnost a nové možnosti
Společnost Google oficiálně oznámila, že její nejmodernější model pro generování a úpravu obrázků – Gemini 2.5 Flash Image, známý také pod názvem Nano Banana, je nyní obecně dostupný a připravený pro produkční nasazení.
Tento krok navazuje na srpnové představení a otevírá dveře vývojářům i firmám k využívání pokročilých schopností umělé inteligence. Model je přístupný přes Gemini API v nástrojích Google AI Studio a Vertex AI, což umožňuje jeho integraci do široké škály aplikací.
Hlavní novinkou je rozšíření kreativních možností díky podpoře deseti různých poměrů stran, od filmových (21:9) až po vertikální formáty (9:16) vhodné pro sociální sítě.
Gemini 2.5 Flash Image umožňuje plynule kombinovat více obrázků, zachovávat konzistenci postav v sérii vizuálů a provádět cílené úpravy pomocí příkazů v přirozeném jazyce. Využívá přitom rozsáhlé znalosti modelu Gemini k tvorbě i modifikaci obsahu.
Inovace v praxi: Od her po umění
Potenciál modelu již v praxi ukazují různé společnosti. Cartwheel ho využívá ve své funkci Pose Mode, která umělcům poskytuje přímou kontrolu nad pózou a konzistencí postav.
Spoluzakladatel Andrew Carr uvedl:
„Ostatní modely nedokázaly vykreslit postavy z libovolných úhlů kamery nebo zachovat věrnost pózy bez obětování ‚znalostí o světě‘. Nový model Gemini 2.5 Flash Image byl první, který dokázal nabídnout obojí.“
Dalším příkladem je společnost Volley, která stojí za hrou Wit’s End. Model Gemini 2.5 Flash Image jim umožňuje generovat a upravovat vizuály přímo během hraní – od portrétů postav přes dynamické scény až po rychlé úpravy na základě hlasových příkazů.
Technický ředitel James Wilsterman dodal:
„Model prokazuje nejmodernější dodržování estetických pravidel při zachování latence pod 10 sekund. To odemyká mnoho živých aplikací – například umožňuje hráčům vybírat styly a zpřesňovat výstupy ve vícekolových smyčkách.“
Kreativitu komunity podpořily také nedávné hackathony pořádané ve spolupráci s Kaggle a Cerebral Valley, které ukázaly rozmanité využití modelu jak v USA, tak po celém světě.
[Zdroj: Google Developers Blog]







