Google oficiálně uvedl na trh stabilní verze svých nejnovějších AI modelů Gemini 2.5 Pro a Gemini 2.5 Flash. Zároveň představil zcela nový, odlehčený model Flash Lite.
Stabilní vydání po měsících testování
Vlajkový AI model společnosti Google s názvem Gemini 2.5 Pro prošel od svého prvního experimentálního uvedení v březnu 2025 dlouhým procesem vývoje. Model nejprve vstoupil do testovací fáze 25. března, přičemž byl zpočátku dostupný jen pro platící uživatele a vývojáře.
Google však následně velmi rychle, už o čtyři dny později, překvapivě zpřístupnil model i bezplatným uživatelům.
Následně ten samý model získal těsně před konferencí I/O významná vylepšení v oblasti kódování a jeho poslední aktualizace přišla začátkem června.
Včerejší oznámení o stabilní verzi, která je nyní všeobecně dostupná úplně všem, však neobsahuje žádné změny oproti zmiňované červnové preview verzi. Mění se ale limity a ceny.
Google kromě toho představil nový model Gemini 2.5 Flash Lite, o kterém píšeme níže.
Přístup pro různé kategorie uživatelů
Google tímto krokem zachovává rozvrstvený přístup ke svým AI modelům. Bezplatní uživatelé aplikace Gemini budou mít nadále „omezený přístup“ k 2.5 Pro, zatímco předplatitelé AI Pro získají rozšířený přístup s limitem 100 promptů denně.
Nejvyšší stupeň přístupu nabízí balíček Google AI Ultra. Model 2.5 Pro je optimalizován pro úkoly vyžadující „uvažování, matematiku a kódování“, zatímco 2.5 Flash slouží pro „rychlou všestrannou pomoc“.
Nové cenové podmínky pro vývojáře
Gemini 2.5 Flash je nyní všeobecně dostupný i pro vývojáře s aktualizovaným cenovým modelem:
- $0.30 za 1 milion vstupních tokenů (nárůst z předchozích $0.15)
- $2.50 za 1 milion výstupních tokenů (pokles z předchozích $3.50)
Google odstranil cenový rozdíl mezi „thinking“ a „non-thinking“ režimy a zachoval jednotnou cenovou úroveň bez ohledu na velikost vstupních tokenů.
Představení Gemini 2.5 Flash Lite
Společnost zároveň uvedla preview verzi modelu Gemini 2.5 Flash Lite, který je určen pro „vysokoobjemové úkoly citlivé na latenci, jako jsou překlady a klasifikace“.
Tento model nabízí nižší latenci než 2.0 Flash-Lite a 2.0 Flash při širokém spektru promptů za stejné náklady jako jeho předchůdci.
Flash Lite podporuje multimodální vstup, kontextové okno s 1 milionem tokenů a nativní nástroje včetně Google Search, provádění kódu a kontextu URL. Model také vykazuje vyšší kvalitu než 2.0 Flash-Lite ve všech oblastech včetně kódování, matematiky, vědy, uvažování a multimodálních benchmarků.
Model je dostupný přes Google AI Studio, API, Vertex AI a měl by být také součástí aplikace Gemini.






