Google spouští stabilní verzi Gemini 2.5 Pro

Google oficiálně uvedl na trh stabilní verze svých nejnovějších AI modelů Gemini 2.5 Pro a Gemini 2.5 Flash. Zároveň představil zcela nový, odlehčený model Flash Lite.

Stabilní vydání po měsících testování

Vlajkový AI model společnosti Google s názvem Gemini 2.5 Pro prošel od svého prvního experimentálního uvedení v březnu 2025 dlouhým procesem vývoje. Model nejprve vstoupil do testovací fáze 25. března, přičemž byl zpočátku dostupný jen pro platící uživatele a vývojáře.

Google však následně velmi rychle, už o čtyři dny později, překvapivě zpřístupnil model i bezplatným uživatelům.

Následně ten samý model získal těsně před konferencí I/O významná vylepšení v oblasti kódování a jeho poslední aktualizace přišla začátkem června.

Včerejší oznámení o stabilní verzi, která je nyní všeobecně dostupná úplně všem, však neobsahuje žádné změny oproti zmiňované červnové preview verzi. Mění se ale limity a ceny.

Gemini 2.5 Pro + 2.5 Flash are now stable and generally available. Plus, get a preview of Gemini 2.5 Flash-Lite, our fastest + most cost-efficient 2.5 model yet. 🔦

Exciting steps as we expand our 2.5 series of hybrid reasoning models that deliver amazing performance at the… pic.twitter.com/z09B4TKtjr
— Sundar Pichai (@sundarpichai) June 17, 2025

Google kromě toho představil nový model Gemini 2.5 Flash Lite, o kterém píšeme níže.

Přístup pro různé kategorie uživatelů

Google tímto krokem zachovává rozvrstvený přístup ke svým AI modelům. Bezplatní uživatelé aplikace Gemini budou mít nadále „omezený přístup“ k 2.5 Pro, zatímco předplatitelé AI Pro získají rozšířený přístup s limitem 100 promptů denně.

Nejvyšší stupeň přístupu nabízí balíček Google AI Ultra. Model 2.5 Pro je optimalizován pro úkoly vyžadující „uvažování, matematiku a kódování“, zatímco 2.5 Flash slouží pro „rychlou všestrannou pomoc“.

Nové cenové podmínky pro vývojáře

Gemini 2.5 Flash je nyní všeobecně dostupný i pro vývojáře s aktualizovaným cenovým modelem:

$0.30 za 1 milion vstupních tokenů (nárůst z předchozích $0.15)
$2.50 za 1 milion výstupních tokenů (pokles z předchozích $3.50)

Google odstranil cenový rozdíl mezi „thinking“ a „non-thinking“ režimy a zachoval jednotnou cenovou úroveň bez ohledu na velikost vstupních tokenů.

Představení Gemini 2.5 Flash Lite

Společnost zároveň uvedla preview verzi modelu Gemini 2.5 Flash Lite, který je určen pro „vysokoobjemové úkoly citlivé na latenci, jako jsou překlady a klasifikace“.

Tento model nabízí nižší latenci než 2.0 Flash-Lite a 2.0 Flash při širokém spektru promptů za stejné náklady jako jeho předchůdci.

Google has just released Gemini 2.5 Flash Lite

This is the cheapest and fastest model available:

You can literally:

– Process the entire Harry Potter series for $0.22
– Analyze a 3-hour video for less than $0.35

And you can also enable thinking mode to enhance its… pic.twitter.com/IAKuBAVN2N
— Paul Couvert (@itsPaulAi) June 17, 2025

Flash Lite podporuje multimodální vstup, kontextové okno s 1 milionem tokenů a nativní nástroje včetně Google Search, provádění kódu a kontextu URL. Model také vykazuje vyšší kvalitu než 2.0 Flash-Lite ve všech oblastech včetně kódování, matematiky, vědy, uvažování a multimodálních benchmarků.

Model je dostupný přes Google AI Studio, API, Vertex AI a měl by být také součástí aplikace Gemini.

The new 2.5 Flash-Lite is nuts! Faster and better than 2.0 Flash but with the same pricing. 🤯 pic.twitter.com/UlixjBASx3
— Philipp Schmid (@_philschmid) June 17, 2025