Google spouští analýzu videí v aplikaci Gemini

Aplikace Gemini získává schopnost analyzovat nahraná videa. Funkce je postupně zaváděna na mobilních platformách a rozšiřuje tak možnosti AI asistenta.

Nová funkce pro analýzu videí

Google rozšiřuje možnosti své aplikace Gemini o dlouho očekávanou funkci nahrávání a analýzy videí. Kromě již existující podpory dokumentů a obrázků tak mohou uživatelé nyní přidávat vlastní video soubory přímo do promptů.

Tato novinka doplňuje již existující možnost pokládání otázek o YouTube videích prostřednictvím vložení odkazu, jak informoval 9to5Google.

Aplikace dokáže analyzovat nahraná videa a odpovídat na otázky týkající se obsahu klipu. Video se zobrazuje nad chatem s plnohodnotným přehrávačem, který umožňuje opětovné přehrání. Gemini díky tomu dokáže poskytovat detailní popisy scén, identifikovat objekty a dokonce číst text zobrazený ve videích.

Obrázek z aplikace Gemini s analýzou videa:

Dostupnost a technické specifikace

Funkce nahrávání videí zatím není široce dostupná a její dostupnost se liší podle účtů a zařízení.

Testování ukázalo, že funkcionalita je k dispozici pro bezplatné i placené uživatele na Android zařízeních (Google app 16.23 beta) a platformě iOS. Podporovány jsou modely 2.5 Flash i 2.5 Pro.

Webová verze Gemini tuto funkci zatím nepodporuje a uživatelé se setkávají s chybovou zprávou „File type unsupported„.

Podle předchozích analýz kódu aplikace bude Gemini podporovat široké spektrum video formátů včetně MP4, AVI, MOV, WebM, 3GP, FLV, MPEG a MPG. Systém bude také umožňovat nahrávání více videí najednou s omezeními založenými na celkové délce obsahu, jak doplňuje Android Police.

Budoucí rozšíření

Vývoj této funkce probíhal několik měsíců, přičemž první náznaky se objevily již v březnu 2025. Testování beta verzí ukázalo, že systém dokáže úspěšně identifikovat geografické lokace zobrazené ve videích bez dodatečného kontextu. Aktuální omezení spočívá v maximální délce kombinovaných videí na 5 minut v jedné relaci.