Google na konferenci I/O 2025 představil Veo 3, nejnovější generaci AI modelu pro tvorbu videa, která zásadně mění pravidla hry v oblasti generativního obsahu.
Veo 3: Nová éra synchronizovaného videa a zvuku
Veo 3 je přelomový model, který jako první v segmentu umožňuje generovat video se synchronizovaným zvukem a dialogem přímo z textového zadání. Zatímco předchozí nástroje jako OpenAI Sora či Runway Gen-2 dokázaly vytvořit vizuálně působivé, ale tiché klipy, Veo 3 končí „éru ticha“, jak to nazval Demis Hassabis, šéf DeepMind.
Novinka od Googlu zvládá nejen realistické vizuály, ale i ambientní zvuky, zvukové efekty a dokonce i přesné pohyby rtů při generování dialogů, jak ukazují první příklady.
V praxi to znamená, že zadání promptu „mládě slona a dvě lamy povídající si u vodopádu“ přinese nejen video, ale také realistický zvuk vody, dialog a přesnou synchronizaci rtů.
Jako součást širší AI platformy Google Flow je Veo 3 dostupné uživatelům v USA v rámci předplatného Ultra (249,99 USD/měsíčně) a pro firmy přes Vertex AI.
Nový ekosystém kombinuje Veo pro video, Imagen 4 pro obrázky a Gemini pro zpracování přirozeného jazyka do jednoho rozhraní, které připomíná „no-code filmové studio“.
Porovnání s konkurencí a benchmarky
Veo 3 výrazně překonává konkurenci v klíčových parametrech. V interním hodnocení „MovieBench“ získal model 72 % preferencí uživatelů v celkové kvalitě, přičemž OpenAI Sora dosáhla jen 23 %.
V oblasti fyzikální realističnosti a synchronizace zvuku s obrazem dosáhlo Veo 3 až 81 % preferencí oproti 14 % pro nejbližšího rivala.
Ačkoliv je délka klipů v rámci Flow omezena na 8 sekund (delší sekvence jsou dostupné jen pro firmy), Veo 3 vyniká v rozlišení (4K), nativní podpoře zvuku a přesném lip-syncu, tedy realističnosti pohybu rtů.
Reálné využití a budoucnost AI videa
Veo 3 již nachází uplatnění v různých odvětvích. V oblasti filmu a storyboardingu umožňuje rychlé vytváření animatiků a vizuálních prototypů, což výrazně zkracuje čas i náklady na produkci.
Režiséři a nezávislí filmaři mohou testovat scény, dialogy a atmosféru bez potřeby velkého týmu. V reklamě a marketingu zase agentury dokáží přeměnit textové nápady na krátké, vizuálně a zvukově působivé klipy v průběhu minut, což zásadně snižuje produkční náklady.
Díky nativní podpoře zvuku, 4K rozlišení a jednoduché integraci do tvůrčího workflow se Google Veo 3 stává novým standardem v oblasti generativního videa a posouvá celý segment směrem k plně automatizované, AI-first produkci.







