Malý tým inovátorů poráží technologické giganty novým modelem pro generování AI videa s bezkonkurenční přesností.
Převrat v čele žebříčků umělé inteligence
Začátek prosince 2025 přinesl do světa generativní umělé inteligence zásadní zlom.
Americký startup Runway, který zaměstnává jen zhruba 100 lidí, oficiálně představil svůj nejnovější text-to-video model Gen-4.5. Tento model, interně přezdívaný „Dávid“ jako odkaz na biblický souboj s obrem, se okamžitě stal lídrem v nezávislých testech a odsunul dosavadní hegemony na vedlejší kolej.
Podle prestižního žebříčku Artificial Analysis Text to Video benchmark dosáhl model Gen-4.5 nejvyššího Elo skóre 1247. Tímto výkonem překonal nejen Google a jeho model Veo 3, ale také čínský Kling 2.5.
Ještě překvapivější je umístění modelu Sora 2 Pro od OpenAI, který se v tomto přímém srovnání propadl až na sedmé místo.
Generální ředitel společnosti Cristóbal Valenzuela tento úspěch komentoval slovy, která podtrhují efektivitu malých, agilních týmů schopných konkurovat bilionovým technologickým kolosům.
Metodika benchmarku je založená na slepém hlasování uživatelů, což potvrzuje, že vizuální věrnost a kvalita výstupů nového modelu skutečně rezonuje s lidským vnímáním.
Fyzikální přesnost a přetrvávající výzvy
Technologický skok modelu Gen-4.5 není jen o vyšším rozlišení, ale především o hlubším pochopení fyzikálních zákonů.
Vývojáři v úzké spolupráci se společností Nvidia, využívající jejich nejnovější čipy Hopper a Blackwell, dosáhli významného pokroku v simulaci pohybu tekutin, setrvačnosti a lidské mimiky. Model dokáže lépe reagovat na komplexní instrukce a zachovat vizuální konzistenci postav, což je klíčové pro filmový průmysl i marketing.
Navzdory těmto úspěchům však Runway přiznává, že technologie má stále své limity.
Model, stejně jako jeho konkurenti, zápasí se základní logikou kauzality – například dveře se mohou ve videu otevřít dříve, než se postava dotkne kliky.
Problémem zůstává i tzv. objektová stálost (object permanence), kdy předměty po dočasném zakrytí zmizí ze scény.
Dalším fenoménem je „bias úspěšnosti“, při kterém model generuje akce, které jsou úspěšnější než ve skutečnosti.
Tyto nedostatky naznačují, že ačkoliv je vizuální stránka na úrovni hollywoodské produkce, „mozek“ modelu se stále teprve učí chápat logické následnosti našeho světa.







