Kling 2.6: Nová éra AI videí se zvukem

Nový model Kling 2.6 opět mění pravidla hry a posouvá AI generativní video do fáze plně synchronizované produkce.

Nová verze přináší uzavřený cyklus „text ⇄ video ⇄ audio“, čímž efektivně řeší dlouholetý problém nesouladu mezi vizuální generací a zvukovým designem. Zároveň se tak stává přímou konkurencí pro modely Sora od OpenAI a Veo od Googlu, které taktéž umožňují generovat AI videa se zvukem.

Day 3: Meet VIDEO 2.6 — Kling AI's First Model with Native Audio

Generate an entire experience — more than a video clip! With coherent looking & sounding output, the 2.6 model opens up narrative possibilities, and makes you "See the Sound, Hear the Visual".

With the launch of… pic.twitter.com/H5WR7jL71S
— Kling AI (@Kling_ai) December 3, 2025

Základním průlomem je schopnost modelu „vidět zvuk“. Díky proprietární architektuře dokáže Kling AI 2.6 generovat zvukové efekty (Foley) s přesností na jeden snímek. V tomto směru se zdá, že Kling 2.6 je ještě detailnější a vyzrálejší než Veo a Sora.

Pokud postava ve videu klepne na stůl, zvuk se vygeneruje přesně v daný moment. Ještě impozantnější je nativní podpora lip-syncu pro bilingvní dialogy (zatím bohužel jen angličtina a čínština) a zpěv bez nutnosti externích pluginů.

Z technického hlediska model využívá difuzní transformátor s 3D časoprostorovou pozorností, což přináší nejen vyšší kvalitu, ale i 15% nárůst v schopnosti dodržovat komplexní instrukce.

Kling 2.6 with Native Audio just dropped on Higgsfield

Uncensored, unrestricted video with audio generation in 1080p.

8 wild examples:👇

1. Will Smith eating spaghetti pic.twitter.com/jWTcCJJmhd
— Min Choi (@minchoi) December 3, 2025

Souboj čínských titánů: Kling 2.6 vs. Seedance 1.0

Na trhu generativního videa se v roce 2025 vyprofilovali dva hlavní čínští hráči, přičemž každý cílí na jiný segment.

Zatímco Seedance 1.0 si získal popularitu díky své rychlosti a využití v reálném čase pro sociální sítě, Kling AI 2.6 se jasně profiluje jako nástroj pro profesionální filmovou kvalitu.

Zásadním rozdílem je míra realismu a konzistence. Ve slepých testech dosáhl Kling 2.6 o 285 % lepší výsledky v preferencích uživatelů – zejména díky schopnosti udržet konzistenci postav a scén i při delších záběrech.

Naopak Seedance 1.0 zůstává lídrem v rychlosti generování, což z něj činí ideální volbu pro rychlé marketingové klipy, kde není vyžadována vysoká míra vizuální věrnosti.

Profesionální integrace a budoucnost „Audio-First“ obsahu

Strategie společnosti Kuaishou je jasná: namísto běžných uživatelů sociálních sítí cílí na profesionální sektor „AI Filmmakingu“. Důkazem je okamžité partnerství s platformou Artlist, které tvůrcům zpřístupňuje API pro rozšiřování scén a střih více elementů.

Z pohledu nákladů je verze 2.6 optimalizovaná tak, že snižuje výpočetní cenu na 25 bodů za 5 sekund videa, což představuje 30% úsporu oproti předchůdci.

Pro tvůrce to znamená masivní redukci času postprodukce – odhady hovoří o poklesu o více než 50 %, jelikož zvukový design, často nejzdlouhavější část procesu, je nyní automatizovaný.

Roadmapa na první kvartál 2026 slibuje příchod 4K/60fps verze a vlastní hlasové knihovny, což pravděpodobně spustí novou vlnu hudebních videí a krátkých filmů, kde bude dominovat audio-vizuální imerze nad obyčejnou vizuální věrností.