Kling a ComfyAI uvádějí revoluční model O1

Nový model O1 přináší průlomovou multimodální architekturu a eliminuje potřebu přepínání nástrojů při tvorbě videa.

Společnosti ComfyAI oficiálně zpřístupnily veřejnosti svůj nejnovější velký video model O1 postavený na Kling (stejnojmenném nástroji pro tvorbu AI videí), který představuje zásadní posun v oblasti generativní umělé inteligence.

Kling O1 is here!

I've been testing it the last few days (making the video below) and it's a beast 🧌

Here are my favorite features:

🧩 Use multiple reference images to get 360 consistency of products and characters
🎥 Control movement using reference video
🎛️ Edit video… pic.twitter.com/BTTPF8ZXVN
— Martin LeBlanc (@martinleblanc) December 1, 2025

Model, který oficiální zdroje označují jako „první sjednocený multimodální video model na světě“, je postaven na architektuře MVL (Multimodal Vision Language). Tato technologie umožňuje zpracovat text, obraz a video v jediném vstupním poli, čím odstraňuje bariéry mezi různými formáty zadání.

Klíčovou inovací modelu Kling O1 je integrace procesu Chain-of-Thought (myšlenkový řetězec) do tvorby videa, což je technika dosud známá především z pokročilých jazykových modelů.

So instead of generating 4 shots in different angles using Nano.

You can now skip ahead and create multi angle shots all from 1 video using Kling 01.

Not bad for first attempt generations. pic.twitter.com/DHhG3hMotA
— AiTechRealm (@AiTechRealm) December 2, 2025

Produktový ředitel ComfyAI vysvětlil, že tato technologie využívá konstrukci subjektu z více úhlů pohledu, čímž řeší jeden z největších problémů současných AI videí – tzv. feature drift (posun rysů).

„Model dokáže uzamknout charakteristiky lidí a objektů, čímž zajišťuje kontinuitu i při složitých kamerových přechodech ve scénách s více subjekty,“ uvádí se ve vyjádření společnosti.

Na rozdíl od běžného krokového procesu v odvětví zvládá O1 úlohy jako text-to-video, image-to-video či lokální úpravy v jednom kroku, bez nutnosti přepínat rozhraní.

Higgsfield’s new Kling O1 is insane 🤯

You can build, edit, and extend full video scenes with simple descriptions.

Here’s how plus a wild examples: pic.twitter.com/G5nTezx0UM
— Abhishek (@HeyAbhishek) December 1, 2025

Dostupnost a dopad na kreativní průmysl

Model O1 je momentálně dostupný k vyzkoušení prostřednictvím platformy ComfyApp nebo přes služby jako Higgsfield, Fal či ElevenLabs.
Společnost cílí především na tvůrce krátkých videí, reklamní týmy a individuální uživatele, přičemž v blízké budoucnosti plánuje zpřístupnit API i pro platformy třetích stran.

Analytici předpokládají, že příchod O1 může výrazně snížit vstupní bariéru pro profesionální video produkci. Otázkou však zůstává, zda se modelu podaří najít rovnováhu mezi vysokou kvalitou generování a nákladovou efektivitou — což ukáže až reálný trh.

Okay this one is really impressive. If I tried asking Nano Pro for different shots like this, I wouldn't get perfect results on first attempt. https://t.co/QAq7hZquMm pic.twitter.com/OJIMPq9jhq
— AiTechRealm (@AiTechRealm) December 2, 2025