Společnost OpenAI na své konferenci Dev Day odhalila nové výkonné modely pro vývojáře.
Nová generace jazykových a hlasových modelů
OpenAI v pondělí na své vývojářské konferenci představila sérii novinek v rámci svého API rozhraní s cílem přilákat více vývojářů do svého ekosystému.
Mezi klíčová oznámení patří nový jazykový model GPT-5 Pro, ale také menší a levnější hlasový model.
GPT-5 Pro má oslovit především vývojáře aplikací v odvětvích jako finance, právo a zdravotnictví, které podle šéfa OpenAI, Sama Altmana, vyžadují „vysokou přesnost a hloubku uvažování“.
Altman také zdůraznil, že hlasové funkce se rychle stávají jedním z hlavních způsobů interakce lidí s umělou inteligencí. Proto společnost spouští v API nový model s názvem „gpt-realtime mini“. Ten podporuje interakce s nízkou latencí pro zvuk a řeč a je o 70 % levnější než předchozí pokročilý hlasový model, přičemž si zachovává „stejnou kvalitu a expresivitu hlasu“.
Kreativita bez hranic se Sora 2
Vývojáři v ekosystému OpenAI získávají přes API přístup i k náhledové verzi nového modelu pro generování videa a zvuku Sora 2. To okamžitě vedlo k integraci Sora2 do aplikací třetích stran, jako jsou Higgsfield či Veed.
Model Sora2 byl představen teprve minulý týden spolu se stejnojmennou aplikací Sora, která je považována za konkurenta TikToku a je plná krátkých videí generovaných umělou inteligencí.
„Vývojáři teď mají přístup ke stejnému modelu, který pohání úžasné video výstupy Sora 2, přímo ve své vlastní aplikaci,“ uvedl Altman.
Sora 2 staví na předchozí generaci a přináší realističtější, fyzikálně konzistentní scény se synchronizovaným zvukem a větší tvůrčí kontrolou.
„Můžete například vzít záběr z iPhonu a požádat Soru, aby ho rozšířila do širokého, filmového záběru,“ vysvětlil Altman.
OpenAI představila i AgentKit
Tyto novinky jsou součástí širší strategie, která zahrnuje také nástroj AgentKit pro tvorbu AI agentů a možnost vytvářet aplikace přímo v prostředí ChatGPT.
Cílem AgentKitu je poskytnout vývojářům kompletní sadu stavebních bloků na platformě OpenAI, čímž se snižuje složitost při přechodu od prototypu k produkční verzi agenta.
AgentKit zahrnuje čtyři hlavní komponenty:
- Agent Builder – pro vizuální návrh logiky agenta
- ChatKit – pro snadnou integraci chatovacího rozhraní do vlastních aplikací
- Evals for Agents – pro měření a optimalizaci výkonu agentů
- Přístup k registru konektorů – pro bezpečné propojení s interními a externími systémy







