Amazon posiluje svou pozici na trhu umělé inteligence představením Nova Sonic pro hlasovou interakci a Nova Reel 1.1 pro generování videa.
Nova Sonic: Real-time hlasová AI na nové úrovni Společnost Amazon uvedla na trh nový model umělé inteligence s názvem Nova Sonic, který má konkurovat řešením jako Google Gemini Live a Advanced Voice Mode od OpenAI. Tento model je navržen pro zpracování řeči v reálném čase a generování přirozených hlasových odpovědí.
Nova Sonic využívá tzv. „unifikovanou architekturu modelu“, která spojuje procesy rozpoznávání řeči, převodu textu na zvuk a generování odpovědí do jednoho systému. Podle Amazonu tato technologie přináší přesnější detekování tónu uživatele a přirozenější komunikaci.
Rohit Prasad, senior viceprezident a hlavní vědec pro AGI v Amazonu, uvedl, že komponenty Nova Sonic jsou již implementovány v novém asistentovi Alexa Plus.
Nova Sonic je dostupný prostřednictvím platformy Bedrock, která umožňuje vývojářům vytvářet aplikace pro různá odvětví, jako jsou zákaznické služby, zdravotnictví, vzdělávání či cestovní ruch.
Nova Reel 1.1: Vylepšení v generování videa Kromě hlasové AI představil Amazon i aktualizaci svého video-generujícího modelu Nova Reel 1.1, který přináší zlepšení kvality a nižší latenci oproti předchozí verzi 1.0.
Jak jsme psali i v našem předchozím článku, tento nástroj dokáže udržet konzistentní vizuální styl napříč šestisekundovými scénami, které je možné spojit do videí s délkou až dvě minuty.
Tato technologie může být využita pro tvorbu krátkých videí pro marketingové kampaně nebo vizuální prezentace v různých průmyslových odvětvích, čímž se Amazon snaží posílit svou konkurenceschopnost vůči hráčům jako OpenAI či Google.







