Společnost s miliardovou hodnotou ElevenLabs zpřístupňuje svůj dosud nejpřesnější model, který eliminuje kritické chyby při čtení dat.
Jeden z nejhodnotnějších AI startupů současnosti, ElevenLabs, který je nejvýraznějším světovým hráčem v oblasti hlasové umělé inteligence (text-to-speech, speech-to-text a klonování hlasu), oznámil klíčový milník ve vývoji syntézy řeči.
Jejich nejnovější model, Eleven v3, oficiálně opustil fázi alfa testování a je nyní všeobecně dostupný pro všechny uživatele. Tento krok přichází v době, kdy se valuace společnosti, založené polskými podnikateli Mati Staniszewskim a Piotrem Dabkowskim, šplhá k desítkám miliard dolarů, což potvrzuje jejich dominanci na trhu generativního audia.
Podle Joe Reevea z růstového týmu společnosti přináší nová verze dvě zásadní vylepšení: stabilitu a přesnost.
Interní testy ukázaly, že uživatelé upřednostnili nový model v 72 % případů oproti předchozí verzi. Hlavním cílem aktualizace bylo odstranit běžný problém AI modelů, které často nesprávně interpretovaly kontext při čtení symbolů.
Typickým příkladem byla telefonní čísla, která starší verze četly jako matematické rovnice (např. „+49“ jako „plus čtyřicet devět“ místo „plus čtyři devět“).
Matematika a chemie už nejsou problém
Největší technický posun zaznamenal model Eleven v3 ve schopnosti rozlišovat nuance v textu.
Předchozí verze měly tendenci „zmatkovat“ u specializovaných zápisů, jako jsou chemické vzorce, ISBN kódy nebo sportovní výsledky.
Společnost proto provedla rozsáhlé testování na interním benchmarku, který zahrnoval 27 kategorií v 8 jazycích. Výsledkem je 68% celkové snížení chybovosti, přičemž míra chyb klesla z 15,3 % na 4,9 %.
Vylepšení jsou nejviditelnější v kategoriích, kde kontext mění význam symbolu:
- Chemické vzorce: chybovost klesla o 99 %. Například vstup SO₂ už model nečte nesrozumitelně, ale správně jako „S O dva“.
- Telefonní čísla: redukce chyb o 99 %.
- Sportovní skóre: výsledek „102–98“ je nyní správně interpretován jako „sto dva ku devadesáti osmi“, nikoliv jako matematické odečítání.
Tyto změny jsou klíčové zejména pro firemní klienty, kteří technologii využívají k automatizaci v sektorech, jako jsou finance či vzdělávání, kde je přesnost čtení dat naprosto zásadní.






