Ainovinky.cz
Váš přístup k informacím o umělé inteligenci...
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
AI Nástroje
Ainovinky.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
Ainovinky.cz
Výsledek nenalezen
Zobrazit všechny výsledky

OpenAI představuje nový nástroj pro klonování hlasu do 15 sekund

Od David Kovář
1 dubna, 2024
Kategorie: Novinky
Naklonované opice v peruánské džungli

Dne 29. března 2024 OpenAI zásadně posunulo hranice generativní umělé inteligence, když představilo svůj nový nástroj pro klonování hlasu, Hlasový engine. Tento nástroj by měl být schopen naklonovat váš hlas do 15 sekund ze zvukové nahrávky a poté ho s téměř 100% bezchybností reprodukovat.

Jak je vidět OpenAI stále pokračuje ve svém inovativním toku. A není se čemu divit, poté co byl sesazen její špičkový model GPT-4 z trůnu nejlepšího LLM generativního AI modelu svým rivalem Claude 3 od společnosti Anthropic, se OpenAI snaží opět dostat do čela průmyslu umělé inteligence. Po modelu Sora, zaměřeného na generování videa, přichází další významný krok od OpenAI v podobě možnosti klonování hlasu.

Co představuje Hlasový engine od OpenAI?

Hlasový engine (Voice engine) umožňuje z 15 sekund nahraného hlasu dané osoby naučit se jeho hlas. Hlas lze poté reprodukovat ve velmi slibném provedení, tj. hlas by měl být čistý, plynulý a s přízvukem.

OpenAI zahájilo vývoj svého Hlasového enginu na konci roku 2022. Tento nástroj v současnosti pohání ChatGPT Voice a funkci předčítání. Nástroj tak rozšiřuje nabídku přednastavených hlasů v rámci jejich API pro převod textu na řeč. Pro vytvoření věrné kopie uživatelského hlasu Hlasový engine vyžaduje pouze krátkou nahrávku mluveného hlasu a text k předčítání. Výsledné hlasy, které tento nástroj produkuje, jsou překvapivě autentické a schopné zprostředkovat emoce s až pozoruhodnou hloubkou.

Obsah obrázku laser, tma, Neon, světlo

Popis byl vytvořen automaticky

Obrázek 1 – DALL-E 3: Hudební noty

Jak byl Hlasový engine trénován?

K tréninku modelu Hlasového enginu OpenAI byla použita kombinace licencovaných a veřejně dostupných datových sad. Jeff Harris, člen produktového týmu OpenAI, v rozhovoru pro TechCrunch uvedl, že model generativní AI Hlasového enginu pracoval v utajení již nějakou dobu. Vzhledem k tomu, že tréninková data a související informace jsou pro mnoho poskytovatelů generativní AI cenným aktivem, tendence je tyto informace držet v tajnosti.

Hlasový engine OpenAI nevyužívá pro svůj trénink ani optimalizaci data od uživatelů. Důvodem je, že tento systém generuje řeč unikátním způsobem, kdy spojuje specifické technologie (transformátor a difuzní proces), aby vytvořil přirozeně znějící hlas. To umožňuje Hlasovému enginu vytvářet věrohodné hlasové kopie bez potřeby speciálního nastavení pro každého uživatele. Stane se tak analýzou a kombinací textu, který má být předčten, a vzorku hlasu, který systém obdrží.

„V podstatě vezmeme malý zvukový vzorek s textem a vygenerujeme realistickou řeč, která odpovídá původnímu mluvčímu. Použitý zvuk je po dokončení požadavku odstraněn,“ řekl Harris v rozhovoru pro TechCrunch o Hlasovém enginu.

Praktické využití Hlasového enginu

Hlasový engine od OpenAI přichází s několika funkcemi, které jsou primárně zaměřeny na klonování realistického hlasu uživatele.

Asistence při čtení

Hlasový engine může být velmi užitečný pro děti a studenty, poněvadž používá realistické, expresivní hlasy, které předávají širší škálu řeči, než je možné s přednastavenými hlasy. Nástroj má velký potenciál poskytovat realistické interaktivní vzdělávací a čtecí sezení, které mohou významně zlepšit kvalitu vzdělávání.

Překlad zvuku

Hlasový engine dokáže přijmout vstupní hlas uživatele a poté jej přeložit do různých jazyků, čímž dosáhne komunikace nebo dosahu u širšího spektra diváků a komunit.

Spojení s komunitami po celém světě

Hlasový engine a GPT-4 umožňují dávat interaktivní zpětnou vazbu v rodném jazyce pracovníka, jako je svahilština, nebo v populárnějších jazycích jako Sheng, kódově smíšeném jazyce, který se běžně používá v Keni. Tato funkce může být velmi užitečná pro zlepšení poskytování služeb v odlehlých oblastech.

Pomoc nemluvním osobám

Lidé, kteří nemluví, mohou Hlasový engine využít k řešení svých každodenních problémů. Aplikace alternativní komunikace Livox řídí AAC (Augmentativní a alternativní komunikace) zařízení, která usnadňují komunikaci pro osoby se zdravotním postižením. Pomocí Hlasového enginu mohou poskytnout nemluvním osobám jedinečné lidské hlasy v různých jazycích.

Asistence pacientům v obnovení hlasu

Hlasový engine je velmi prospěšný pro ty, kteří trpí náhlými nebo degenerativními stavy hlasu. AI model je nabízen jako součást zkušebního programu Institutu neurověd Normana Prince v Lifespan, neziskové zdravotní instituci, která je hlavním výukovým partnerem lékařské fakulty Brownovy univerzity, která léčí pacienty s neurologickými nebo onkologickými etiologiemi řečového postižení.

Celkově, schopnosti klonování hlasu Hlasového enginu jdou daleko za rámec jednoduché generace zvuku, protože pokrývají širokou škálu užití prospěšných mládeži, rozmanitým komunitám a nemluvním pacientům s řečovými problémy. OpenAI učinilo odvážný krok ve vývoji nástroje, který může být velmi užitečný pro lidi po celém světě, s jeho dalo by se říci až magickými „hlasovými“ funkcemi.

Obsah obrázku kreslené, umění

Popis byl vytvořen automaticky

Obrázek 2 – DALL-E 3: Naklonované identické opice

Je Hlasový engine přístupný?

Ohlášení Hlasového enginu OpenAI, které naznačuje jejich záměr postupovat vpřed v technologii související s hlasem, následovalo po podání žádosti o ochrannou známku pro název. Společnost se prozatím rozhodla omezit dostupnost Hlasového enginu pro malý počet raných testerů, s ohledem na obavy z potenciálního zneužití a přidružených rizik. Rizika jsou o to více aktuálnější s nadcházejícími americkými volbami.

Jak OpenAI řeší zneužití „Deepfakes“ s Hlasovým enginem?

Uznávajíc vážná rizika spojená s napodobováním hlasu, zejména při citlivých příležitostech, jako jsou volby, OpenAI zdůrazňuje nutnost zodpovědného používání této technologie. Vzhledem k vážným důsledkům vytváření řeči, která znění velmi podobně jako hlas lidí, zejména během volebního roku, společnost odhalila, jaké preventivní opatření podniká, aby zmírnila tyto rizika.

Závěr

Hlasový engine od OpenAI otevírá nové horizonty v generování zvuku, přinášejícím revoluční potenciál i výzvy, které mohou radikálně transformovat interakci mezi lidmi a počítači. S postupným rozvojem v oblasti umělé inteligence od OpenAI se očekává, že tento nástroj zásadně ovlivní, jak technologie budou prostupovat naším životem. Nicméně až pouze čas ukáže, jak bude Hlasový engine přijat na globální úrovni a jaký dopad bude mít na budoucnost digitální komunikace.

Shrnutí

  • OpenAI představilo Hlasový engine, revoluční nástroj pro klonování hlasu, který může za 15 sekund naklonovat váš hlas.
  • Technologie vyžaduje pouze krátký záznam hlasu a text pro čtení k úspěšnému generování kopie hlasu s vysokou mírou realismu a emocionálního vyjádření.
  • Hlasový engine byl trénován s použitím kombinace licencovaných a veřejně dostupných datových sad.
  • Funkce zahrnují asistenci při čtení, překlad zvuku, spojení s komunitami po celém světě, pomoc nemluvním osobám a asistenci pacientům v obnovení hlasu.
  • Přístup k Hlasovému enginu je zatím omezen na malý počet raných testerů z důvodu obav z potenciálního zneužití.
  • OpenAI se snaží řešit zneužití technologie deepfakes a přijímá opatření, jako je použití vodotisku, pro sledování původu generovaného zvuku a monitorování jeho použití.

Zdroj:

  • Meet openai’s “Voice engine”: An ai that can clone your voice. FavTutor Articles. (2024, March 31). https://favtutor.com/articles/openai-voice-engine/#:~:text=Highlights%3A%201%20OpenAI%20unveils%20Voice%20Engine%2C%20an%20AI,a%20few%20companies%2C%20keeping%20safety%20guidelines%20in%20mind. 
Tagy: hlasopenai
Sdílet2Tweet1Odeslat

Mohlo by Vás zajímat

ChatGPT testuje další novinku: Skupinové chaty!
Novinky

ChatGPT testuje další novinku: Skupinové chaty!

OpenAI spustila v některých regionech pilotní program skupinových chatů v ChatGPT, který umožňuje až dvaceti uživatelům spolupracovat v jedné konverzaci...

Od ainovinky
14 listopadu, 2025
Elon Musk Grokipedia
chatboti

Elon Musk rozjíždí konkurenci pro Wikipedii – Je tu Grokipedie 0.1!

Spuštění úvodní verze AI encyklopedie Grokipedia od Elona Muska rozvířilo debatu o hranicích umělé inteligence a budoucnosti znalostních platforem. Nový...

Od ainovinky
28 října, 2025
ChatGPT osobní problémy
chatboti

OpenAI: Lidé se s ChatGPT velmi často baví i o sebevraždě

Otevřená data o duševním zdraví uživatelů ChatGPT ukazují, že umělá inteligence denně řeší ty nejcitlivější lidské otázky.Společnost OpenAI zveřejnila průlomové...

Od ainovinky
28 října, 2025
Chatgpt Konektory
chatboti

ChatGPT posiluje týmovou práci: Představuje sdílené projekty a inteligentní konektory

OpenAI představuje nové nástroje pro ChatGPT, které usnadňují týmovou spolupráci a zvyšují firemní bezpečnost. Spolupráce na projektech v reálném čase...

Od ainovinky
29 září, 2025
Gemini zrychluje
chatboti

Google zrychluje a zefektivňuje AI modely Gemini!

Společnost Google představila vylepšené verze svých modelů umělé inteligence Gemini 2.5 Flash a Flash-Lite. Výrazně úspornější a inteligentnější modely Technologický...

Od ainovinky
29 září, 2025
Meta ukázala AI brýle Ray-Ban s displejem
Novinky

Meta představila inteligentní AI brýle s displejem za 799 dolarů

Společnost Meta odhalila nové brýle Ray-Ban s displejem, které se ovládají futuristickým náramkem. Revoluce na zápěstí i před očima Generální...

Od ainovinky
18 září, 2025
  • Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    33 sdílení
    Sdílet 13 Tweet 8
  • Claude kreslí grafy a diagramy přímo v chatu. A zdarma!

    18 sdílení
    Sdílet 7 Tweet 5
  • Perplexity chce nahradit váš počítač umělou inteligencí

    17 sdílení
    Sdílet 7 Tweet 4
  • Muž vytvořil vakcínu proti rakovině pro svého psa – pomohl mu ChatGPT

    13 sdílení
    Sdílet 5 Tweet 3
  • AI agent Perplexity Computer je nově dostupný i pro předplatitele Pro

    21 sdílení
    Sdílet 8 Tweet 5

Oblíbené kategorie

  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní

O nás

  • Kontakt
AI nástroje
Umělá inteligence (AI) pro mnohé představuje budoucnost informatiky, byznysu i každodenního života.Pojďme se společně podívat, jaké jsou současné trendy ve využívání umělé inteligence a co nám může nabídnout do budoucna.
Copyright © 2026 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
AI Nástroje

Copyright © 2024 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz