Ve světě se v současné době vyskytuje kolem 7 000 známých jazyků, kterým ale v současné době hrozí zánik. Primárním důvodem se pak stává vzrůstající tlak na ekonomický růst. Společnost Meta stojící za aplikacemi jako Facebook a Instagram, vyvinula velký multijazyčný AI model pro rozpoznávání mluveného jazyka. Modely by měly být schopné identifikovat více než 4 000 mluvených jazyků. Pro představu dosavadní modely a technologie byly schopné rozpoznat pouze zhruba 1000 mluvených jazyků, z čehož plyne, že nové modely od společnosti Meta by tak měl být až 40krát schopnější než modely předchozí.
Kromě toho by nové modely měly být schopné rozšířit technologie převodu textu na řeč a opačně z přibližně 100 jazyků na více než 1 100 jazyků. Společnost meta dodává, že takto rozšířená technologie by mohla být využita pro aplikace ve virtuální (VR) nebo augmentované (AR) realitě. Díky tomu by člověk mohl zejména v online prostoru komunikovat svým rodným jazykem, který by byl automaticky konvertován na cizí jazyk. To by mohlo znatelně usnadnit komunikaci a pomoci lidem, kteří nemají dostatečné jazykové schopnosti.
Proč je komunikace tak důležitá?
Komunikace je klíčovým prvkem pro fungování společnosti. Umožňuje lidem sdílet informace, názory a myšlenky. Komunikace zároveň zamezuje konfliktům či nedorozuměním, díky čemuž vzniká lepší pracovní stabilita a lidé jsou více ochotni spolupracovat. Na druhé straně nedostatečná komunikace nebo špatná komunikace může vést k nedorozuměním a problémům nejen ve vztazích, ale i v práci. Korporace a firmy, které otevřeně podporují komunikaci mezi zaměstnanci a nadřízenými se těší lepší pracovní morálce, a s tím i zvýšené efektivitě zaměstnanců. To se samozřejmě poté promítá i do hospodářského výsledku firmy, kde firma vykazuje snížené náklady a odvedení více práce často i za menší dobu.
Mnoha světovým jazykům dnes hrozí zánik
Zánik známých jazyků ve společnosti není tajemstvím, podle webové stránky Science.org každé 2 týdny dochází ke ztrátě 1 jazyku – podle současných odhadů by do konce 21. století mělo dojít ke ztrátě až 1 500 známých jazyků. Hlavním viníkem se pak stává zejména ekonomický růst a převzetí dominantních jazyků jako je angličtina domorodými kmeny, kteří potom pomalu přestávají používat svůj vlastní jazyk.
Studie z roku 2006 vedená autorem Paulem De Grauwem pak podporuje tzv. „Fishman-Pool“ hypotézu, podle níž je jazyková heterogenita neboli různorodost zodpovědná za nižší hospodářský růst z důsledku menší stability vlády, nedostatečné komunikace a zvýšeným nákladům.
Svou roli ve snižování jazykové diverzity hrají i současné technologie, které jsou nastavené jen na dominantní světové jazyky jako je angličtina nebo španělština. Kvůli tomu je mnoho uživatelů nuceno více používat výše zmíněné jazyky na úkor toho svého. Tomu se společnost Meta snaží zamezit.
Dík novým modelům bychom mohli prolomit jazykovou bariéru
„Jelikož mnohým světovým jazykům hrozí zánik a současné omezené technologie pro rozpoznávání a generování řeči tento trend akorát akcelerují, rozhodli jsme se pro usnadnění přístupu k informacím a zjednodušit komunikace pomocí nových AI modelů, které by uživatelům měli umožnit komunikovat a získávat informace v jejich přirozeném jazyce,“ píše Meta na svém webovém článku.
Jste-li zběhlejší v IT nebo máte-li zájem podívat se na modely do větší hloubky, společnost Meta oznámila, že modely a jejich kód budou poskytnuty pod open-source licencí – díky tomu, bude možné na jazykových modelech stavět aplikace či využívat modely pro své specifické potřeby. Meta se dle svých vlastních slov snaží o „zachování světových jazyků“ a „sblížení světové populace“.
Největším trénovacím zdrojem pro modely se stala Bible
Shromáždění zvukových dat pro tisíce jazyků bylo naší první výzvou, poněvadž největší existující databanky pokrývají pouze kolem 100 jazyků. Abychom tento problém překonali, obrátili jsme se na náboženskou literaturu jako je například Bible.
Důvodem našeho rozhodnutí byl fakt, že Bible oproti ostatním knihám je jednou z nejpřekládanějších knih vůbec. Zatímco celá Bible byla přeložena do zhruba 724 jazyků, Nový Zákon se dočkal až 1 617 překladů. Menší části Bible byly podle Wycliffe Global Alliance přeloženy do 1 248 dalších jazyků, z čehož plyne, že alespoň některé části Bible byly přeloženy do 3 589 jazyků.
Do databáze se dostaly desítky 200hodinových nahrávek
Kromě toho mnoho překladů Bible má i dostupné zvukové nahrávky v různých jazycích. V rámci projektu MMS (Massively Multilingual Speech) jsme vytvořili svou vlastní datovou sadu čtení Nového zákona ve více než 1 100 jazycích – v průměru se jednalo o 32hodinových nahrávek na jeden jazyk, což dohromady činí až 35 200hodinových nahrávek.
Při zohlednění neoznačených nahrávek různého křesťanského náboženského čtení jsme počet dostupných jazyků zvýšili až na 4 000. I přestože data pocházejí ze specifických oblastí a jsou čtena převážně muži, modely by měly stejně tak dobře fungovat i pro ženské hlasy. Mnoho lidí by pak mohlo namítnout, že takový model bude mít často náboženský podtext, analýza samotnou společností pak ukazuje, že model by neměl být nikterak zkreslený a neměl by produkovat jazyk s náboženskou influencí.
Jaké jsou plány do budoucna?
Společnost Meta udává, že v následujících letech by chtěli rozšířit jazykové modely MMS s cílem podpory více jazyků. Jednou z hlavních výzev pro společnost se pak stávají dialekty, které jsou zatím pro stávající jazykové modely obtížné na rozpoznání.
Bude učení nových jazyků zbytečné?
Rozhodně ne! Učení nových jazyků je z hlediska neurologických výzkumů zcela zásadní pro rozvoj našich mozkových struktur. Podle výzkumu uvedeného na webové stránce BE BRAIN FIT učení nového jazyka jednoznačně přispívá ke zlepšení paměti a kognitivních schopností jako je inteligence nebo pozornost. Dále se ukazuje, že lidé, kteří jsou schopni mluvit více jazyky jsou gramaticky schopnější a dokáží kreativněji uvažovat. Učení se cizího jazyka rozvíjí také divergentní myšlení neboli schopnost hledání více různých perspektiv, možností či alternativ. To lidem umožňuje být více flexibilní a kreativní. Asi není třeba dodávat, že takové dovednosti jsou v dnešní době zcela esenciální.
A navíc nikdy nevíte, kdy technologie vypoví službu, a Vy budete odkázaní na své vlastní znalosti jazyka.
Závěr
Celkově lze však říct, že jazyková bariéra by pro mnohé lidi už neměla činit větší potíže. Zároveň by mělo být možné komunikovat i s lidmi obývajícími asijské země, jejichž jazyk je obtížnější na učení. Zefektivnění komunikace by se mohlo podílet na agilnější spolupráci mezi jednotlivými státy, korporacemi či jinými podniky. Nejenže by se tak urychlil vývoj, ale mohlo by dojít i ke snížení nákladů vzniklých v důsledku pochybení v pracovním prostředí či delší pracovní doby nutné pro dokončení úkolu.