Modelování interakce jazyka a chování v umělých inteligencích: Nový přístup UNIGE umožňuje vzájemnou komunikaci robotů

Realizace nového úkolu pouze na základě ústních či písemných pokynů a následné popisování tohoto úkolu tak, aby jej mohli reprodukovat i ostatní, je základním kamenem lidské komunikace, který se umělé inteligenci (AI) dosud vyhýbal. Týmu z Univerzity v Ženevě (UNIGE) se však podařilo vyvinout model umělé neuronové sítě schopné této kognitivní dovednosti. Po naučení a vykonání série základních úkolů byla tato AI schopna poskytnout jazykový popis těchto úkolů „sesterské“ AI, která je následně byla schopna reprodukovat. Tyto slibné výsledky, zejména pro robotiku, byly publikovány v časopise Nature Neuroscience.

Provádění nového úkolu bez předchozího školení, pouze na základě ústních nebo písemných pokynů, je unikátní lidská schopnost, která s námi byla už od nepaměti.

Co víc, jakmile se úkol naučíme, dokážeme ho popsat tak, aby jej mohla reprodukovat i jiná osoba. Tato dvojí schopnost nás odlišuje od ostatních druhů, které se musí nový úkol naučit prostřednictvím mnoha pokusů a chyb, doprovázených signály pozitivního či negativního posílení, aniž by byly schopny předat své znalosti svým druhům.

Subdisciplína umělé inteligence – zpracování přirozeného jazyka – se snaží tuto lidskou schopnost napodobit, s cílem vytvořit stroje, které rozumí a reagují na hlasová nebo textová data.

Nicméně, neurální výpočty, které by umožnily dosáhnout výše popsaného kognitivního úspěchu, jsou stále špatně pochopené.

„V současné době jsou konverzační agenti využívající AI schopni integrovat jazykové informace pro generování textu nebo obrazu.

Ale, pokud víme, ještě nejsou schopni přeložit verbální nebo písemný pokyn do senzomotorické akce, a tím méně jej vysvětlit další umělé inteligenci, aby ji mohla reprodukovat,“ vysvětluje Alexandre Pouget, profesor na katedře základních neurověd na lékařské fakultě UNIGE.

Obsah obrázku Vesmír, mlhovina, prostor, hvězda

Popis byl vytvořen automaticky

Obrázek 1 – DALL-E 3: Vesmírné propletení

Jak fungují běžné neuronové sítě?

Tato technika je založena na umělých neuronových sítích, inspirovaných našimi biologickými neurony a způsobem, jakým si mezi sebou v mozku předávají elektrické signály. Tyto sítě se skládají z několika vrstev: vstupní, výstupní a jedné či více skrytých vrstev mezi nimi. Každá vrstva obsahuje soubor umělých „neuronů“, které simulují chování lidských neuronů přenášením signálů.

Princip fungování neuronové sítě je poměrně jednoduchý. Při zpracování dat, například při pokusu rozpoznat objekt na obrázku, jsou data nejprve vložena do vstupní vrstvy. Odtud prochází skrze jednu nebo více skrytých vrstev, kde každý neuron zpracovává informace na základě svých specifických vah. Váhy v neuronové síti jsou velmi důležité, poněvadž určují, jak jsou spojení mezi jednotlivými neurony pro daná vstupní data významné či nevýznamné. Tento proces umožňuje síti učit se a adaptovat se na rozpoznávání vzorců v datech.

Například vložíme-li do neuronové sítě pro rozpoznávání zvířat obrázek psa, spojení mezi neuronem, který reprezentuje ocas, a mezi neuronem, který reprezentuje čenich bude velmi významné. Tato kombinace je totiž pro psy velmi typická, naopak váha spojení těchto neuronů bude málo významná pro kočku. Protože ačkoli má kočka ocas, nemá takový protáhlý čenich jako pes. Tento příklad je samozřejmě velmi zjednodušený.

Nakonec, jakmile data projdou všemi skrytými vrstvami, dostanou se do výstupní vrstvy, která poskytne výsledek – například identifikuje na obrázku psa. Poté se vypočte tzv. ztrátová funkce, která říká, o kolik se síť spletla nebo nespletla. Na základě toho se poté aktualizují váhy mezi jednotlivými neurony s cílem zesílit spojení mezi neurony, které mezi sebou mají často shodu, a naopak zeslabit neurony, jejichž propojení je málo významné. Tento proces probíhá stále dokola, dokud neuronová síť nevytipuje ideální spojení mezi neurony, které ve většině případů vede ke správnému výsledku – například určení objektu na obrázku.

Obsah obrázku kruh, diagram, snímek obrazovky, řada/pruh

Popis byl vytvořen automaticky

Obrázek 2 – Diagram neuronové sítě

Komunikace mezi dvěma neuronovými sítěmi

Když nyní víme, jak přibližně fungují neuronovými sítě, můžete se vrátit zpět k hlavnímu tématu. Výzkumníkovi a jeho týmu se podařilo vyvinout umělý neuronový model s touto dvojí schopností – tedy komunikace neuronové sítě (AI) s jinou neuronovou sítí, i když po předchozím školení.

„Začali jsme s existujícím modelem umělých neuronů, S-Bert, který má 300 milionů neuronů a je předtrénovaný na porozumění jazyku.

Připojili jsme jej k další, jednodušší síti s několika tisíic neuronů,“ vysvětluje Reidar Riveland, doktorand na katedře základních neurověd na lékařské fakultě UNIGE a první autor studie.

V první fázi experimentu neurovědci trénovali tuto síť na simulaci Wernickeho oblasti, části našeho mozku, která nám umožňuje vnímat a interpretovat jazyk.

Ve druhé fázi byla síť trénována na reprodukci Brocovi oblasti, která pod vlivem Wernickeho oblasti zodpovídá za produkci a artikulaci slov.

Wernickeovo centrum řeči: umístění v mozku, funkce a poruchy

Obrázek 3 – Vizualizace mozkových oblastí

Celý proces probíhal na běžných laptopových počítačích. AI byly poté předány písemné pokyny v angličtině.

Hodnocení výsledků modelů

Například: ukazování na místo – vlevo nebo vpravo – kde je vnímán podnět; reagování opačným směrem, než je podnět; nebo složitější, mezi dvěma vizuálními podněty s mírným rozdílem v kontrastu, ukázání na ten jasnější.

Vědci poté hodnotili výsledky modelu, který simuloval úmysl pohybu, v tomto případě ukazování.

„Až byly tyto úkoly naučeny, síť byla schopna je popsat druhé síti – kopii první – tak, aby je mohla reprodukovat.

Podle našich znalostí je to poprvé, co dvě AI spolu vedly rozhovor čistě jazykovým způsobem,“ říká Alexandre Pouget, který vedl výzkum.

Přirozená komunikace mezi humanoidními roboty

Tento model otevírá nové obzory pro pochopení interakce mezi jazykem a chováním. Je zvláště slibný pro sektor robotiky, kde vývoj technologií umožňujících strojům vzájemně komunikovat je klíčovou otázkou. „Síť, kterou jsme vyvinuli, je velmi malá. Nic nyní nebrání vývoji na tomto základě mnohem složitějších sítí, které by byly integrovány do humanoidních robotů schopných nás rozumět, ale také si navzájem rozumět,“ uzavírají oba výzkumníci.

Shrnutí

Tým z UNIGE vyvinul umělou neuronovou síť schopnou vykonávat a popisovat úkoly jazykem pro jinou AI.
Model dokáže simulovat části mozku odpovědné za vnímání a produkci jazyka.
Tato technologie má velký potenciál v oblasti robotiky a umožňuje strojům vzájemně komunikovat.
Výzkum otevírá cesty pro další rozvoj AI a její integraci do humanoidních robotů.

Zdroj

ScienceDaily. (2024, March 18). Two artificial intelligences talk to each other. ScienceDaily. https://www.sciencedaily.com/releases/2024/03/240318142438.htm