Omezené schopnosti generativní AI: Proč AGI ještě není tady?

Ačkoli jsou nejnovější počítačové systémy opravdu velmi působivé, obvykle selhávají v úkolech vyžadujících zobecnění konceptů, které jsou jinak pro pro lidi snadné. Od severního postupu vražedných včel v 80. letech snad nic nevyděsilo tvůrce titulků tolik jako vzestup umělé inteligence. Od chvíle, kdy počítač Deep Blue porazil šachového mistra Garryho Kasparova v roce 1997, lidé čelí vyhlídce, že jejich nadřazenost nad stroji nebude trvat dlouho. Od té doby bylo ale snadné dokázat, že člověk je pořád intelektuálně vyspělejší než jakýkoliv sofistikovaný algoritmus. Raná umělá inteligence dělala chyby v přepisování řeči, diagnostikování nemocí a komunikaci obecně. Teda až doteď…

Vzestup hlubokého učení

Přibližně před deseti lety získaly počítačové systémy, známé jako neuronové sítě, nový impuls díky metodě hlubokého učení. Najednou se totiž počítače přiblížily lidským schopnostem v rozpoznávání obrázků, čtení značek a vylepšování fotografií – nemluvě o převodu řeči na text na úrovni srovnatelné s lidskými písaři. Tyto schopnosti však měly své limity. I úspěšné neuronové sítě byly snadno zmatené – několik malých nálepek strategicky umístěných na stopce způsobilo, že si AI myslela, že značka říká něco úplně jiného. Z toho důvodu musely být tyto chytré počítače důkladně natrénovány na konkrétní úkoly. Hluboké učení tedy produkovalo vynikající výsledky pro úzce zaměřené úkoly, ale nedokázalo dobře přizpůsobit tuto odbornost jiným oblastem. Vznikla tak klasická umělá inteligence, která excelovala v daném úkolu, na nějž byla zaměřena, ale už byla absolutně neschopná v jiných úkolech.

Obsah obrázku Vesmír, prostor, mlhovina, hvězda

Popis byl vytvořen automaticky

Obrázek 1 – DALL-E 3: Neuronová síť

Generativní AI a současná situace

Nyní jsme v nové éře AI, říká Melanie Mitchell, odbornice na umělou inteligenci ze Santa Fe Institute v Novém Mexiku. „Jsme za revolucí hlubokého učení z roku 2010 a nyní se nacházíme v éře generativní AI.“ Generativní AI systémy mohou produkovat věci, které byly dlouho považovány za výsadu lidské kreativity. Tyto systémy mohou nyní odpovídat na otázky se zdánlivou lidskou jazykovou dovedností a znalostmi, psát básně a články, vytvářet umělecká díla, a dokonce i videa na vyžádání.

Modely velkých jazyků (LLMs)

Mnohé z těchto schopností vycházejí z vývoje modelů velkých jazyků (LLMs), jako je ChatGPT a další podobné modely. Tyto modely jsou velké, protože jsou trénovány na obrovském množství dat – v podstatě na veškerých datech dostupných na internetu, a to včetně digitalizovaných kopií nespočtu tištěných knih. Velké může také znamenat velké množství různých věcí, které mohou „naučit“ při čtení – nejen slova, ale i kořeny slov, fráze, symboly a matematické rovnice. Díky identifikaci vzorů v kombinaci těchto jazykových struktur mohou LLM modely předpovědět, v jakém pořadí by měla být slova sestavena, aby vytvořila srozumitelné věty.

Kritika a schopnosti LLM modelů

Navzdory tomu kritici tvrdí, že LLMs ve skutečnosti jen kalkulují pravděpodobnosti o tom, jaké slovo by mělo následovat po jiném. Díky tomuto kontextuálnímu doplňování slov pak vznik celá věta. Někteří kritici považují tento systém za „autocorrect na steroidech“. I přes tuto kritiku ale LLM modely vykázaly pozoruhodné schopnosti – ať už se jedná o sestavování textů ve stylu daného autora, řešení hádanek nebo rozpoznávání z kontextu. „Tyto věci se zdají být opravdu chytré,“ řekla Mitchell tento měsíc v Denveru na výročním zasedání Americké asociace pro pokrok vědy. Je tomu ale skutečně tak? Jsou systémy opravdu tak chytré anebo jen slepě dosazují slovo za slovem, tón za tónem, obrázek za obrázkem s tak dobrou přesností, že se nám zdá, že chytré opravdu jsou?

Obrázek 2 – DALL-E 3: Silikonový mozek na obvodové desce

Digitální versus biologická neuronová síť

Museli bychom se pak i zamyslet nad tím, do jaké míry jsme my lidé v tomhle směru lidí? Už od počátečního věku se v našem mozku generují spojení mezi jednotlivými neurony. Počet neuronů se odhaduje na zhruba 86 miliard, přičemž počet synapsí se může pohybovat až kolem 100 biliónů. Každé spojení mezi jednotlivými neurony se pak posiluje anebo zhoršuje na základě toho, jak moc se dané spojení využívá. Ku příkladu budeme-li mít spojení mezi Brnem a Prahou, silnice bude stále udržovaná, poněvadž se používá ve vysoké míře. Naopak nepoužívaná polní cesta postupně zaroste až zanikne úplně. Na podobném principu fungují neuronová spojení. Proto přísloví: „Opakování je matka moudrosti.“, má i své neurovědecké opodstatnění.

Umělá inteligence tak v podstatě může být velmi raná fáze mozku postaveného na silikonových obvodech, která ale postrádá komplexnost a energetickou efektivitu. To by se ale za chvíli mohlo změnit. Nicméně vývoj našeho mozku zabral několik miliard let. První chatbot, který se mohl pokoušet o Turingův test, byl chatbot „ELIZA“. Chatbot byl vyvíjen od roku 1964 do roku 1967 na MIT Josephem Wizenbauem. Od té doby jsme ušli ani ne 60 let a pokrok, kterého jsme za tu dobu dosáhli je v porovnání s časem, po němž se vyvíjel lidský mozek, zcela neporovnatelný. Tento koncept exponenciálního vývoje je nastíněn i v seriálu „The three body problém“ – upřímně mohu rozhodně doporučit.

Obrázek 3 – chatbot ELIZA

Obavy a naděje…

Příchod LLMs vyvolává v technologickém světě masové hysterie mezi některými odborníky, kteří se obávají, že LLMs by mohly zvýšit nezaměstnanost, zničit civilizaci a vyhnat magazínové sloupkaře z podnikání. Jiní odborníci však tvrdí, že takové obavy jsou velmi přehnané. Jádrem debaty je, zda LLMs skutečně rozumí tomu, co říkají a dělají, místo toho, aby jen předstírali, že tomu opravdu rozumí. Někteří výzkumníci navrhli, že LLMs rozumí, mohou uvažovat jako lidé nebo dokonce dosáhnout formy vědomí. Mitchell a další však trvají na tom, že LLMs (zatím) opravdu nerozumějí světu (alespoň ne v žádném smyslu, který by odpovídal lidskému porozumění). Jak říká Melanie Mitchell: „Skutečně pozoruhodné na lidech je, že dokážeme abstraktně aplikovat naše koncepty na nové situace prostřednictvím analogie a metafory.“

Shrnutí

Generativní AI: Nová éra generativní AI umožňuje tvorbu lidsky působících textů a umění, ale má omezenou schopnost aplikovat naučené koncepty na nové situace.
LLMs a jejich omezení: Modely velkých jazyků jako ChatGPT mohou předpovídat sekvence slov, ale skutečné porozumění světu jim chybí.
Debata o porozumění: Někteří vědci věří, že LLMs mohou dosáhnout lidského porozumění, ale současné modely toho zatím nejsou schopné.
Budoucnost AI: LLMs učí jazyk a pokoušejí se abstraktně aplikovat koncepty, což je opačný směr než u lidí, kteří se učí koncepty před jazykem.

Zdroj

Siegfried, T., & Temming, M. (2024, February 28). Why large language models aren’t headed toward humanlike understanding. Science News. https://www.sciencenews.org/article/ai-large-language-model-understanding
Wikimedia Foundation. (2024, May 18). Eliza. Wikipedia. https://en.wikipedia.org/wiki/ELIZA