V nedávné době představil mezinárodní tým vědců nový projekt s názvem Polymathic AI. Tento ambiciózní projekt se zaměřuje na vývoj umělé inteligence, která se neustále vzdělává prostřednictvím dat a simulací z různých vědeckých disciplín. Cílem je objevovat nové poznatky a propojovat různé obory vědy.
Hlavní myšlenkou iniciativy Polymathic AI je urychlit vývoj univerzálních základních modelů pro aplikace strojového učení v rámci vědeckého výzkumu. Projekt se snaží rozšířit výhody základních modelů, které byly dosud úspěšně využívány v oblastech jako je zpracování obrazů nebo jazyka, do širšího spektra vědeckého strojového učení.
Za touto inovativní iniciativou stojí skupina odborníků z prestižních vědeckých institucí a univerzit. Mezi spolupracujícími institucemi nalezneme Simons Foundation a Flatiron Institute, New York University, University of Cambridge, Princeton University a Lawrence Berkeley National Laboratory. Tým zahrnuje specialisty z oblastí fyziky, astrofyziky, matematiky, umělé inteligence a neurovědy. Jejich interdisciplinární přístup slibuje nové možnosti v oblasti technologického výzkumu a inovací.
Je důležité poznamenat, že oznámení o iniciativě bylo učiněno současně s publikací souvisejících vědeckých článků na arXiv.org, otevřeném repozitáři pro předběžné verze vědeckých prací.
Obrázek 1 – Midjourney: Neonpunk man standing on the street
Základní model pro vědu
Shirley Ho, ředitelka projektu a vedoucí skupiny v prestižním Centru pro výpočetní astrofyziku Flatiron Institute v New Yorku, zdůrazňuje revoluční potenciál tohoto projektu. Podle ní může Polymathic AI „radikálně transformovat způsob, jakým vědci využívají umělou inteligenci a strojové učení ve svých výzkumech.“
Jedním z klíčových aspektů tohoto přístupu je využití předem vyškolených, či základních modelů. Tyto modely, které již prošly určitým výcvikem, mohou být ve vědeckém výzkumu aplikovány rychleji a s větší přesností, než kdyby se celý model tvořil od základu. Toto platí i v situacích, kdy tréninková data nejsou přímo spojena s konkrétním vědeckým problémem.
Nicméně vývoj takových modelů přináší své výzvy. Hlavním úkolem je vytvoření modelu umělé inteligence, která je schopna zpracovávat a kombinovat informace z různorodých datových sad a z různých vědeckých disciplín. Zatímco v oblastech jako je zpracování přirozeného jazyka existují standardní reprezentace, například ve formě textu, ve vědě takový standard často chybí. Toto představuje pro výzkumníky novou a vzrušující výzvu. Ku příkladu ve vědecké sféře se spíše používají čísla, a to zejména v oblastech statistiky, astrofyziky nebo geologie.
Přesnost číselné reprezentace
Věda si totiž zakládá na přesnosti a jednoznačnosti – právě tyto dva elementy se nejlépe dají reprezentovat matematickými modely a s nimi souvisejícími čísly, která z měření a výpočtů vyjdou. 2 + 2 = 4, nikdy ne 5 ani 3. Jelikož jsou ale tyto číselné údaje značně abstraktní, je nutno je pro laickou veřejnost převádět do textové podoby. Z toho důvodu v předpovědi počasí budete spíše slýchávat příchod „silného“ deště a „vysoké“ oblačnosti“. Samozřejmě k tomu meteorologové pár číselných údajů doplní, ale kdyby celé počasí bylo znázorněno v „číslech“ asi byste toho tolik nepochytili. Dalším důvodem, proč text není úplně vyhovující je jeho častá dvojznačnost – ačkoli cílem vědeckých článků a prací je psát, pokud možno co nejvíce objektivně, jako lidé jsme přirozeně náchylní k různým sklonům, stereotypům a mentálním modelům, které si v průběhu života tvoříme. Často se pak může stát, že i vědec může mylně číselné výsledky zkreslit anebo, že si je poté čtenář, který danému tématu tolik nerozumí, špatně vyloží. Naproti tomu čísla hovoří jasně. Pak je samozřejmě otázkou, jestli jsou čísla správná, ale to bychom se už začali dostávat příliš daleko.
Obrázek 2 – Midjourney: Falling Numbers in Cyberspace
Polymathic AI proto považuje čísla za skutečná čísla, nikoli za znaky, jako jsou písmena a interpunkce. Tréninková data se skládají ze skutečných vědeckých datových sad, které zachycují základní fyziku vesmíru. AI model je navržen tak, aby se učil z numerických dat a fyzikálních simulací v různých vědeckých oborech, čímž pomáhá modelovat jevy, jako jsou obří hvězdy a klima Země.
Modely vyvinuté v rámci této iniciativy mohou poté sloužit jako výchozí bod a vědci je mohou upravit pro konkrétní aplikace. To znamená, že cílem Polymathicu je vytvoření základního modelu pro vědecké účely – model bude poté možnost modifikovat a upravit pro určité potřeby daného oboru – globální změna klimatu, vesmíru, umělé inteligence apod.
Interdisciplinární výzkum na Polymathic AI
Miles Cranmer, jeden z hlavních architektů projektu a významný člen Katedry aplikované matematiky a teoretické fyziky a Institutu astronomie na University of Cambridge, zdůrazňuje komplexní výzvy spojené s implementací základních modelů v akademickém výzkumu. Podle něj je jedním z největších překážek vysoký výpočetní náklad. Avšak díky partnerství se Simons Foundation má tým k dispozici nezbytné zdroje, které umožňují testování a optimalizaci těchto modelů pro vědecké účely. Koneckonců samotný model by poté mohl přispět k hledání řešení pro zefektivnění chodu výpočetní techniky pro AI, programy a algoritmy. Problémem se samozřejmě stávají abnormální teploty, které z důsledku obrovského vytížení výpočetní techniky vzniká. Následkem toho je zapotřebí zajistit kvalitní víceúrovňové chlazení. To však vyžaduje velkou energetickou spotřebu a rozsáhlé vodní zdroje, což pochopitelně sebou nese i dopad na životní prostředí.
Nabízí se tak dvě nejvíce intuitivní možnosti – najít efektivnější a méně nákladný způsob chlazení anebo zefektivnit celkový software, tj. snížit množství kroků a výpočtů potřebných k dosažení daného cíle (například vygenerovat obrázek nebo text).
Obrázek 3 – Man gazing at the stars
Jeden model jim všem vládne…
Siavash Golkar, další klíčový člen týmu a hostující vědec v Centru pro výpočetní astrofyziku Flatiron Institute, vnímá Polymathic AI jako revoluční nástroj. Jeho hlavní předností je schopnost propojovat různé vědecké disciplíny a objevovat mezi nimi nové souvislosti. Díky tomu může AI efektivně kombinovat data z různých oblastí a zároveň udržovat krok s nejnovějšími pokroky v několika disciplínách.
François Lanusse, kosmolog z renomovaného Centre national de la recherche scientifique (CNRS) ve Francii a další spoluiniciátor projektu, přidává další perspektivu. Upozorňuje, že Polymathic AI nebude mít omezení typická pro tradiční AI nástroje, které jsou často uzpůsobeny pro specifické úkoly či data – zadání textového příkazu (vygeneruj mi básničku) a vydání textového výsledku (básnička). Naopak, Polymathic AI bude schopna čerpat informace z různých zdrojů a vědeckých oblastí, což jí umožní aplikovat své multidisciplinární znalosti na široké spektrum výzkumných otázek.
Shirley Ho zdůrazňuje význam transparentnosti a otevřenosti v projektu Polymathic AI a říká, že cílem je demokratizovat AI pro vědu a poskytnout předem vyškolený model, který může zlepšit vědeckou analýzu různých otázek a oblastí.
Sumarizace
- Polymathic AI: Jedná se o nový projekt mezinárodního týmu vědců, který se zaměřuje na vývoj umělé inteligence schopné učit se z dat a simulací z různých vědeckých disciplín. Cílem je propojovat různé obory vědy a objevovat nové poznatky.
- Základní modely: Hlavním cílem iniciativy je rozšířit výhody základních modelů, které byly dosud využívány v oblastech jako je zpracování obrazů nebo jazyka, do širšího spektra vědeckého strojového učení.
- Výzvy a řešení: Vývoj modelů přináší výzvy, zejména v oblasti výpočetních nákladů a zpracování heterogenních dat. Díky partnerství se Simons Foundation má tým k dispozici potřebné zdroje pro tento úkol. Polymathic AI je navržena tak, aby efektivně kombinovala data z různých oblastí a zároveň udržovala krok s nejnovějšími pokroky v několika disciplínách.
- Transparentnost a demokratizace AI: Shirley Ho zdůrazňuje význam transparentnosti v projektu a ambici demokratizovat AI pro vědu. Cílem je poskytnout předem vyškolený model, který může zlepšit vědeckou analýzu různých otázek a oblastí.