Zpravodajský gigant s relativně malým týmem vytvořil generativní umělou inteligenci, která podle něj překonává konkurenci v oblasti informačních služeb specifických pro oblast financí.
Bloomberg je bezesporu světově nejznámější zpravodajskou agenturou v sektoru finančnictví. Nyní se její vývojáři naplno vrhli do dobývání umělé inteligence – a rovnou vytvořili vlastní nástroj pro zpracování informací.
Na začátku tohoto měsíce společnost oznámila, že vytvořila novou platformu, která dostala (ne právě dvakrát originální) pojmenování BloombergGPT. Představit si ji můžeme jako počítač, jehož cílem je mít k dispozici všechna data, která zná její mateřská společnost – a mít je seřazeny a utříděny pěkně na jednom místě.
3. dubna Bloomberg následně zveřejnil výzkumnou zprávu, v níž podrobně popisuje vývoj nového rozsáhlého generativního modelu umělé inteligence BloombergGPT™. Tento rozsáhlý jazykový model (LLM) byl speciálně vycvičen na široké škále finančních dat, aby podporoval různorodé úlohy zpracování přirozeného jazyka (NLP – natural language processing, neplést s neurolingvistickým programováním, které má stejnou zkratku) ve finančním odvětví.
Nedávné pokroky v oblasti umělé inteligence (AI) založené na LLM již daly vzniknout velice zajímavým aplikacím s využitím v mnoha oblastech. Složitost a jedinečná terminologie finanční oblasti však vyžaduje model specifický právě pro tento sektor.
BloombergGPT tak představuje potenciální inovací pro celý svět finančního zpravodajství. Tento model pomůže společnosti Bloomberg zlepšit stávající úlohy NLP v oblasti financí, jako je mimo jiné analýza tržního sentimentu, rozpoznávání atypických trendů, klasifikace zpráv a zodpovídání potenciálních otázek. Kromě toho BloombergGPT uvolní nové příležitosti pro využití obrovského množství dat dostupných v databázích společnosti Bloomberg. Tím bude zákazníkům společnosti přinášet lepší služby, a zároveň přinese plný potenciál umělé inteligence do finanční oblasti. Bloomberg sice již dlouhá desetiletí shromažďuje všemožná data, s jejich následným využitím je to ale složitější. Pro člověka jde o opravdu nezpracovatelné bloky dat, automatizovaným nástrojům zase chyběla potřebná pečlivost a smysl pro logickou práci s detailem – tedy až dosud.
K jak velkému objemu dat má BloombergGPT přístup?
Společnost uvádí, že její zbrusu nová technologie byla trénována na souboru dat o velikosti více než 700 miliard tokenů. Pro srovnání, GPT-3 byl vytrénován na přibližně 500 miliardách tokenů dat. (Společnost OpenAI nicméně odmítla sdělit jakékoli číslo platné pro GPT-4, se kterým bychom tuto metriku mohli srovnat. Důvodem je prý rostoucí konkurenční prostředí v sektoru AI).
Co všechno se skrývá v těchto tréninkových datech? Z více než 700 milionů tokenů pochází 363 miliard z vlastních finančních dat společnosti Bloomberg, tedy z informací, které tvoří znalostní databázi určenou pro klienty společnosti. Podle jejího vedení se přitom má jednat o dosud největší soubor dat specifických pro danou oblast“. Dalších 345 miliard tokenů pochází z datových sad obecných informací získaných z jiných blíže nespecifikovaných zdrojů
Soubor vlastních dat společnosti, hromadně nazvaný jako FinPile, se skládá ze širokého spektra řady finančních dokumentů v anglickém jazyce, včetně zpráv, podání, tiskových zpráv, webových finančních dokumentů a dat získaných sociálních médií z archivů společnosti Bloomberg. Pokud jste tedy v posledních letech četli nějaký článek v Bloomberg Businessweek, je tam. Stejně tak jsou tam dokumenty americké komise SEC, přepisy televizních pořadů z dílny Bloomberu, údaje ze zasedání amerického Federálního rezervního systému a další údaje relevantní pro finanční trhy. Chatbot je také vytrénován na zpravodajských zdrojích, které nejsou nepocházejí z Bloombergu. Nástroj nicméně ke dnešnímu dni ještě nebyl zpřístupněn pro veřejnost – jeho kvality tedy nedokážeme zatím posoudit.
Inspirace pro další společnosti i celá odvětví
Finanční sektor je poměrně specifický. Pokud se úspěšnost tohoto modelu od společnosti Bloomberg potvrdí, nepochybně bude mít potenciál stát se precedensem pro další sektory a zpravodajské společnosti. Popularita ChatGPT je obrovská – a teď si představte podobný nástroj vyškolený na práci s daty ze specifické oblasti – a bez chyb nebo nepřesných informací.