V oblasti jazykových modelů, které jsou tradičně dostupné přes API, se v poslední době začíná objevovat trend otevřených modelů. Tento pojem můžeme interpretovat jako snahu o demokratizaci přístupu k umělé inteligenci. Příkladem je francouzský AI start-up Mistral, který v červnu zaznamenal významný úspěch ve fázi získávání financí. Nedávno představili svůj první model, Mistral 7B, který, jak tvrdí, převyšuje výkonnostně ostatní modely stejné velikosti a je navíc zdarma a bez jakýchkoli omezení k používání.
Model je dostupný jak na GitHubu, tak skrze Torrenty
Model Mistral 7B je nabízen v různých formátech pro stažení, přičemž jednou z nejvýznamnějších možností je 13,4-gigabajtový torrent. Tento způsob distribuce je podstatný z hlediska efektivity a dostupnosti, neboť torrent funguje na principu peer-to-peer sdílení. V tomto kontextu je „seeder“ uživatel, který již stáhl kompletní soubor a nyní jej poskytuje ostatním uživatelům ke stažení. Vysoký počet seedrů, v tomto případě stovky, znamená, že mnoho uživatelů již soubor stáhlo a nyní jej aktivně distribuují, což výrazně zvyšuje rychlost a spolehlivost stažení pro nové uživatele.
Kromě toho společnost Mistral založila repozitář na GitHubu a vytvořila komunikační kanál na Discordu. Tento krok umožňuje uživatelům Mistral 7B vzájemně spolupracovat a efektivně řešit technické problémy nebo sdílet nápady na vylepšení a využití modelu. Tato iniciativa podporuje komunitní přístup a otevřený dialog mezi uživateli, což je v souladu s filozofií otevřeného přístupu k technologii.
Klíčovým aspektem je, že Mistral 7B byl uvolněn pod licencí Apache 2.0. Tato licence je známá svou liberálností, neklade omezení na použití či reprodukci, požaduje pouze uvedení autorství. Díky tomu je model Mistral 7B přístupný široké škále uživatelů, od amatérů až po nadnárodní korporace a dokonce i pro organizace jako Pentagon, pokud mají k dispozici adekvátní systém pro lokální provoz modelu nebo jsou ochotni investovat do potřebných cloudových zdrojů.
Obrázek 1 – DALL-E 3: MistraAI v Matrix pojetí
Levnější a dostupnější
Mistral 7B reprezentuje významný krok vpřed v oblasti „malých“ velkých jazykových modelů, jako je Llama 2 od Mety. Poskytuje srovnatelné schopnosti, a to za znatelně nižších výpočetních nákladů. Na rozdíl od robustnějších modelů, jako je GPT-4, které nabízejí širší rozsah funkcí, ale vyžadují větší výpočetní kapacitu a jsou složitější na provoz, je Mistral 7B snadněji dostupný a provozovatelný.
V blogovém příspěvku týmu Mistral, který doprovázel uvolnění modelu, je zdůrazněn jejich cíl stát se předním podporovatelem komunity otevřené generativní AI a posunout otevřené modely na úroveň špičkových výkonů. Výkon Mistral 7B je prezentován jako příklad potenciálu malých modelů, vytvořený během tří měsíců intenzivní práce, během kterých byl sestaven tým Mistral AI, vybudován výkonný systém MLops a navržen sofistikovaný datový zpracovatelský pipeline (komplexní sada procesů a nástrojů sloužících k efektivnímu a systematickému zpracování a analýze dat).
Zajímavé je, že zakladatelé společnosti Mistral mají zkušenosti s podobnými modely z práce v Meta a Google DeepMind, což jim poskytlo cenné know-how pro tento projekt.
Je nicméně důležité poznamenat, že i když je Mistral 7B volně ke stažení a používání, nejedná se o „open source“ v tradičním smyslu tohoto termínu. Ačkoli je licence velmi liberální, model byl vyvinut soukromě, s využitím soukromých finančních prostředků. Kromě toho datové sady a váhy jsou rovněž soukromé.
Obrázek 2 – DALL-E 3: čip integrovaný v obvodu
Zdarma, ale jen do určité míry
Obchodní strategie společnosti Mistral se zdá být založena na poskytnutí základního modelu zdarma, s možností upgradu na placený produkt pro ty, kteří hledají pokročilejší funkce a možnosti. Podle jejich blogového příspěvku, plánují distribuovat komerční produkt jako tzv. „white-box“ řešení, což znamená, že zákazníkům budou k dispozici jak váhy (použité v neuronové síti), tak zdrojový kód modelu. Tento přístup je zřetelně zaměřen na podnikové klienty, pro které je přístup k zdrojovým kódům a možnost přizpůsobení modelu dle vlastních potřeb klíčový. Mistral také pracuje na hostovaných řešeních a věnovaných implementacích pro podnikové sektory.
V reakci na dotazy ohledně budoucích plánů a procesů společnosti, generální ředitel Arthur Mensch uvedl, že ne všechny budoucí modely budou uvolněny pod licencí Apache 2.0. Pro větší modely bude Mistral upřednostňovat distribuci prostřednictvím API, pravděpodobně za poplatek, spíše než přístupem „udělej si sám“ (DIY). Mensch se dále zdráhal poskytnout podrobnosti o tréninkových procesech a sestavování datových sad, naznačujíc, že tyto informace jsou momentálně považovány za firemní tajemství.
Shrnutí
- Francouzský AI startup Mistral uvolnil svůj první jazykový model Mistral 7B zdarma, který je dostupný ke stažení různými způsoby, včetně torrentu.
- Model je uvolněn pod licencí Apache 2.0, umožňující široké využití bez omezení s výjimkou uvedení autorství.
- Mistral 7B nabízí podobné schopnosti jako jiné „malé“ velké jazykové modely, ale s menšími výpočetními náklady.
- Mistral plánuje distribuovat komerční produkty jako white-box řešení, zahrnující váhy a zdrojové kódy, a pracuje na hostovaných řešeních pro podniky.
Zdroj:
- Coldewey, D. (2023, October 16). Mistral AI makes its first large language model free for everyone. TechCrunch. https://techcrunch.com/2023/09/27/mistral-ai-makes-its-first-large-language-model-free-for-everyone/