Nový 8miliardový model od čínské společnosti DeepSeek zvládá komplexní úlohy na běžném grafickém čipu, čímž otevírá dveře výkonné AI širšímu okruhu uživatelů.
Čínská společnost DeepSeek představila kompaktní verzi svého špičkového modelu DeepSeek-R1-0528-Qwen3-8B, který zvládá matematické úlohy na úrovni větších konkurentů při spotřebě energie vhodné pro notebook. (Zdroje: TechCrunch a Hesamation na X)
Výkon a benchmarky
Model DeepSeek-R1-0528-Qwen3-8B dosáhl na matematickém testu AIME 2024 skóre 86 %, což je o 10 procentních bodů více než původní model Qwen3-8B.
V žebříčcích předběhl i 235miliardový model Qwen3-235B-thinking a překonal Google Gemini 2.5 Flash v testování komplexních úloh.
V oblasti řešení programátorských problémů na platformě Codeforces model dosáhl percentilu 96,3, což ho řadí mezi top 4 % soutěžících. A při vědeckých otázkách z databáze GPQA Diamond vykazuje úspěšnost 61,1 %. (Více informací: Hugging Face a DavidFSWD na X)
Dostupnost a licencování
Na rozdíl od 671miliardového původního modelu DeepSeek-R1 stačí k běhu komprimované verze jeden grafický čip Nvidia H100 s 80 GB paměti. Vývojáři mohou model integrovat přes open-source knihovny vLLM nebo SGLang.
Licence MIT umožňuje komerční využití, úpravy a distribuci bez omezení. Model je dostupný na platformách Hugging Face, Together AI a OpenRouter, přičemž někteří poskytovatelé nabízejí bezplatné API.







