DeepSeek představil revoluční AI model

Nový 8miliardový model od čínské společnosti DeepSeek zvládá komplexní úlohy na běžném grafickém čipu, čímž otevírá dveře výkonné AI širšímu okruhu uživatelů.

Čínská společnost DeepSeek představila kompaktní verzi svého špičkového modelu DeepSeek-R1-0528-Qwen3-8B, který zvládá matematické úlohy na úrovni větších konkurentů při spotřebě energie vhodné pro notebook. (Zdroje: TechCrunch a Hesamation na X)

DeepSeek-R1-0528-Qwen3-8B running on iPhone 16 with MLX pic.twitter.com/iXvnoPwstd
— ℏεsam (@Hesamation) May 30, 2025

Výkon a benchmarky

Model DeepSeek-R1-0528-Qwen3-8B dosáhl na matematickém testu AIME 2024 skóre 86 %, což je o 10 procentních bodů více než původní model Qwen3-8B.

V žebříčcích předběhl i 235miliardový model Qwen3-235B-thinking a překonal Google Gemini 2.5 Flash v testování komplexních úloh.

V oblasti řešení programátorských problémů na platformě Codeforces model dosáhl percentilu 96,3, což ho řadí mezi top 4 % soutěžících. A při vědeckých otázkách z databáze GPQA Diamond vykazuje úspěšnost 61,1 %. (Více informací: Hugging Face a DavidFSWD na X)

deepseek/deepseek-r1-0528-qwen3-8b kills it in Agentic VSCode tasks.

This model just made a dozen startups obsolete.

Here's a screenshot of me using it for an hour… costs? $0.03 .. it's flying through my code base.

Notice the 80k context, it just eats it up. Doesn't care… pic.twitter.com/WTTmCf5tk5
— fullstack (@DavidFSWD) May 30, 2025

Dostupnost a licencování

Na rozdíl od 671miliardového původního modelu DeepSeek-R1 stačí k běhu komprimované verze jeden grafický čip Nvidia H100 s 80 GB paměti. Vývojáři mohou model integrovat přes open-source knihovny vLLM nebo SGLang.

Licence MIT umožňuje komerční využití, úpravy a distribuci bez omezení. Model je dostupný na platformách Hugging Face, Together AI a OpenRouter, přičemž někteří poskytovatelé nabízejí bezplatné API.

Tagy: deepseek