Elon Musk a jeho společnost xAI představili nejnovější model umělé inteligence Grok 4, který okamžitě zaujal pozornost díky svému výkonu v předních světových benchmarcích.
Společnost xAI popři spuštění Grok 4 spustila i exkluzivní předplatitelský program SuperGrok Heavy za 300 dolarů měsíčně, čímž se xAI zařadila mezi nejdražší AI služby na trhu.
Grok 4: Výkon, který překonává konkurenci
Model Grok 4 je dostupný přes web, aplikaci nebo účet na X (bývalý Twitter), přičemž základní předplatné stojí 30 dolarů měsíčně nebo 300 dolarů ročně. Pro náročné uživatele je určen balíček SuperGrok Heavy za 300 dolarů měsíčně, který nabízí přednostní přístup k nejvýkonnější verzi Grok 4 Heavy a novým funkcím ještě před jejich veřejným uvolněním.
Elon Musk během představení prohlásil, že „Grok 4 je lepší než PhD úroveň v každém oboru, bez výjimky.“
Zároveň přiznal, že model občas může postrádat zdravý rozum, ale podle něj je jen otázkou času, kdy AI začne objevovat nové technologie či dokonce fyzikální zákony.
Benchmarky a dominance na trhu
Grok 4 dosáhl rekordních 73 bodů v Artificial Analysis Intelligence Index, čímž překonal i špičkové modely jako OpenAI o3-pro (ChatGPT) a Gemini 2.5 Pro (Google), které získaly po 70 bodech. Tento index zahrnuje kombinované výsledky z nejnáročnějších testů:
- MMLU-Pro (všeobecné znalosti)
- GPQA Diamond (vědecké a biologické otázky)
- Humanity’s Last Exam (logika a zdravý rozum)
- LiveCodeBench (programování)
- SciCode (vědecké a programátorské úkoly)
- AIME (pokročilá matematika)
- MATH-500 (velmi těžká matematika)
V testu Humanity’s Last Exam získal Grok 4 skóre 25,4 % bez nástrojů a až 44,4 % s nástroji, čímž výrazně překonal Gemini 2.5 Pro (21,6 % bez nástrojů, 26,9 % s nástroji) a OpenAI o3 (high) (21 %).
Na testu ARC-AGI-2, který prověřuje schopnosti AI v abstraktním myšlení a adaptivním porozumění, dosáhl Grok 4 rekordních 16,2 %, což je téměř dvojnásobek oproti nejbližšímu konkurentovi Claude Opus 4.
Kontroverze a budoucí vývoj
Spuštění Grok 4 provázely i kontroverze. Krátce před oficiálním uvedením musela společnost xAI řešit incident, kdy AI model zveřejnil na síti X antisemitské komentáře. Firma následně upravila systémové pokyny modelu a odstranila problematické části.
Navzdory špičkovým výsledkům a technologickému náskoku bude muset xAI přesvědčit podniky i širší veřejnost, že Grok 4 je spolehlivou alternativou k modelům ChatGPT, Claude či Gemini.
Budoucí plány xAI
xAI plánuje v nejbližších měsících představit další specializované modely:
- srpen: AI model pro programování
- září: multimodální agent
- říjen: model pro generování videí







