Anthropic uvádí Claude 4: Nové špičkové AI modely

Společnost Anthropic představila nejnovější generaci modelů Claude Opus 4 a Claude Sonnet 4, které nastavují nové standardy v oblasti kódování, pokročilého uvažování a autonomních AI agentů.

Nejnovější modely Claude 4 od Anthropic dosahují rekordních výsledků v kódování a zvládají dlouhodobé úlohy s vysokou přesností. Pojďme se na ně podívat detailněji.

Video: A day with Claude (Den s Claudem):

Claude Opus 4: Nejvýkonnější model pro složité úkoly a kódování

Vlajková loď Claude Opus 4 je podle společnosti Anthropic „nejlepší model na kódování na světě“. V nezávislých testech dokázal pracovat autonomně až sedm hodin bez zásahu člověka, což dramaticky rozšiřuje možnosti AI agentů v reálných produkčních workflow.

Model exceluje v dlouhodobých úlohách vyžadujících tisíce kroků a udržuje vysokou konzistenci i při velkých projektech.

Na benchmarku SWE-bench Verified, který hodnotí schopnost modelů řešit skutečné úlohy z GitHubu, dosáhl Opus 4 skóre 72,5 %, čímž překonal konkurenci jako GPT-4.1 (69,1 %) či Gemini 2.5 Pro (63,2 %).

V testech dlouhotrvajících úloh (například refaktorování velkého open-source projektu) dokázal udržet kontext a přesnost po celých sedm hodin, což je výrazně více než konkurenční modely, které zvládnou maximálně 1,5–2 hodiny.

Claude Opus 4 je optimalizovaný pro agentové workflow, kde je potřeba plánování, rozkládání abstraktních projektů, udržování kvality kódu a zpracování rozsáhlých kontextů. O novince informovala společnost i na sociální síti X.

Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.

Claude Opus 4 is our most powerful model yet, and the world’s best coding model.

Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9
— Anthropic (@AnthropicAI) May 22, 2025

Claude Sonnet 4: Efektivita, dostupnost a pokročilé uvažování

Claude Sonnet 4 je navržen jako cenově dostupnější alternativa s důrazem na efektivitu a univerzálnost. Oproti předchozí verzi Sonnet 3.7 přináší výrazné zlepšení v kódování, uvažování a přesnosti odpovědí. V benchmarku SWE-bench Verified dokonce mírně překonal Opus 4 se skóre 72,7 %.

Modely Claude 4 jsou až o 65 % méně náchylné na obcházení pravidel a využívání zkratek oproti Sonnet 3.7, což zvyšuje jejich spolehlivost při dlouhodobých a kritických úlohách.

Při přístupu k lokálním souborům dokáží efektivněji ukládat a využívat klíčové informace, čímž zlepšují kontinuitu a budování „tacitního poznání“ během dlouhých projektů, jak uvádí oficiální oznámení.

Benchmarky předních modelů a výsledky Claude 4 Sonnet a Claude 4 Opus:

Výsledky benchmarků Claude 4, zdroj: felloai.com

Hybridní režimy a nové funkce

Oba modely nabízejí dva režimy práce: rychlé odpovědi pro běžné úkoly a „rozšířené uvažování“ pro komplexní, vícestupňová zadání.

Novinkou je také funkce „thinking summaries“, která shrnuje uvažovací proces modelu do přehledných výstupů.

Modely dokáží paralelně využívat externí nástroje (např. web search) a v beta režimu přepínat mezi režimy podle potřeby úlohy.

Claude Code, agentický nástroj pro práci s kódem, je po úspěšném preview dostupný pro veřejnost a integruje se s vývojářskými nástroji jako VS Code a JetBrains.

Dostupnost a ceny

Claude Opus 4: Přes API pro vývojáře $15 za milion vstupních tokenů, $75 za milion výstupních tokenů.
Claude Sonnet 4: Přes API pro vývojáře $3 za milion vstupních tokenů, $15 za milion výstupních tokenů.

Oba modely jsou dostupné přes Anthropic API, Amazon Bedrock a Google Cloud Vertex AI.

Kromě toho jsou dostupné přes webové rozhraní a mobilní aplikace pro běžné uživatele. Sonnet 4 je dokonce dostupný i pro bezplatné uživatele, zatímco Opus 4 je součástí placených plánů.