Společnost Anthropic představila nejnovější generaci modelů Claude Opus 4 a Claude Sonnet 4, které nastavují nové standardy v oblasti kódování, pokročilého uvažování a autonomních AI agentů.
Nejnovější modely Claude 4 od Anthropic dosahují rekordních výsledků v kódování a zvládají dlouhodobé úlohy s vysokou přesností. Pojďme se na ně podívat detailněji.
Video: A day with Claude (Den s Claudem):
Claude Opus 4: Nejvýkonnější model pro složité úkoly a kódování
Vlajková loď Claude Opus 4 je podle společnosti Anthropic „nejlepší model na kódování na světě“. V nezávislých testech dokázal pracovat autonomně až sedm hodin bez zásahu člověka, což dramaticky rozšiřuje možnosti AI agentů v reálných produkčních workflow.
Model exceluje v dlouhodobých úlohách vyžadujících tisíce kroků a udržuje vysokou konzistenci i při velkých projektech.
Na benchmarku SWE-bench Verified, který hodnotí schopnost modelů řešit skutečné úlohy z GitHubu, dosáhl Opus 4 skóre 72,5 %, čímž překonal konkurenci jako GPT-4.1 (69,1 %) či Gemini 2.5 Pro (63,2 %).
V testech dlouhotrvajících úloh (například refaktorování velkého open-source projektu) dokázal udržet kontext a přesnost po celých sedm hodin, což je výrazně více než konkurenční modely, které zvládnou maximálně 1,5–2 hodiny.
Claude Opus 4 je optimalizovaný pro agentové workflow, kde je potřeba plánování, rozkládání abstraktních projektů, udržování kvality kódu a zpracování rozsáhlých kontextů. O novince informovala společnost i na sociální síti X.
Claude Sonnet 4: Efektivita, dostupnost a pokročilé uvažování
Claude Sonnet 4 je navržen jako cenově dostupnější alternativa s důrazem na efektivitu a univerzálnost. Oproti předchozí verzi Sonnet 3.7 přináší výrazné zlepšení v kódování, uvažování a přesnosti odpovědí. V benchmarku SWE-bench Verified dokonce mírně překonal Opus 4 se skóre 72,7 %.
Modely Claude 4 jsou až o 65 % méně náchylné na obcházení pravidel a využívání zkratek oproti Sonnet 3.7, což zvyšuje jejich spolehlivost při dlouhodobých a kritických úlohách.
Při přístupu k lokálním souborům dokáží efektivněji ukládat a využívat klíčové informace, čímž zlepšují kontinuitu a budování „tacitního poznání“ během dlouhých projektů, jak uvádí oficiální oznámení.
Benchmarky předních modelů a výsledky Claude 4 Sonnet a Claude 4 Opus:

Hybridní režimy a nové funkce
Oba modely nabízejí dva režimy práce: rychlé odpovědi pro běžné úkoly a „rozšířené uvažování“ pro komplexní, vícestupňová zadání.
Novinkou je také funkce „thinking summaries“, která shrnuje uvažovací proces modelu do přehledných výstupů.
Modely dokáží paralelně využívat externí nástroje (např. web search) a v beta režimu přepínat mezi režimy podle potřeby úlohy.
Claude Code, agentický nástroj pro práci s kódem, je po úspěšném preview dostupný pro veřejnost a integruje se s vývojářskými nástroji jako VS Code a JetBrains.
Dostupnost a ceny
- Claude Opus 4: Přes API pro vývojáře $15 za milion vstupních tokenů, $75 za milion výstupních tokenů.
- Claude Sonnet 4: Přes API pro vývojáře $3 za milion vstupních tokenů, $15 za milion výstupních tokenů.
Oba modely jsou dostupné přes Anthropic API, Amazon Bedrock a Google Cloud Vertex AI.
Kromě toho jsou dostupné přes webové rozhraní a mobilní aplikace pro běžné uživatele. Sonnet 4 je dokonce dostupný i pro bezplatné uživatele, zatímco Opus 4 je součástí placených plánů.






