Ve vývoji umělé inteligence došlo k pozoruhodnému milníku, když Claude 3 od Anthropic překonal GPT-4 od OpenAI v populární platformě pro hodnocení jazykových modelů, známé jako Chatbot Aréna. Tento vývoj, který se odehrál v úterý, signalizuje první sesazení GPT-4 z čela žebříčku od spuštění Arény v květnu 2023. Význam tohoto momentu není možné přehlédnout, vzhledem k tomu, že GPT-4, model pohánějící ChatGPT, si udržel prvenství konzistentně od svého prvního nasazení 14. března 2023.
Tento přelomový okamžik zaznamenal vývojář softwaru Nick Dobos, jehož tweet o srovnání GPT-4 Turbo a Claude 3 Opus získal širokou pozornost na sociálních médiích. „Král je mrtev,“ prohlásil, což odzvonilo konci éry dominance GPT-4 v tomto segmentu. Navíc, další varianty Anthropic, jako je Haiku, si získaly uznání pro svůj výkon, což poukazuje na širší trend diverzifikace v oblasti poskytovatelů AI.

Obrázek 1 – Výsledky z Chatbot arény
Chatbot Aréna: Platforma pro hodnocení AI modelů
Chatbot Aréna, projekt Large Model Systems Organization, spojuje výzkumné síly univerzit jako UC Berkeley a Carnegie Mellon University. Platforma nabízí uživatelům interaktivní prostředí, kde mohou porovnávat výstupy z různých jazykových modelů a na základě subjektivního hodnocení pomáhat určovat, který model je „nejlepší“. Tento přístup se ukázal být klíčový pro překonání výzev spojených s objektivním měřením výkonu AI, a zdůrazňuje důležitost subjektivních dojmů, neboli „vibes“, v kontextu hodnocení kvality.
Změny v tržní dominanci a uživatelské preference
Vzestup Claude 3 tak vyvolává otázky o budoucnosti trhu s AI asistenty, kde dominance OpenAI může být nyní vyzvána novými inovativními přístupy. Někteří uživatelé již začali preferovat Claude 3 nad ChatGPT pro své každodenní použití, což signalizuje potenciální změnu v tržních trendech. Navíc, s nástupem modelů jako Gemini Advanced od Googlu, se konkurenční prostředí stává ještě dynamičtějším.
Tento vývoj nejenže ukazuje na vzrůstající diverzifikaci v oblasti poskytovatelů AI, ale také nastiňuje budoucnost plnou inovací a konkurence. Očekává se, že OpenAI představí nové modely, potenciálně zahajující další kapitolu v této fascinující éře umělé inteligence. Potenciálně bychom se tak mohli dočkat modelu GPT-5, již dříve zmiňovaného nástupce GPT-4, ještě dříve než bylo původně zamýšleno. Jak se prostor pro jazykové modely AI rozvíjí, je jasné, že budeme svědky dalších přelomových změn, které budou mít významný dopad na to, jak interagujeme s technologiemi založenými na umělé inteligenci.
Shrnutí
- Claude 3 od Anthropic poprvé překonal GPT-4 od OpenAI na populární platformě Chatbot Aréna, ukazujíc na změnu v AI jazykových modelech.
- Tento úspěch Claude 3 značí první sesazení GPT-4 z prvního místa od založení Chatbot Arény v květnu 2023.
- Chatbot Aréna, využívaná k hodnocení AI modelů, kombinuje vstupy od uživatelů k určení „nejlepších“ modelů na základě subjektivních kritérií.
- Významný je i příspěvek Anthropic’s Haiku a rostoucí konkurence v prostoru AI asistentů, signalizující dynamický vývoj v oblasti LLM.
Zdroj:
- Benj Edwards – Mar 27, 2024 4:32 pm UTC. (2024, March 27). “The king is dead”-claude 3 surpasses GPT-4 on Chatbot Arena for the first time. Ars Technica. https://arstechnica.com/information-technology/2024/03/the-king-is-dead-claude-3-surpasses-gpt-4-on-chatbot-arena-for-the-first-time/?ref=futuretools.io







