Ainovinky.cz
Váš přístup k informacím o umělé inteligenci...
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
AI Nástroje
Ainovinky.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
Ainovinky.cz
Výsledek nenalezen
Zobrazit všechny výsledky

Nový test OpenAI ukazuje, že GPT-5 se v mnohém vyrovná člověku

Od ainovinky
27 září, 2025
Kategorie: chatboti, ChatGPT a texty
OpenAI GPT-5 se vyrovná lidem v prác

OpenAI GPT-5 se vyrovná lidem v prác

Nový benchmark GDPval od OpenAI testuje modely umělé inteligence v porovnání s lidskými profesionály.

Nový benchmark od OpenAI

Společnost OpenAI ve čtvrtek představila nový benchmark s názvem GDPval, jehož cílem je porovnat výkonnost jejích modelů umělé inteligence s lidskými profesionály v širokém spektru odvětví a pracovních pozic.

Tento test je pokusem zjistit, jak blízko jsou systémy OpenAI k překonání lidí v ekonomicky hodnotné práci, což je klíčová součást mise společnosti vyvinout umělou obecnou inteligenci (AGI).

Podle OpenAI se ukázalo, že její model GPT-5 a konkurenční Claude Opus 4.1 od společnosti Anthropic „se už blíží kvalitě práce produkované odborníky v daném odvětví“.

To však neznamená, že modely OpenAI okamžitě nahradí lidi na jejich pracovních pozicích. OpenAI připouští, že GDPval v současnosti pokrývá jen velmi omezený počet úkolů, které lidé vykonávají ve své reálné práci.

GDPval je založen na devíti odvětvích, která nejvíce přispívají k hrubému domácímu produktu USA, včetně oblastí jako zdravotnictví, finance, výroba a vláda. Benchmark testuje výkonnost modelu AI ve 44 povoláních v těchto odvětvích – od softwarových inženýrů po zdravotní sestry a novináře.

Graf GDPval

Výsledky a budoucnost

V první verzi testu, GDPval-v0, OpenAI požádala zkušené profesionály, aby porovnali zprávy vygenerované umělou inteligencí se zprávami od jiných profesionálů a vybrali tu nejlepší.

V případě GPT-5-high, vylepšené verze GPT-5 s dodatečným výpočetním výkonem, byl model AI hodnocen jako lepší nebo na stejné úrovni jako odborníci v daném odvětví v 40,6 % případů.

OpenAI také testovala model Claude Opus 4.1 od Anthropic, který byl hodnocen jako lepší nebo na stejné úrovni jako odborníci v 49 % úloh. OpenAI se domnívá, že Claude dosáhl tak vysokého skóre díky své tendenci vytvářet příjemnou grafiku, a ne pouze díky samotnému výkonu.

Je důležité poznamenat, že většina pracujících profesionálů dělá mnohem více než jen odevzdávání výzkumných zpráv, což je zatím všechno, co GDPval-v0 testuje. OpenAI si to uvědomuje a plánuje do budoucna vytvořit robustnější testy, které budou schopné zohlednit více odvětví a interaktivních pracovních postupů.

Hlavní ekonom OpenAI, Dr. Aaron Chatterji, v rozhovoru pro TechCrunch uvedl, že výsledky GDPval naznačují, že lidé v těchto profesích mohou nyní využívat modely AI k tomu, aby se věnovali smysluplnějším úkolům.

„Protože se model v některých z těchto věcí zlepšuje,“ říká Chatterji, „lidé v těchto zaměstnáních mohou nyní model využívat k odlehčení části své práce a vykonávání potenciálně hodnotnějších činností.“

Vedoucí hodnocení v OpenAI, Tejal Patwardhan, pro TechCrunch uvedla, že je povzbuzená rychlostí pokroku v rámci GDPval. Model GPT-4o od OpenAI, který byl vydán zhruba před 15 měsíci, dosáhl jen 13,7 % (výher a remíz ve srovnání s lidmi). Nyní GPT-5 dosahuje téměř trojnásobku, což je trend, který Patwardhan očekává, že bude pokračovat.

Tagy: ai chatbotichatGPT
Sdílet2Tweet1Odeslat

Mohlo by Vás zajímat

Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch
chatboti

Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

Anthropic spustil funkci Dispatch, která umožňuje ovládat počítač přes Claude z mobilu. Co je Dispatch a jak funguje Anthropic představil...

Od ainovinky
18 března, 2026
Nvidia vstupuje do světa AI agentů s NemoClaw
chatboti

Nvidia vstupuje do světa AI agentů s NemoClaw

Nvidia představila na konferenci GTC 2026 novou platformu pro podnikové AI agenty postavenou na populárním OpenClaw. Co je NemoClaw a...

Od ainovinky
17 března, 2026
Nvidia představila AI, která zdokonaluje grafiku (nejen) her
AI video

Nvidia představila AI, která zdokonaluje grafiku (nejen) her

Nová technologie neuronového vykreslování má na podzim změnit vizuální kvalitu her i podnikových systémů. Šéf Nvidie Jensen Huang v pondělí...

Od ainovinky
17 března, 2026
Muž vytvořil vakcínu proti rakovině pro svého psa – pomohl mu ChatGPT
chatboti

Muž vytvořil vakcínu proti rakovině pro svého psa – pomohl mu ChatGPT

Australský technologický podnikatel s pomocí umělé inteligence navrhl první personalizovanou mRNA vakcínu pro psa. Když veterináři v roce 2024 diagnostikovali...

Od ainovinky
16 března, 2026
AI agent Perplexity Computer je nově dostupný i pro předplatitele Pro
chatboti

AI agent Perplexity Computer je nově dostupný i pro předplatitele Pro

Perplexity rozšiřuje přístup ke svému AI agentovi Computer také pro běžné předplatitele Pro. Co je Perplexity Computer a proč se...

Od ainovinky
13 března, 2026
Claude kreslí grafy a diagramy přímo v chatu. A zdarma!
chatboti

Claude kreslí grafy a diagramy přímo v chatu. A zdarma!

Anthropic spustil v Claude funkci, která mění způsob, jakým umělá inteligence vysvětluje složitá témata. Konec nudných textových odpovědí Anthropic vydal...

Od ainovinky
13 března, 2026
  • Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    32 sdílení
    Sdílet 13 Tweet 8
  • Claude kreslí grafy a diagramy přímo v chatu. A zdarma!

    18 sdílení
    Sdílet 7 Tweet 5
  • Perplexity chce nahradit váš počítač umělou inteligencí

    17 sdílení
    Sdílet 7 Tweet 4
  • Muž vytvořil vakcínu proti rakovině pro svého psa – pomohl mu ChatGPT

    13 sdílení
    Sdílet 5 Tweet 3
  • AI agent Perplexity Computer je nově dostupný i pro předplatitele Pro

    21 sdílení
    Sdílet 8 Tweet 5

Oblíbené kategorie

  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní

O nás

  • Kontakt
AI nástroje
Umělá inteligence (AI) pro mnohé představuje budoucnost informatiky, byznysu i každodenního života.Pojďme se společně podívat, jaké jsou současné trendy ve využívání umělé inteligence a co nám může nabídnout do budoucna.
Copyright © 2026 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
AI Nástroje

Copyright © 2024 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz