Společnost Apple představila revoluční AI systém ReALM, který otevírá nové možnosti v interakci s digitálním obsahem. Díky schopnosti převádět informace z obrazovky do textové podoby, ReALM poskytuje uživatelům výjimečně přizpůsobivou a inteligentní pomoc při používání zařízení. Tento krok následuje po akvizici společnosti DarwinAI a signalizuje Applovu ambici v oblasti AI technologií.
Jasně, mnozí z vás si teď řeknou: „Převod informací z obrazovky do textové podoby? Neumí dnes tohle pomalu každá dnešní jednoduchá aplikace?“ Pravda je, že OCR (Optical Character Recognition) vzniklo již v 60 letech 20. století v Japonsku, která měla sloužit pro rozpoznávání číslic na poštovních obálkách. ReALM je ale něčím jiné. Konkrétně tím, že s textem nadále dokáže pracovat, a to dokonce mnohem lépe než jeden z nejlepších modelů současnosti, GPT-4.
V čem ReALM vyniká?
Významným přínosem ReALM je jeho schopnost „vidět“ a reagovat na obsah na obrazovce, což umožňuje například Siri inovativně a efektivně spravovat požadavky uživatelů. Příkladem je snadné volání podniků přímo z webových stránek bez nutnosti manuálního vyhledávání kontaktů.
ReALM může revolucionizovat mnoho oblastí, od zlepšení asistence při navigaci na webových stránkách až po efektivnější zákaznickou podporu. Představte si, že během procházení webu můžete jednoduše požádat Siri, aby provedla rezervaci v restauraci, aniž byste museli manuálně vyhledávat kontaktní údaje. Nebo vám Siri pomůže s odesláním e-mailu tím, že „přečte“ a vyplní potřebné informace z dokumentů otevřených na obrazovce, čímž výrazně usnadní administrativní úkoly.
ReALM překonává GPT-4
Podle nejnovějších výzkumů ReALM výrazně překonává konkurenční model GPT-4 v mnoha úkolech, přestože je stavěn na menším počtu parametrů. Jeho efektivita se projevuje zejména ve zpracování doménově specifických dotazů, kde dokáže lépe pochopit záměr uživatele a poskytnout relevantní odpověď.
In a research paper, Apple researchers introduced ReALM.
— Rowan Cheung (@rowancheung) April 3, 2024
It's a new AI system that can understand on-screen tasks, conversational context, and background processes.
Researchers said it 'substantially outperformed' GPT-4.
Read more: https://t.co/5YY5E0kbsk pic.twitter.com/6M8kQiVnKo
Příslib budoucnosti
Přístup Applu k integraci ReALM do budoucích aktualizací Siri naznačuje směřování k plynulejší a intuitivnější interakci mezi uživatelem a zařízením. Tento vývoj má potenciál zásadně změnit způsob, jakým lidé komunikují se svými inteligentními zařízeními, a posunout hranice možného v oblasti uživatelské zkušenosti.
Shrnutí
- Apple představil ReALM, AI model, který mění způsob interakce s obrazovkou tím, že umožňuje Siri „vidět“ a reagovat na obsah.
- ReALM překonává GPT-4 v efektivitě i přes menší počet parametrů, zejména v doménově specifických dotazech.
- Integrace ReALM do Siri slibuje revoluci v pohodlnosti a intuitivnosti ovládání inteligentních zařízení.
- Apple signalizuje svůj záměr nadále inovovat a posunovat hranice v oblasti umělé inteligence.
Zdroj
- Beri, D. (2024a, April 3). Apple’s realm AI model can “see” and understand screen context; “substantially outperformed” GPT-4. MSPoweruser. https://mspoweruser.com/apples-realm-ai-model-can-see-and-understand-screen-context-substantially-outperformed-gpt-4/?ref=futuretools.io







