Ainovinky.cz
Váš přístup k informacím o umělé inteligenci...
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
AI Nástroje
Ainovinky.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
Výsledek nenalezen
Zobrazit všechny výsledky
Ainovinky.cz
Výsledek nenalezen
Zobrazit všechny výsledky

EMU: Nový AI generativní model přímo v Meta aplikacích

Od David Kovář
30 září, 2023
Kategorie: Novinky
Zdroj: prompt [Marc Zuckerberg writing a code in his flat in Washington for the artifical intelligence, he is deeply focused, around him is a modern futuristic equipment and the brand of the Meta, from the windows we can see a Washington city in the night, digital art, high contrast]

Zdroj: prompt [Marc Zuckerberg writing a code in his flat in Washington for the artifical intelligence, he is deeply focused, around him is a modern futuristic equipment and the brand of the Meta, from the windows we can see a Washington city in the night, digital art, high contrast]

V nedávné době představila technologická společnost Meta AI inovativní projekt, který názorně ukazuje, jak umělá inteligence může proměnit vizuální narativ. Meta AI, lídr v oblasti rozvíjejícího se konceptu Metaverse, odhalila svůj nejnovější projekt s názvem „Emu“. Co je vlastně Emu? Jde o technologii, která se soustředí na precizní generování obrázků s vysokým estetickým citem díky využití umělé inteligence. Podle všeho by obrázky měli být vygenerovány do 5 sekund.

Pokud vás zaráží termín „Metaverse“, jedná se o digitální paralelní vesmír, kde mohou uživatelé interagovat s prostředím a ostatními uživateli. Meta se snaží vytyčit cestu v tomto novém směru a jejich projekt Emu je jen jedním z mnoha kroků v jejich ambiciózní vizi.

Trénování modelu na 1,1 miliardách parametrů

V srdci tohoto průkopnického přístupu stojí dvouetapová metoda, která začíná intenzivním předtréninkem. Difuzní model je nejdříve vyživován masivním množstvím dat, konkrétně je obohacen o 1,1 miliardy kombinací obrázek-text, které jsou čerpány z databází Meta AI. 

Model U-Net, který je základní kámen této inovace, je technologický obr s obrovskými 2,8 miliardami parametrů. Je podporován textovými kodéry CLIP ViT-L a T5-XXL. Tyto technologické nástroje nejsou jen obyčejnými modely; reperezentují špičkový výzkum a vývoj v oblasti umělé inteligence. V kombinaci tito giganti usilují o jedno: vytvářet obrázky s rozlišením 1024×1024 pixelů.

Obsah obrázku strom, umění, obraz, mrak

Popis byl vytvořen automaticky

Obrázek 1 – Midjourney: Surrealism Tree

Rigorózní filtrování datových sad

Je důležité si uvědomit, že vytvoření takto sofistikované databáze není pouhým shromažďováním dat. Za každým obrázkem a textovým segmentem, který Meta AI zahrnula do svého projektu, stojí pečlivý výběrový proces, který je klíčový pro dosažení požadované kvality.

V oblasti tvorby obsahu generovaného umělou inteligencí je klíčová kvalita a kontrola dat. Společnost Meta AI využívá několik filtrů k zajištění integrity své datové sady. Z více než miliardy příkladů je pečlivě vyřazeno přes 200,000 vzorků. Při filtrování vstupují do hry různé mechanismy:

Hodnocení estetiky

Klasifikátory se používají k hodnocení estetiky obrázků. Tento krok umožňuje odstranění obrázků, které nesplňují požadované vizuální standardy.

Filtrování obsahu

Existují mechanismy, které odstraňují nežádoucí obsah. To zajišťuje, že generované obrázky nejenže vypadají vizuálně přitažlivě, ale také odpovídají komunitním směrnicím a etickým normám. Avšak, je třeba se ptát, zda je tento proces dokonalý a zda nemůže dojít k nežádoucí cenzuře? Ačkoli je cenzura do jisté míry nezbytná, v mnoha případech pak může být cenzura nežádoucí, a to z důsledku omezení, která mohou bránit umělcům ve tvorbě.

Vyloučení textu

Obrázky, které obsahují významné množství textu, jsou vyloučeny s využitím optického rozpoznávání znaků (OCR). To zajišťuje, že hlavní důraz zůstává na vizuálním aspektu. 

Kontroly rozlišení a proporcí

Obrázky, které nesplňují předdefinovaná kritéria rozlišení a proporcí, jsou filtrovány. To zajistí jednotnost datové sady.

Metriky popularity

I metriky popularity, jako jsou „lajky“, hrají roli při filtraci, což dále vyladí datovou sadu. Zde je však otázka, zda popularita by měla být rozhodujícím kritériem, neboť ne vždy je synonymem kvality.

Přísná korekce modelu

Ve vytváření databáze se podílí několik aktérů, přičemž každý má svou specifickou roli a znalosti. Po strojové filtraci a analýze dat přichází na řadu ruční kontrola, která je zaměřena na finalizaci datové sady.

Daný tým hodnotí obrázky z širšího úhlu pohledu. Jejich hlavním úkolem je kriticky zhodnotit obsah a rozhodnout, zdali je vhodný či nikoli. Z původního množství v databázi tak zůstalo pouze 20 000 vzorků. To je ale jen jedna fáze procesu. Poté nastupují specialisté, kteří se věnují detailnější kontrole.

Fotografický tým má specifické znalosti v oblasti vizuálního hodnocení. Jejich dovednosti zahrnují znalost kompozice, osvětlení a barevných schémat. Každý obrázek je pečlivě zkoumán z hlediska různých kritérií, například výběru barvy, rozmístění prvků nebo způsobu osvětlení scény.

A konečně, jako poslední krok, je pro vybrané obrázky vytvořena kvalitní textová anotace, která poskytuje hlubší kontext a smysl obrázku, a to nejen pro lidi, ale i samotné AI modely, které tak lépe dokáží rozpoznat, co je hlavním předmětem obrázku.

Obsah obrázku květina, obraz, příroda, území

Popis byl vytvořen automaticky

Obrázek 2 – Midjourney: Flower in the desert

Kvalita nad kvantitou

Při tréninkové fázi Emu modelu je třeba poznamenat, že tento model byl trénován na 15 000 krocích s dávkou o velikosti pouhých 64. Ačkoli může tento počet vypadat maličký ve srovnání s jinými generativními modely, lidská hodnocení a pozorování naznačují opak. Pro doplnění zde uvedu, že tréninkový krok (epocha) popisuje průchod AI modelu celým datasetem, zatímco dávka je počet vzorců dat, které model v průběhu jednoho průchodu datasetem projde. To tedy znamená, že v průběhu celého trénování prošel AI model 960 000 datovými vzorky (15 000 × 64).

Shrnutí

  • Meta představuje nový AI model s názvem. „EMU“, který bude implementován do aplikací jako Instagram nebo Facebook.
  • Emu (expressive media universe) má být určen pro generování obrázků, jejich upravování či další editaci, a to přímo v prostředí Meta aplikací.
  • Emu model prošel řadou filtrů a korekcí s cílem zajistit co nejlepší kvalitu a preciznost modelu. 
Tagy: meta
SdíletTweetOdeslat

Mohlo by Vás zajímat

ChatGPT testuje další novinku: Skupinové chaty!
Novinky

ChatGPT testuje další novinku: Skupinové chaty!

OpenAI spustila v některých regionech pilotní program skupinových chatů v ChatGPT, který umožňuje až dvaceti uživatelům spolupracovat v jedné konverzaci...

Od ainovinky
14 listopadu, 2025
Elon Musk Grokipedia
chatboti

Elon Musk rozjíždí konkurenci pro Wikipedii – Je tu Grokipedie 0.1!

Spuštění úvodní verze AI encyklopedie Grokipedia od Elona Muska rozvířilo debatu o hranicích umělé inteligence a budoucnosti znalostních platforem. Nový...

Od ainovinky
28 října, 2025
ChatGPT osobní problémy
chatboti

OpenAI: Lidé se s ChatGPT velmi často baví i o sebevraždě

Otevřená data o duševním zdraví uživatelů ChatGPT ukazují, že umělá inteligence denně řeší ty nejcitlivější lidské otázky.Společnost OpenAI zveřejnila průlomové...

Od ainovinky
28 října, 2025
Chatgpt Konektory
chatboti

ChatGPT posiluje týmovou práci: Představuje sdílené projekty a inteligentní konektory

OpenAI představuje nové nástroje pro ChatGPT, které usnadňují týmovou spolupráci a zvyšují firemní bezpečnost. Spolupráce na projektech v reálném čase...

Od ainovinky
29 září, 2025
Gemini zrychluje
chatboti

Google zrychluje a zefektivňuje AI modely Gemini!

Společnost Google představila vylepšené verze svých modelů umělé inteligence Gemini 2.5 Flash a Flash-Lite. Výrazně úspornější a inteligentnější modely Technologický...

Od ainovinky
29 září, 2025
Meta ukázala AI brýle Ray-Ban s displejem
Novinky

Meta představila inteligentní AI brýle s displejem za 799 dolarů

Společnost Meta odhalila nové brýle Ray-Ban s displejem, které se ovládají futuristickým náramkem. Revoluce na zápěstí i před očima Generální...

Od ainovinky
18 září, 2025
  • Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    Ovládejte Claude Cowork z telefonu pomocí funkce Dispatch

    32 sdílení
    Sdílet 13 Tweet 8
  • Claude kreslí grafy a diagramy přímo v chatu. A zdarma!

    18 sdílení
    Sdílet 7 Tweet 5
  • Perplexity chce nahradit váš počítač umělou inteligencí

    17 sdílení
    Sdílet 7 Tweet 4
  • Muž vytvořil vakcínu proti rakovině pro svého psa – pomohl mu ChatGPT

    13 sdílení
    Sdílet 5 Tweet 3
  • AI agent Perplexity Computer je nově dostupný i pro předplatitele Pro

    21 sdílení
    Sdílet 8 Tweet 5

Oblíbené kategorie

  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní

O nás

  • Kontakt
AI nástroje
Umělá inteligence (AI) pro mnohé představuje budoucnost informatiky, byznysu i každodenního života.Pojďme se společně podívat, jaké jsou současné trendy ve využívání umělé inteligence a co nám může nabídnout do budoucna.
Copyright © 2026 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz
  • Hlavní stránka
  • Novinky
  • Chatboti
  • AI obrázky
  • AI video
  • Ostatní
AI Nástroje

Copyright © 2024 Ainovinky.cz. Všechna práva vyhrazena.
Pod správou Tobynet.cz