V posledních letech jsme svědky narůstajícího trendu v oblasti generativní obrázkové AI jako Midjourney, Leonardo AI nebo Stability Diffusion. Tyto modely měly za úkol tvořit obrázky, které odpovídali restrikcím vývojářů, což ale některé uživatele svazovalo a omezovalo. Netrvalo tak dlouho a začali se na scéně objevovat i méně cenzurované AI modely, které však svými výstupy dokázaly spíše odradit než zaujmout. Vzhledem ale k tomu, jak se technologie neustále posouvají a inovují, došlo i na tento segment AI nástrojů, které už v tuto chvíli dokáží vytvářet velmi autentický obsah pro dospělé.
Před necelým rokem informoval portál TechCrunch o prvních pokusech o vytvoření AI generátorů pro obsah pro dospělé. Tehdy byly tyto aplikace v počátečních fázích svého vývoje a jejich výsledky byly daleko od dokonalosti. Modely, na nichž byly tyto aplikace založeny, často narážely na problémy s interpretací anatomických detailů, což vedlo k vytváření vizuálně zkreslených a často bizarních obrazů. Například synteticky vytvořené postavy mohly mít končetiny na místech, kde bychom očekávali obličej, což vyvolávalo znepokojení a otázky o kvalitě těchto technologií.
Avšak pokrok v oblasti AI, jak jsem se zmínil, je velmi rychlý. V současnosti při zadání fráze do vyhledávače „AI generátor obsahu pro dospělé“, se nám objeví desítky aplikací, z nichž mnohé jsou k dispozici zdarma. A ačkoli výsledné obrázky stále svými výsledky tolik neohromují, některé z nich jsou schopné dosáhnout kvality srovnatelné s profesionálním uměním. To samozřejmě nedává spát etickým myslitelům, kteří si tak nyní musí lámat hlavu s tím, jaké regulace by se v oblasti AI pornografického obsahu měly zavést.
Obrázek 1 – Midjourney: a woman with white dress and dark long hair (NiJi)
Alarmující zneužití pornografické AI v praxi
Jak se stávají generativní AI technologie a nástroje pro tvorbu AI generovaného obsahu pro dospělé stále dostupnějšími, začínají mít alarmující dopad na společnost.
Brandon Ewing, známý v online komunitě jako Atrioc, byl nedávno odhalen během živého vysílání, když prohlížel deepfake obrázky známých streamerek z platformy Twitch, vytvořené bez jejich souhlasu. Autor těchto obrázků nakonec pod tlakem veřejnosti souhlasil s jejich odstraněním. Avšak následky jeho činů setrvaly.
Většina pornografických deepfaků na internetu zobrazuje ženy, které bývají často zneužívány. Washington Post nedávno informoval o případu učitelky z malého města, která přišla o práci poté, co se rodiče studentů dozvěděli o AI generovaném obsahu vytvořeném bez jejího vědomí. V jiném případě byl mladík ve věku 22 let odsouzen k šesti měsícům vězení za vytvoření sexuálně explicitních deepfake z fotografií nezletilých dívek získaných ze sociálních sítí.
Dále bychom neměli opomenout, že byl zaznamenán i nárůst fotorealistického AI generovaného obsahu zobrazujícího děti, který se šíří na dark webu. V jednom zveřejněném případě byl 15letý chlapec vydírán členem online fitness komunity, který upravil fotografii chlapcova hrudníku pomocí generativní AI do explicitní podoby. Pro představu představte si, kdyby vás někdo vyfotil či si stáhnul vaši fotografii ze sociálních sítí a následně by z vás prakticky přes noc udělal pornografickou hvězdu. Nejenže by vám tak mohl zruinovat kariéru, ale i sociální život.
Na platformě Reddit byli někteří uživatelé oklamáni prodejci AI generovaných obrázků, které zobrazovaly neexistující osoby. Není se tak čemu divit, když profesionálové v průmyslu pro dospělé vyjadřují obavy o budoucnost svého odvětví v důsledku těchto technologií.
Nicméně i přes všechny tyto kontroverze a etické otázky pokračuje Unstable Diffusion, jedna z průkopnických skupin v oblasti generativního obsahu pro dospělé, ve své činnosti. A právě si o ní v tomto článku povíme.
Vstup Unstable Diffusion
Když byl model AI Stable Diffusion, určený k převodu textu na obrázek a vyvinutý renomovanou společností Stability AI, uveden na trh koncem minulého roku, netrvalo dlouho, než se objevily jeho nežádoucí využití. Internetová komunita rychle objevila potenciál tohoto nástroje v oblasti tvorby obsahu pro dospělé. Skupina s názvem Unstable Diffusion začala získávat popularitu na platformě Reddit a následně se přesunula na Discord. Postupem času se vedení této skupiny začalo věnovat výzkumu a vývoji vlastních modelů generujících obsah pro dospělé, inspirovaných technologií Stable Diffusion, s ambicí své výtvory monetizovat.
Model Stable Diffusion, podobně jako ostatní AI systémy pro převod textu na obrázek, byl vyškolen na obrovském datasetu obsahujícím miliardy většinou explicitních obrázků. Tímto způsobem se naučil rozpoznávat a vytvářet asociace mezi textovými popisy a vizuálními reprezentacemi. Například slovo „pták“ může v kontextu odkazovat na různé druhy ptáků, od modráků přes andulky až po orly bělohlavé, ale také na mnohem abstraktnější pojmy a koncepty v podobě mužského přirození.
Obrázek 2 – Midjourney: Knight with his mighty sword, dark souls style
Unstable Diffusion: Klasický generátor obrázků nebo jen porno model?
Přestože jen malá část datasetu Stable Diffusion obsahuje NSFW (not safe for work) materiál, administrátoři Unstable Diffusion shledali potřebu jemného doladění modelu pro dospělý obsah. Aby dosáhli lepších výsledků, naverbovali dobrovolníky, převážně členy svého Discord serveru, k vytvoření specializovaných porno datasetů.
Navzdory několika překážkám, včetně zákazů na platformách jako Kickstarter a Patreon, se Unstable Diffusion podařilo spustit svou vlastní webovou stránku s unikátními generativními modely. Po získání finanční podpory ve výši více než 26 000 dolarů, pořízení potřebného hardwaru a vytvoření datasetu s více než 30 miliony obrázků, spustili platformu, která dnes slouží více než 350 000 uživatelům ke generování více než půl milionu obrázků denně.
Snaha o podpoření svobody projevu
Arman Chaudhry, spoluzakladatel Unstable Diffusion a Equilibrium AI, zdůrazňuje, že hlavní mise skupiny zůstává neměnná: vytvořit platformu pro AI umění, která „podporuje svobodu projevu“. V e-mailovém rozhovoru portálu TechCrunch sdělil: „Chceme, aby naše webová stránka a prémiové služby byly více než jen nástroji. Jsou to místa, kde může kreativita kvést bez zbytečných omezení. Věříme v necenzurované umění ve všech jeho formách, a toto vedení nás inspiruje v našem přístupu k AI.“
Server Unstable Diffusion na Discordu, kde komunita sdílí většinu svého umění, odráží tuto filozofii. Server je rozdělen do dvou hlavních kategorií, „SFW“ a „NSFW“, přičemž druhá kategorie má více podkategorií. Zatímco SFW obsahuje obrázky zvířat, jídla či krajin, NSFW kategorie zahrnuje explicitní obrázky různých skupin lidí a pornografického obsahu, včetně nonbinárních osob, furries a dalších.
Při posledním zkoumání Unstable Diffusion, se zdálo, že celý server by mohl být jednoduše onálepkován jako „odporný“. Vzhledem k omezeným tréninkovým datům a technickým překážkám se modely komunity na konci roku 2022 potýkaly s řadou obtíží při vytváření obrázků, které měly k fotorealismu velmi daleko.
Fotorealistické zobrazení stále představuje výzvu. Avšak nyní mnoho děl vytvořených modely Unstable Diffusion – ať už v anime stylu, s buňkovým stínováním či jinými technikami – vykazuje alespoň anatomickou přesnost. V některých vzácných případech lze takové obrázky pokládat i za velmi kvalitní a téměř nerozpoznatelné od reality.
Zlepšující se kvalita
Mnoho vizuálního obsahu na Discordovém serveru Unstable Diffusion je kombinací různých nástrojů, modelů a platforem, a ne pouze výsledkem webové aplikace Unstable Diffusion.
Na první pohled aplikace Unstable Diffusion nepůsobí jako něco, co by bylo spojeno s pornografií. Nabízí jednoduché uživatelské rozhraní s možnostmi post-zpracování obrázků, jako je saturace, poměr stran či rychlost generování. Unstable Diffusion také umožňuje specifikovat, co chcete z generovaných obrázků vynechat. A vzhledem k tomu, že se jedná o komerční platformu, nabízí placené plány, při nichž dostanete sadu výhod – rychlejší generování obrázků, více kreditů apod.
Pochopitelně, abych si udělal o modelu ucelený osobní přehled, rozhodl jsem se ho také vyzkoušet. Mé experimenty s webovým rozhraním Unstable Diffusion pak přinesly smíšené výsledky. Modely zřejmě nemají úplné porozumění pro intimní interakce, což vedlo k některým bizarním výsledkům – od podivných výrazů v obličeji, přes nemožné pozice, až po nepřirozené zobrazení genitálií. Zjistil jsem, že čím jednodušší je zadání (např. jednoduché pin-up obrázky), tím lepší jsou výsledky. Složitější scény, zejména ty zahrnující více postav, často vedly k bizarním a někdy až děsivým kompozicím. Ve výsledku si tak nejlépe vedly obrázky spadající do anime kategorie a obrázky, které zahrnovaly jen jednu osobu.
Obrázek 3 – Midjourney: Rose, cinematic proffesional photo
Nerovnováha tréninkového data-setu
Častěji než ne, když jsou modely Unstable Diffusion vyzvány k vygenerování obrázků „muže“ nebo „ženy“, výsledkem jsou zobrazení bílých nebo asijských jedinců. Toto zobrazení je pravděpodobně odrazem nerovnováhy v tréninkovém datasetu.
Dále, modely mají tendenci generovat stereotypní tělesné typy. Muži jsou často vyobrazeni jako svalnatí a definovaní, s výraznými svaly na břiše. Ženy jsou zobrazovány jako štíhlé s výraznými křivkami a opravdu nadměrným popředím. Ačkoli Unstable Diffusion má schopnost generovat postavy různých tvarů a velikostí, je třeba model výslovně instruovat, aby tak učinil.
Zajímavé zkreslení se objevuje také v kontextu profesních rolí. Pokud je model vyzván k vygenerování obrázku s klíčovým slovem „sekretářka“ bez dalších specifikací, často generuje obrázek asijské ženy v podřízené roli. Toto zobrazení je pravděpodobně důsledkem nadměrného zastoupení této konkrétní konfigurace v tréninkovém datasetu.
Navzdory problémům se zkreslením by se mohlo zdát, že technologické úspěchy Unstable Diffusion by skupinu vedly k většímu zaměření na AI generovaný pornografický obsah. Avšak opak je pravdou.
Model by měl být dostupný pro široké spektrum uživatelům
Ačkoli zakladatelé Unstable Diffusion zůstávají věrní koncepci generativního AI bez omezení, usilují o přijetí více konvenčního a přijatelného image a brandingu pro širší publikum. Tým, nyní složený z pěti členů na plný úvazek, se zaměřuje na přeměnu Unstable Diffusion na platformu poskytující software jako službu (SaaS). Tým dále nabízí předplatné své webové aplikaci za účelem financování vývoje produktu a zlepšení zákaznické podpory.
„Jsme opravdu rádi, že máme za sebou komunitu, která nás silně podporuje. Nicméně si uvědomujeme, že pro posun Unstable Diffusion na vyšší úroveň bychom mohli využít strategických partnerství a dalších investičních příležitostí,“ uvedl Chaudhry. „Chceme se ujistit, že našim předplatitelům budeme poskytovat patřičnou hodnotu v podobě kvalitního generovaného obsahu, zatímco naše platforma zůstane přístupná i začátečníkům v oblasti generativní obrázkové AI.“
Jako další diferenciaci od své liberální obsahové politiky klade Unstable Diffusion velký důraz na personalizaci. Uživatelé mají možnost upravovat barevnou paletu generovaných obrázků, jak poznamenal Chaudhry, a mohou si vybírat z různých uměleckých stylů, včetně „digitálního umění“, „fotografie“, „anime“ a „obecné“.
„Naším cílem je zajistit, aby náš systém mohl generovat vizuálně atraktivní obrázky i z nejjednodušších pokynů, čímž se naše platforma stává přístupnou jak pro nováčky, tak pro zkušené uživatele,“ dodal Chaudhry.
Obrázek 4 – Midjourney: Magical enchanted forest
Zavedené regulace mají předejít právním postihům
V reakci na rostoucí obavy spojené s generativním AI a jeho potenciálním zneužitím se Unstable Diffusion snaží vyvážit svou vizi svobody projevu s odpovědným přístupem k obsahu. Ačkoli jejich hlavním posláním je poskytnout platformu pro AI umění bez omezení, uvědomují si také potřebu stanovení jistých hranic a regulací, aby se vyhnuli právním problémům.
Unstable Diffusion se proto rozhodla investovat do robustního systému moderace obsahu. Tento systém je navržen tak, aby identifikoval a blokoval obsah, který by mohl být považován za nelegální nebo kontroverzní, včetně pornografických deepfake celebrit a obrázků zobrazujících postavy, které jsou nebo vypadají mladší 18 let.
Ačkoli některé z těchto opatření mohou být vnímány jako omezení svobody projevu, Unstable Diffusion je považuje za nezbytné k ochraně své platformy a jejich uživatelů před možnými právními problémy. V USA, kde je sdílení nekonsensuálního AI generovaného porna stále více regulováno, je tento přístup obzvláště důležitý.
Chaudhry a jeho tým věří, že jejich technologie může mít pozitivní dopad na společnost tím, že pomůže lidem lépe porozumět svým tělům a sexualitě. Ačkoli mohou existovat obavy ohledně potenciálního zneužití generativního AI, Unstable Diffusion se snaží poskytnout nástroje, které umožňují lidem vyjádřit se a oslavovat svou individualitu.
V konečném důsledku je cílem Unstable Diffusion vytvořit platformu, která je jak inkluzivní, tak odpovědná. Ačkoli cesta k dosažení této vize může být plná výzev, Chaudhry a jeho tým jsou odhodláni pokračovat ve své misi a vytvářet nástroje, které umožňují lidem vyjádřit svou kreativitu a individualitu v bezpečném a podporujícím prostředí.
Obrázek 5 – Midjourney: woman in a snowy town, medieval, fantasy
Výhled do budoucna
Unstable Diffusion je na prahu nové éry AI umění, kde technologie a kreativita se spojují, aby vytvořily nové formy vizuálního vyjádření. S ambicemi stát se lídrem v oblasti AI umění, se skupina nejenže zaměřuje na technické inovace, ale také na budování silných partnerství v průmyslu.
Vize skupiny je jasná: posunout hranice možností v AI umění a poskytnout platformu, kde lidé mohou svobodně experimentovat a sdílet své umění. Toto je v souladu s jejich základním posláním podporovat svobodu projevu a kreativity. Samozřejmě se zde ihned nabízí skeptická otázka, do jaké míry se jedná spíše o „obkecávací“ řeči, jejichž cílem je ochránit platformu před okamžitou nálepkou pornografického portálu. Osobně tak spíše zastávám názor, že hlavní důvod návštěvnosti vychází hlavně z možnosti tvořit sexuální obsah. Při zkoušení i ne-explicitních příkazů jsem dostal obrázky, které v porovnání s obrázky například od Leonardo AI (zdarma AI model) velice zaostávali. Nedělám si tak iluzi, za jakých účelem uživatelé na platformu nejspíše opravdu chodí. Mohu se ale mýlit.
Rozšíření partnerství a spolupráce s dalšími firmami v oboru je klíčovým krokem k dosažení této vize. Spoluprací s dalšími hráči v oboru může Unstable Diffusion získat přístup k novým nástrojům, technologiím a zdrojům, které mohou pomoci vylepšit jejich platformu a poskytnout lepší služby své stále vzrůstající komunitě.
Nicméně, jak se AI umění stává stále populárnějším, vznikají také nové výzvy. Zkreslení v datech, etické dilema kolem generovaného obsahu a právní otázky jsou jen některými z problémů, kterým bude muset skupina čelit.
Ačkoli je budoucnost AI generovaného porna nejasná, je zřejmé, že technologie bude mít hluboký dopad na společnost. Jak se postoj společnosti k sexualitě a tělu mění, bude mít AI umění stále větší roli v tom, jak se můžeme vyjadřovat. Bohužel s tím ale souvisí i velmi temný scénář těžké závislosti na pornografickém obsahu kvůli moderním technologiím. Pro ty, kteří si chtějí rozšířit obzory, velmi doporučuji seriál Black Mirror, díl: Striking Vipers. Myslím si však, že do budoucna bude vhodné tento trend sledovat, už jen z toho důvody, abychom nemuseli jednou čelit nepříjemnému překvapení v podobě globálního pornografického problému.
Na závěr pakliže by Vás model zajímat a měli byste chuť si ho vyzkoušet (samozřejmě z informativních důvodů ;-)), následujte tento odkaz, kde se můžete přihlásit před discord či google účet: Unstable Diffusion (unstability.ai)
Shrnutí
- Generativní obrázková AI: V posledních letech narůstá popularita generativních obrázkových AI, jako jsou Midjourney, Leonardo AI a Stability Diffusion. Původně byly tyto modely navrženy tak, aby vytvářely obrázky podle specifikací vývojářů, ale brzy se objevily méně cenzurované verze, které mohly vytvářet obsah pro dospělé.
- Problémy s generativní AI: Přestože technologie AI rychle pokračuje, výsledky generovaného obsahu pro dospělé často vyvolávají kontroverze. Byly hlášeny případy zneužití, například deepfake obrázky známých osobností vytvořené bez jejich souhlasu nebo obrázky zobrazující nezletilé osoby.
- Unstable Diffusion: Skupina Unstable Diffusion, inspirovaná technologií Stable Diffusion, se zaměřila na vytváření generativního obsahu pro dospělé. Přestože se potýkala s technickými a etickými problémy, pokračuje ve své činnosti a snaží se vytvořit platformu, která podporuje svobodu projevu a kreativitu.
- Regulace a odpovědnost: V reakci na kontroverze a právní obavy investovala Unstable Diffusion do systému moderace obsahu, který identifikuje a blokuje potenciálně kontroverzní obsah. Skupina se snaží vyvážit svou vizi svobody projevu s odpovědným přístupem k obsahu.
- Budoucnost AI umění: Ačkoli je budoucnost AI generovaného porna nejasná, technologie bude mít hluboký dopad na společnost. Unstable Diffusion se snaží rozšířit partnerství a spolupracovat s dalšími firmami v oboru, aby čelila novým výzvám a poskytovala lepší služby své komunitě.