O parametrech jste již možná slyšeli, je dokonce velmi pravděpodobné, že je používáte v komunikaci s ChatGPT, aniž byste o tom věděli. Nejprve si však definujme, co slovo parametr vůbec znamená. Pojmem parametr se označuje hodnota chování nebo vlastností. Tento výraz se obvykle používá v kontextu strojového učení a programování. Různé parametry mají vliv na různé vlastnosti a chování programů včetně umělé inteligence. Důležité je nicméně zmínit, že parametry jsou modulární, to znamená, že si je můžeme uzpůsobit našim potřebám.
V tomto článku vám ukážeme, jaké parametry lze použít pro ChatGPT, a jak je můžete měnit, abyste dosáhli výsledku, které budou nejvíce odpovídat vašim očekáváním. K tomu Vám poskytnu formule a jednotlivé parametry si ukážeme na příkladech.
Parametry nejspíše již používáte, akorát o tom nevíte
ChatGPT je velmi komplexní model, který nabízí širokou škálu parametrů, jež můžete Vašimi příkazy měnit. A tím i ovlivňovat, jakým způsobem s vámi ChatGPT bude komunikovat. Jak jsem vysvětloval již v jiném článku, napíšete-li ChatGPT, aby její výstup byl objektivní, faktický a držel se tématu, měníte tím její parametr, podle něhož výstup ChatGPT bude méně kreativní a bude disponovat menší slovní zásobou. Naopak napíšete-li ChatGPT, aby její výstup byl kreativní, ChatGPT Vám do svého výstupu zahrne méně faktů, bude méně koherentní a častěji bude zabíhat do vedlejších témat. Hned uvedeme příklad:
Kreativní ChatGPT
A odpověď:
Faktický ChatGPT
A tady máme odpověď:
Jak sami vidíte, ChatGPT bylo schopné vygenerovat dva paragrafy na stejné téma, ale změnou jejich vnitřních parametrů, jsme dosáhli zcela odlišného výstupu (jehož jádro však zůstává stejné). Oba vygenerované texty se budou hodit pro zcela odlišné účely. Je proto důležité vědět, jak parametry nastavit, aby textový výstup odpovídal vašim potřebám. Nyní si ukážeme několik hlavních parametrů, a jaký je jejich význam. Jejich pochopení Vám přinese jasnější pohled na fungování ChatGPT.
Druhy parametrů a jejich funkce
Temperature (Hodnota: 0 až 1)
Funkce: Řídí náhodnost a kreativitu generovaného textu. Při nízkých hodnotách jsou výstupy více faktické a koherentní, zatímco při vysokých hodnotách je text rozmanitější, kreativnější a s bohatší slovní zásobou.
Diversity_penalty (Hodnota: 0 až 2)
Funkce: Má vliv na různorodost textu. Vyšší hodnoty vedou k rozmanitějšímu textu, zatímco nižší hodnoty mohou působit strojově a může zde být obsaženo větší množství repetitivních frází.
Max tokens (Hodnota: libovolné kladné celé číslo)
Funkce: Určuje délku textu. Tokeny jsou jednotlivá slova nebo symboly, ze kterých se text skládá. Například předchozí dvě věty obsahují 16 tokenů. Určením množství tokenů, které ChatGPT může použít pro svůj generativní výstup, specifikuje, jak dlouhý text bude.
Top_p (Hodnota: 0-1)
Funkce: Určuje pravděpodobnost použití generovaných slov. ChatGPT generuje slova na základě pravděpodobnosti. Když píše větu, používá data, z kterých se učilo (články, noviny, knihy), aby určilo, jaké slovo nejspíše bude následovat. Existuje více slov, které by mohly být použity, ale každé má jinou pravděpodobnost. Pomocí Top_p parametru lze určit podle jaké pravděpodobnosti se ChatGPT bude řídit. ChatGPT pak buď sází více na jistotu a generuje větnou konstrukci s vyšší pravděpodobností, nebo zkusí více experimentovat a při generování slov se bude řídit menší pravděpodobností.
Vyšší hodnoty vedou ke zvolení slov s menší pravděpodobností, zatímco nižší hodnoty vedou ke zvolení slov s vyšší pravděpodobností.
Pro lepší přehlednost přikládáme obrázek:
Frequency_penalty (Hodnota: -2 až 2)
Funkce: Určuje variabilitu slov, které se v textu použijí. Pozitivní hodnoty umožňují využívat více ojedinělá slova, zatímco negativní hodnoty vedou spíše k používání běžnějšího jazyka, v němž se slova více opakují.
Nastavíme-li hodnotu 1.5 a zadáme příkaz o napsání vědecké studie, slovo „studie“ bude v textu použito méněkrát, než kdybychom zadali hodnotu -1.5.
Presence_penalty (Hodnota: -2 až 2)
Funkce: Na základě přítomnosti slov v textu, reguluje jejich opakované použití. Kladné hodnoty odrazují od opakování, zatímco záporné hodnoty mohou vést k použití slov, které se v textu již vyskytují.
Necháme-li si generovat text o tematice uměleckého díla, presence_penalty určí, zdali se v textu již vyskytující se slova, budou opakovat či nikoliv. Budu-li mít v textu použité slovo „krása“ a nastavím pozitivní hodnotu, ChatGPT bude místo opakovaného použití slova „krása“, hledat jiné alternativy a opačně.
Jak mohu tyto parametry převést do praxe?
Na to se podíváme v příštím článku…