CRISPR, neboli Clustered Regularly Interspaced Short Palindromic Repeats, už tu je s námi nějakou tu dobu. Konkrétně se jedná o revoluční technologii pro úpravu genů, objevenou v roce 2012 vědci Jennifer Doudnovou a Emmanuelle Charpentierem. Tento systém, původně součást imunitního mechanismu bakterií, umožňuje vědcům cíleně a přesně upravovat DNA v živých organismech.
Díky své přesnosti, efektivitě a snadné aplikaci získal CRISPR široké využití v biotechnologii a medicíně, kde představuje zásadní nástroj pro výzkum genetických onemocnění, vývoj nových léčebných metod, a dokonce i v oblastech jako jsou zemědělství a biologická výroba. Jeho aplikace nabízí naději na průlom v léčbě dosud nevyléčitelných nemocí a významně ovlivňuje směřování moderní vědy a zdravotnictví.
Generativní AI přichází na scénu…
Právě pátrání po dosud neznámých systémech úprav genů CRISPR neustále vede vědce k prozkoumávání mikroorganismů v různých prostředích, od horkých pramenů až po jogurt. Nyní jim však může významně pomoci pokrok v generativní umělé inteligenci, která umožňuje navrhovat tyto systémy s velkou mírou jednoduchosti a efektivity.
Vědci tento týden publikovali studii, v níž popisují, jak využili generativní nástroj AI, konkrétně model jazyka pro proteiny – neuronovou síť trénovanou na milionech proteinových sekvencí – k návrhu proteinů pro CRISPR úpravy genů. V laboratorních testech pak dokázali, že některé z těchto systémů fungují přesně podle očekávání.

Obrázek 1 – DALL-E 3: Země obalená DNA řetězci
Trénování na genomických sekvencích
Jiný tým vědců v únoru oznámil, že vyvinul model trénovaný na genomických sekvencích mikroorganismů, který použili k návrhu nových CRISPR systémů, sestávajících z enzymů štěpících DNA nebo RNA a RNA molekul, které směrují tuto molekulární „nůžky“ k cílovým sekvencím.
Pro čtenáře si dovolím upřesnit, že genomická sekvence je v podstatě soubor instrukcí, který je zakódován v DNA organismu. Tato sekvence určuje, jaké proteiny a enzymy se v těle budou vyrábět, a tím ovlivňuje vše od fyzických charakteristik po funkci různých buněk a orgánů. Každý organismus má unikátní genomovou sekvenci, která je dědičně přenášena z generace na generaci. Ve výzkumu a medicíně umožňuje analýza genomických sekvencí identifikovat specifické genetické varianty odpovědné za určité choroby, což vede k rozvoji cílených léčebných strategií a personalizované medicíny. V praxi to znamená, že lékaři a vědci mohou lépe pochopit a ovlivnit genetické procesy, což může vést k přesnější diagnostice a účinnějším léčbám. Když tedy říkáme, že byl model trénován na genomických sekvencích, znamená to, že model byl trénován právě na souborech informacích obsažených v jednotlivých DNA mikroorganismů. Je to stejný princip, jako kdybyste trénovali kuchtící model na různých receptech na dort.
Prohlubování znalostí a nové možnosti
„Je to teprve začátek. Ukazuje se, že je možné tyto složité systémy navrhovat pomocí modelů strojového učení,“ říká Ali Madani, vědec v oblasti strojového učení a generální ředitel biotechnologické firmy Profluent, která sídlí v Berkeley v Kalifornii. Madaniho tým nedávno oznámil „první úspěšnou úpravu lidského genomu proteiny navrženými zcela strojově.“
Alan Wong, syntetický biolog z Univerzity v Hongkongu, jehož tým využívá strojové učení k optimalizaci CRISPR, komentuje: „Přirozeně se vyskytující systémy pro úpravu genů mají svá omezení, co se týče sekvencí, na které mohou cílit, a typů změn, které mohou provést. Rozšíření repertoáru editorů s využitím AI by mohlo pomoci překonat tyto bariéry.“

Obrázek 2 – DALL-E 3: DNA jako galaktická entita
Trénování modelů a aplikace v praxi
Na rozdíl od chatbotů, jako je ChatGPT, které jsou navrženy pro zpracování jazyka po tréninku na existujícím textu, byly AI modely pro návrh CRISPR trénovány na obrovském množství biologických dat ve formě proteinových nebo genomických sekvencí. Cílem tohoto ‚předtréninku‘ bylo získat vhled do přirozeně se vyskytujících genetických sekvencí, jako jsou kombinace aminokyselin, které mohou být následně aplikovány na úkoly jako je vytváření zcela nových sekvencí.
Tým Aliho Madaniho dříve použil model jazyka pro proteiny, který vyvinuli, nazývaný ProGen, k návrhu nových antibakteriálních proteinů. Pro vývoj nových CRISPR systémů tým přetrénoval aktualizovanou verzi ProGen s příklady milionů různorodých CRISPR systémů, které bakterie a jiné jednobuněčné mikroorganismy používají k obraně proti virům.
Léčení neléčitelného je na dohled
Tento průlom v oblasti CRISPR technologie může významně přispět k rozvoji personalizované medicíny a léčbě genetických chorob. Princip je vcelku jednoduchý, neuronová síť tvořící hlavní páteř AI je schopná analyzovat miliardy jednotlivých údajů, kombinací a informacích o složení aminokyselin, z nichž se poté tvoří bílkoviny. Díky tomu bychom mohli léčit mnoho doposud neléčitelných onemocnění, jako je například Alzheimerova choroba tím, že bychom vytvořili bílkoviny, které by onemocnění zabraňovali nebo tím, že bychom dokázali odhalit bílkoviny, které jsou za daná onemocnění zodpovědné, a jejichž odstraněním bychom vzniku onemocnění zabránili.
Shrnutí
- Vědci využívají generativní AI k navrhování nových systémů CRISPR pro úpravy genů.
- Neuronové sítě trénované na proteinových sekvencích překonávají omezení přirozených systémů úprav genů.
- První úspěšná úprava lidského genomu byla provedena pomocí proteinů navržených AI.
- Rozšíření nástrojů pro úpravu genů by mohlo vést k významným pokrokům v medicíně.
Zdroj
- Callaway, E. (2024, April 29). “chatgpt for CRISPR” creates new gene-editing tools. Nature News. https://www.nature.com/articles/d41586-024-01243-w?ref=futuretools.io







