Shop menü

MESTERSÉGES INTELLIGENCIÁK TERVEZIK A JÖVŐ FEHÉRJÉIT

Az új típusú, egyedi kialakítású proteinek forradalmasíthatják az orvostudományt.
Jools _
Jools _
Mesterséges intelligenciák tervezik a jövő fehérjéit

David Juergens, a Washington Egyetem komputációs vegyésze rendre olyan fehérjéket tervez, amelyek a természetben sosem alakultak ki több mint 3 milliárd évnyi evolúciós „barkácsolás” során. Juergens fő segítsége a munkában az általa kifejlesztett, RFdiffusion nevű, mesterséges intelligenciával (AI) működő eszköz, amely felhőalapú változattal is bír. Ez a neurális hálózat és a hasonló megoldások az utóbbi években kulcsszerepet kaptak abban, hogy az egyedi fehérjék létrehozása – egy, a közelmúltig rendkívül nehéz és gyakran kilátástalan törekvés – bekerüljön a tudomány fősodrába.

A mesterséges fehérjék létrehozásában a mesterséges intelligenciák egy elsőre meglepőnek tűnő típusa hozott igazi változást: a most használt legjobb szoftvereket a valósághű képeket szintetizáló mesterséges intelligenciák ihlették.

Például az a Midjourney nevű rendszer, amelynek Ferenc pápa virálisan terjedő, fehér pufferdzsekis képét köszönhetjük. A kutatók rájöttek, hogy a képalkotáshoz hasonló koncepcionális megközelítéssel meghatározott kritériumok szerinti, valósághű fehérjeszerkezeteket lehet létrehozni. Ami a gyakorlatban azt jelenti, hogy például nagyon gyorsan meg lehet alkotni egy olyan új fehérjét, amely szorosan kötődni tud egy másik kiszemelt biomolekulához. A korai kísérletek pedig valóban azt mutatják, hogy az így kapott fehérjestruktúrák szintetizálva tényleg úgy működnek, ahogy a szoftver azt elképzelte.

Ezek az eszközök az elmúlt egy évben forradalmasították a fehérjék tervezésének folyamatát, hiszen lehetségessé vált az adott problémákra szabott fehérjestruktúrák létrehozása, mondja David Baker, aki Juergensszel közösen fejlesztette ki az RFdiffusiont. A csapat 2023 márciusában adta ki a szoftvert, a neurális hálózat működését részletező tanulmány pedig a napokban jelent meg a Nature című folyóiratban. Ahogy Gevorg Grigoryan, a Generate Biomedicines biotechnológiai vállalat társalapítója hozzáteszi, a fehérjék tervezői most először rendelkeznek olyan reprodukálható és robusztus eszközökkel, amelyek köré új iparágat lehet létrehozni. „A következő kihívás az lesz, hogy mit kezdjünk vele” – mondja a szakértő.

Nagyszabású tervek

A kutatók évtizedek óta küzdenek új fehérjék létrehozásával. Eleinte a meglévő fehérjék hasznos részeit próbálták összefércelni, például egy enzim zsebét, amelyben egy kémiai reakciót katalizálódik, egy másik fehérjére átültetni. Ez a megközelítés a fehérjék hajtogatódásának és működésének megértésén alapult, intuíció, valamint sok-sok próbálkozás és tévedés útján. A szakértők sokszor több ezer variációt vizsgáltak meg, hogy megtaláljanak egyet (vagy egyet sem), amely végre a remélt módon működött.

Baker elmondása szerint ebbe a munkába valódi változást hozott az AlphaFold és más mesterséges intelligencián alapuló rendszerek, amelyekkel pontosan megjósolhatóvá vált a fehérjék szerkezete az aminosavsorrend alapján. A tervezők aztán rájöttek, hogy ezek a valódi fehérjeszekvenciákon és struktúrákon betanított neurális hálózatok segíthetnek a fehérjék nulláról történő megalkotásában is.

Galéria megnyitása

Az elmúlt néhány évben Baker csapata és a szakterület más képviselői számos mesterséges intelligencián alapú fehérjetervező eszközt adtak ki. Az egyik megközelítés, amelyet ezek az eszközök alkalmaznak, az úgynevezett „hallucináció”. Ez aminosavak véletlenszerű sorozatának létrehozását jelenti, amelyet aztán az AlphaFold vagy egy hasonló eszköz, a RoseTTAFold addig optimalizál, amíg az neurális hálózat szerint nem abba a specifikus szerkezetbe fog összeállni, amit keresnek. Egy másik megoldás az „inpainting” nevű eljárás, amelyben egy fehérjeszekvencia vagy szerkezet egy meghatározott részletét veszi alapul a rendszer, majd a RoseTTAFold segítségével e köré építi a molekula többi részét.

Ezek az eszközök azonban messze nem tökéletesek. A kísérletek hajlamosak voltak azt mutatni, hogy a hallucinációs módszerrel tervezett struktúrák nem mindig eredményeznek jól hajtogatott fehérjéket a valóságban. A hallucinációs módszerrel így egyelőre csak kis méretű fehérjéket sikerült létrehozni. Az inpainting szintén rosszul teljesített a fehérjék kialakításában, ha rövidebb darabokból indult ki. És bár a megközelítéssel sikerült előállítani új teoretikus fehérjestruktúrákat, a módszer nem eredményezett kellően változatos megoldásokat a problémákra, amelyek pedig növelnék a valós siker esélyét.

Az RFdiffusion és az elmúlt hónapokban megjelent hasonló fehérjetervező mesterséges intelligenciák azonban újabb változásokat hoztak a területen. Ezek, ahogy már említettük, működésüket tekintve ugyanazokon az elveken alapulnak, mint a valósághű képeket generáló neurális hálózatok, például a Stable Diffusion, a DALL-E és a Midjourney. Ezeket a „diffúziós” hálózatokat olyan adatokon képzik ki, amelyeket fokozatosan zajosabbá tesznek, és végül már egyáltalán nem hasonlítanak a kiindulási képre (vagy fehérjeszerkezetre).

A hálózat ezután megtanulja „zajtalanítani” az adatokat, és létrehozni az eredeti képet.

Az RFdiffusiont a Protein Data Bank (PDB) nevű adatbázisban tárolt több tízezer valós fehérjeszerkezeten képezték ki. Amikor a rendszer új fehérjét alkot meg, totális káoszból indul ki: aminosavak véletlenszerű összeválogatásával kezdi a munkát. Majd megpróbálja kideríteni, hogy mi lehet az a fehérje, amelyből ilyen zaj keletkezhet, magyarázza Watson. A zajtalanítási körök után pedig létrejön egy valódi, de teljesen új fehérje.

Galéria megnyitása

Amikor Baker csapata úgy tesztelte az RFdiffusiont, hogy az aminosav-szekvencia hosszán kívül semmilyen más útmutatást nem adtak neki, a rendszer sorra termelte ki a változatos, valósághűnek tűnő fehérjéket, amelyek azonban teljesen eltértek azoktól, amelyeken betanították. A rendszer ugyanakkor mostanra arra is képes, hogy specifikus tervezési megkötéseket vegyen figyelembe a zajtalanítás során – ezt nevezik kondicionálásnak.

Így például létre tud hozni olyan fehérjéket, amelyek egy helyen specifikusan hajtogatódnak, vagy amelyek igazodnak egy kiválasztott másik molekula adott részéhez, és így képesek lesznek vele összekapcsolódni. Grigoryan csapatának pedig van egy Chroma nevű diffúziós hálózata, amely többek közt az angol nyelvben használt 26 betűhöz, valamint az arab számokhoz hasonló alakú fehérjéket tud tervezni gombnyomásra.

Jel a zajból

Az RFdiffusion online űrlapjába beírt adatok alapján a rendszer először zajt jelenít meg, véletlenszerűen összeválogatott aminosavakat, amelyekből a mesterséges intelligencia kiindul. Ezek piros, elmosódott foltokként jelennek meg, akár egy kisgyerek első ujjfestési próbálkozásai. Aztán képkockáról képkockára egyre bonyolultabb formákká alakulnak át, olyan fehérjékre jellemző részletekkel, mint az α-hélixeknek nevezett szoros spirálok és a β-redők szalagszerű formái.

Az eszköz használata mostanra rutinná vált Baker laboratóriumában. „A tervezési folyamat szinte felismerhetetlen az egy évvel ezelőttihez képest” – mondja. A neurális hálózat kiemelkedően teljesít számos olyan tervezési kihívásban, amelyek más megközelítésekkel nem voltak hatékonyak, nehezek voltak vagy egyszerűen lehetetlennek bizonyultak.

A tanulmányukban a kutatók ismertetnek egy példát, amelyben egy másik fehérje egy részletéből indultak ki, egy vírusfehérje egy darabjából, majd többféle mesterséges intelligenciás eszközt bíztak meg azzal, hogy állítsanak elő 100 különböző új fehérjét, és megnézték, hány tartalmazta a kívánt motívumot.

A csapat ezt a kihívást 25 különböző kiinduló szerkezettel hajtotta végre, és az RFdiffusion 23 esetben előállított legalább egy olyan fehérjét, amely megfelelt a kívánalmaknak. A hallucinációs módszerrel 15 esetben kaptak használható eredményt, az inpaintingnél pedig 12-ben.

Az RFdiffusion az olyan komplex fehérjék előállításában is kiemelkedőnek bizonyult, amelyek összetett nanorészecskékké állnak össze, és képesek lehetnek gyógyszerek vagy oltóanyagok szállítására. És bár hasonlóra a korábbi megoldások is képesek voltak, Watson szerint az RFdiffusion tervei sokkal kifinomultabbak az eddigieknél.

Galéria megnyitása

Az RFdiffusionhoz hasonló neurális hálózatok ugyanakkor igazi változást hoztak abba, amikor olyan fehérjéket kell tervezni, amelyek képesek egy másik meghatározott fehérjéhez kapcsolódni. Baker csapata olyan fehérjéket tervezett a rendszerrel, amelyek daganatos megbetegedésekben, autoimmun betegségekben és más állapotokban szerepet játszó fehérjékhez képesek kötődni.

Új fehérjék – valós kihívások

Bár Baker csapata számtalan tervet gyártott le az új rendszerrel, az igazi kérdés az volt, hogy az így kapott fehérjék mennyire bizonyulnak működőképesnek a valóságban. De szerencsére már a korai kísérletek is azt mutatják, hogy az RFdiffusion tervei élesben is működnek. Egy, a tanulmányban ismertetett kísérlet során a csapat olyan fehérjék tervezésével bízta meg az eszközt, amelyek tartalmazzák a p53 egy kulcsfontosságú szakaszát. Ez egy olyan jelzőmolekula, amely számos rákos megbetegedésben túlműködik, és így népszerű potenciális gyógyszercélpont.

Amikor a kutatók a valóságban is szintetizálták a rendszer által tervezett 95 új fehérjét, azt tapasztalták, hogy ezek több mint a fele valóban rendelkezett a p53 azon képességével, hogy annak természetes célpontjához, az MDM2 enzimhez kötődjön. A legjobban sikerült új fehérjék ráadásul mintegy 1000-szer erősebben kötődtek a célponthoz, mint a természetes p53. Amikor a kutatók hallucinációval próbálkoztak ugyanezzel a feladattal, a kapott tervek közül a valóságban egyik sem vált be.

Összességében Baker szerint csapata úgy találta, hogy az RFdiffusion által tervezett fehérjék 10–20%-a elég erősen kötődik a kívánt célponthoz ahhoz, hogy hasznos legyen, szemben a korábbi mesterséges intelligenciás módszerek kevesebb mint 1%-os hatékonyságával.

Matthias Gloegl biokémikus, a Washington Egyetem munkatársa szerint ráadásul az új rendszerek hatékonysága egyre jobb, és az utóbbi hónapokban rendre 50% körüli volt a sikeres tervek aránya. Ami azt jelenti, hogy az általuk tapasztalt, kezdeti több hónap helyett mostanra egy-két hét alatt lehet működő megoldást találni egy-egy problémára. „Ez tényleg őrületes” – teszi hozzá.

Az RFdiffusion felhőalapú változatának június végére naponta mintegy 100 felhasználója volt. Joel Mackay, a Sydney-i Egyetem biokémikusa például olyan fehérjéket tervez a rendszer segítségével, amelyek képesek kötődni más, a laboratóriumában vizsgált fehérjékhez, köztük a sejtekben a génaktivitást szabályozó, transzkripciós faktoroknak nevezett molekulákhoz. A tervezést a kutató nagyon egyszerűnek találta, és a számítógépes modellezés alapján a kapott fehérjéknek valóban kötődniük kell a transzkripciós faktorokhoz.

Mackay most azt teszteli, hogy az RFdiffusion tervezte fehérjék képesek-e a sejtekben előállítva a kívánt módon megváltoztatni a génkifejeződést. Ha ez sikerül, az óriási lépés lenne, hiszen egy egyszerű módot kínálna arra, hogy a sejtekben be- és kikapcsoljanak bizonyos transzkripciós faktorokat, ahelyett, hogy erre gyógyszereket használnának.

Galéria megnyitása

A jövő most kezdődik

Az RFdiffusion és társai Charlotte Deane, az Oxfordi Egyetem immuninformatikusa szerint is alapvetően átírták a játékszabályokat, és ez még csak a kezdet, a kutatók még csak most kezdik felderíteni, hogy mi mindenre lehetnek még jók a diffúziós rendszerek. Az egyik alkalmazás, amely őt és számos biotechnológiai vállalatot is különösen érdekli, a bonyolultabb fehérjék, például az antitestek vagy a T-sejtek fehérjereceptorainak tervezése. Ezek a fehérjék rugalmas hurkokkal kapcsolódnak a célpontjukkal, ami új kihívást jelenthet azokhoz a szendvicsszerű, lapos határfelületekhez képest, amelyek tervezésében az RFdiffusion eddig jeleskedett.

Ahogy Sergey Ovchinnikov, a Harvard evolúcióbiológusa mondja, általában nagy kihívást jelent az olyan biomolekulák tervezése, amelyek funkciója olyan régióktól függ, amelyek sokféle alakot képesek felvenni. Ezek olyan tulajdonságok, amelyeket eddig nehéznek bizonyult modellezni a mesterséges intelligencia segítségével. A szakértő szerint az a probléma, hogy lehessen valahová kötődő molekulákat kifejleszteni, és ezzel folyamatokat segíteni vagy gátolni, a legtöbb esetben már most megvalósítható az új módszerekkel. Ahhoz azonban, hogy ennél bonyolultabb feladatokat is megoldjanak, némi rugalmasságot kell bevezetni a koncepciókba – ez lehet a következő lépés.

Tanja Kortemme, a Kaliforniai Egyetem komputációs biológusa az RFdiffusion segítségével olyan fehérjéket próbál tervezni, amelyek szenzorként vagy kapcsolóként használhatók a sejtek irányítására. Ahogy mondja, amíg egy fehérje aktív helye néhány aminosav elrendezésén múlik, mesterséges intelligencia jól teljesít. De nehezen tud olyan fehérjéket tervezni, amelyeknek összetettebb az aktív helyük – ezt a kihívást próbálják most kollégáival megoldani.

Kevin Yang, a Microsoft bioorvosi gépi tanulásikutatója szerint a legújabb diffúziós módszerek másik korlátja az lehet, hogy nem képesek a természetes fehérjéktől nagymértékben eltérő fehérjéket létrehozni. Ez azért van így, mert a mesterséges intelligencia rendszereket csak olyan létező fehérjékre képezték ki, amelyeket a kutatók már leírtak, és hajlamosak olyan fehérjéket létrehozni, amelyek hasonlítanak azokra. Az idegenebb kinézetű fehérjék előállításához a fehérjéket funkciókkal felruházó fizika jobb megértésére lehet szükség. Ez megkönnyítheti a fehérjék tervezését olyan feladatok céljára is, amelyekre jelenleg egyetlen természetes fehérje sem képes.

A legújabb fehérjetervező eszközök kiválóak az olyan fehérjék létrehozásában, amelyek egy adott feladat elvégzésére képesek – mindaddig, amíg ez a funkció leírható egy struktúrával, például a fehérje felületével, amelyhez kötődni kell, mondja Mohammed AlQuraishi, a Columbia komputációs biológusa.

Ugyanakkor az RFdiffusion és társai még nem képesek más típusú specifikációk kezelésére, például olyan fehérje létrehozására, amely alakjától függetlenül képes egy adott reakciót végrehajtani, akkor is, ha már „tudjuk, hogy mit akarunk, de nem ismerjük a geometriát.”

Galéria megnyitása

Grigoryan szerint a jövőbeni fehérjetervező eszközöknek arra is képesnek kell lenniük, hogy több különböző kritériumnak megfelelő fehérjéket állítsanak elő. Egy potenciális terápiás fehérjének nemcsak a célpontjához kell kötődnie, hanem azt is biztosítani kell, hogy ne kötődjön máshoz, ráadásul olyan tulajdonságokkal kell rendelkeznie, amelyek megkönnyítik a tömeggyártást.

Az egyik új irány, amelyet a kutatók vizsgálnak, hogy lehet-e fehérjéket tervezni egyszerű szöveges promptok segítségével, hasonlóan a képgeneráló eszközökhöz.

Grigoryan és kollégái már tettek is egy lépést e cél felé. A 2022 végén egy preprintben megjelent tanulmányban arról számoltak be, hogy betanították a Chromát, hogy szöveges specifikációk alapján hozzon létre fehérjeterveket, így például „CHAD-doménnel rendelkező” fehérjét vagy „az aminotranszferázok kristályszerkezetét tartalmazó” fehérjéket gyártson, pusztán szöveges utasírások alapján.

Ami a gyakorlati alkalmazást illeti, ez úgy néz ki, hogy az RFdiffusion által néhány perc alatt létrehozott terv az új fehérje 3D-s szerkezetének modellje. A szakértők ezután egy másik mesterségesintelligencia-eszközt használnak, hogy olyan aminosav-szekvenciákat találjanak, amelyeknek ezt a szerkezetet veszik fel. Végső ellenőrzésként a szekvenciákat az AlphaFold programba táplálják, hogy megnézzék, a szoftver a tervnek megfelelően hajtogatódó struktúrákat jelez-e előre. Az AlphaFold jóslatai átlagosan mindössze 1 ångström (egy hidrogénatom szélessége) eltérést mutatnak a tervtől.

„Ez már az a pontosság, amelyet mi a sikeres tervezésnek minősítünk”

– mondja Watson. Utána meg csak azt kell megnézni, hogyan teljesít a fehérje a való életben – és egyre gyakrabban nagyon jól.

Galéria megnyitása

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére