A mesterséges intelligencia (MI) az elmúlt években forradalmasította a fehérjék tanulmányozását azáltal, hogy egyre pontosabban jósolja meg a működésük szempontjából kulcsfontosságú térszerkezetüket. Az új eszközök erejét most sokkal kisebb molekulák kapcsán is kezdik kiaknázni: a gyógyszerek, gyomirtók és katalizátorok esetében.
A Science új számában egy kutatócsoport tagjai arról számolnak be, hogy egy új MI-alapú eszköz képes meghatározni a kismolekulák szerkezetét – még hiányos adatok esetén is. Az eszköz mintázatokat azonosít olyan adathalmazokban, amelyeket korábban elégtelennek minősítettek. A megközelítés megkönnyítheti a vegyészek számára a modern életben központi szerepet játszó vegyületek széles körének továbbfejlesztését.
A mesterséges intelligencia közelmúltbeli fejlődése a fehérjeszerkezetek előrejelzése terén nagyrészt annak köszönhető, hogy hatalmas mennyiségű adat áll rendelkezésre a rendszerek betanítására. A kutatók ismerik a fehérjéket kódoló gének DNS-szekvenciáit, és sok fehérje pontos térszerkezetét is. A két adathalmaz segítségével be tudják tanítani a mesterséges intelligenciákat arra, hogy pontosan megjósolják egy új fehérje térszerkezetét pusztán a DNS-szekvencia alapján.
A kismolekulák azonban nagyobb kihívást jelentenek, mondja Anders Madsen, a Koppenhágai Egyetem kismolekula-krisztallográfusa. Bár a kutatók a kémiai képletekből ki tudják számítani az alapvető térszerkezeteket, a pontos szerkezetet gyakran lehetetlen előre jelezni, mivel számos variáció egyformán elképzelhető.
A tényleges szerkezetek azonosításához a kutatók általában röntgenkrisztallográfiát használnak. Azzal kezdik, hogy egy kismolekulás anyagot kristállyá alakítják, ahol ismétlődő mintázatban sorakoznak a molekulák. Ezután röntgensugarat bocsátanak a kristályra, amit a molekula atomjait körülvevő elektronok eltérítenek. Az így létrejövő diffrakciós mintázat elemzésével a kutatók feltérképezik az elektronok elhelyezkedését, és ebből meg tudják határozni az atomok elrendeződését.
A szerkezet meghatározásához ismerni kell a röntgensugarak fázisát is, amely a hullámhossztól és a kristályon átvezető úttól függ. Bár a detektorok képesek mérni a röntgensugarak intenzitását, a fázist nem tudják mérni. A kutatóknak így megalapozott találgatásokkal kell élniük, hogy teszteljék a legvalószínűbb fázisértékeket, és megerősítsék azokat, amelyek a legjobban illeszkednek az adatokhoz. A kísérletek során azonban gyakran kapnak „rossz” kristályokat, amelyek homályos diffrakciós mintázatot generálnak, lehetetlenné téve a fázis pontos meghatározását.
A megfelelő MI azonban képes meglátni a kutatók számára láthatatlan mintákat a hiányos adatokban is. Madsen és kollégái azt akarták kideríteni, hogy a kristályok esetében is így van-e. Ezt úgy tesztelték, hogy egy számítógépes modell segítségével rengetegféle kismolekula-szerkezetet modelleztek, ezekből kristályokat „építettek”, és szimulálták a homályos diffrakciós mintázatokat. A mesterséges intelligencia véletlenszerű fázisértékekkel kezdte, és addig próbálkozott, amíg olyan fázisokat nem talált, amelyek a zavaros intenzitásadatokkal kombinálva a helyes szerkezetet eredményezték.
Ezen a ponton a kutatók több millió hipotetikus molekula bemeneti (intenzitás- és fázisadatok) és kimeneti (térszerkezeti) adatai álltak rendelkezésre. Ezt használták arra, hogy betanítsák a mesterséges intelligenciát olyan mintázatok keresésére, amelyek összekötik az intenzitásadatokat a fázisadatokkal, és amelyek együttesen a helyes struktúrákat eredményeznek.
Ezután a kutatók azt is megvizsgálták, hogy a betanított mesterséges intelligencia képes-e megjósolni olyan valódi molekulák szerkezetét, amelyeket korábban még nem látott. Úgy találták, hogy igen: a tesztelt közel 2400 kismolekula mindegyikének ismert szerkezetét pontosan meg tudta fejteni, a hagyományos röntgenvizsgálati módszerekhez szükséges adatok mindössze 10%-ával.
A technika egyelőre csak olyan molekulák esetében működik, amelyek legfeljebb körülbelül 50 atomot tartalmaznak. Madsen elmondása szerint reméli, hogy tovább tudják finomítani a mesterséges intelligenciát abban a reményben, hogy nagyobb molekulákkal is működhet, és ezáltal sokoldalúbb eszközzé válik.