Az emberi genom szekvenálása már hosszú ideje foglalkoztatja a tudományt, ahhoz azonban, hogy az eljárás a mindennapi gyógyításban elterjedjen, a digitális technológia fejlődésére és térhódítására volt szükség. Az első teljes emberi genomot 2003-ban írták le, majd alig tíz évvel később elindították azokat a személyre szabott vizsgálatokat, amelyek már az itt kapott eredményeken alapulnak. A technológia fejlődésével a szekvenálás idejét és költségét is sikerült olyan mértékben csökkenteni, hogy ma már bárki számára elérhetővé és megfizethetővé vált saját géntérképe. A személyre szabott térképek terjedése miatt azonban egyre több adat keletkezik, amelyet értelmezni és elemezni szükséges, ehhez pedig egyre fejlettebb bioinformatikai rendszerekre és infrastruktúrára van szükség.

Az újgenerációs genom-szekvenálással előállított óriási mennyiségű genetikai adat könnyebben értelmezhetővé válik. Az eljárás egy viszonylag fiatal diagnosztikai módszer, mely a beteg teljes DNS-térképének feltárását és az egyedi genetikai variánsok azonosítását teszi lehetővé, ezzel pedig betekintést nyújt az örökletes betegségekbe, a családi kórtörténetbe. A szekvenálással tulajdonképpen szétszedik a DNS-t, és megvizsgálják a molekula egyedi összetételét, vagyis a DNS-t felépítő négy fehérje elem mindenkire egyedileg jellemző sorrendjét. Mivel egyetlen emberi DNS mintegy 3 milliárd bázispárból áll, így a teljes genom-szekvenálással óriási adatmennyiség jön létre: egy teljes térkép elkészítésekor átlagosan 5 millió genetikai eltérést vizsgálnak, persze mindezt úgy, hogy a mintát a már meglévő adatokkal, adatbázisokkal vetik össze.

Ez olyan mennyiségű adatot jelent, amit analóg eszközökkel kezelni lehetetlen vállalkozás, erre csak a modern számítógépek és a fejlett mesterséges intelligencia képes. Ha azonban megvan az ehhez szükséges infrastruktúra és szakértelem, varázslatos eredményeket lehet elérni. Mindez pedig a 4iG Nyrt. rendelkezésére áll, így a cég szakértő kollégáit, Csepregi Ádám egészségügyi programvezetőt és Szücs Imre Principle Data Science and Machine Learning Architect mérnököt kértük meg, hogy avassanak be minket a 21. századi gyógyászat kulisszatitkaiba.

„Az ötletet egy korábbi K+F projektünk adta, melynek keretei közt egy országos területi illetékességű egészségügyi szolgáltatóval az új génszekvenálási, onkogenomikai, illetve személyre szabott gyógyászati megoldásokon dolgoztunk” – magyarázta Csepregi Ádám. „A kutatási téma és a génszekvenálási módszerek vizsgálata adta a kezdő lökést, hogy csatlakozzunk egy hasonló fejlesztéshez. Ennek érdekében előkészítettünk egy kutatás-fejlesztési pályázatot, melynek egy részét a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal finanszírozza. A feladat egy orvosdiagnosztikát támogató szoftver fejlesztése, illetve egy a nemzetközi ellátórendszerek felé is értékesíthető termék, illetve szolgáltatás kialakítása.

A 4iG szakértői által fejlesztett szoftver a páciensek genetikai állományát elemzi a humán genom feldolgozásával, méghozzá úgy, hogy a levett vér- vagy szövetmintából különböző géntérképeket készít, ezek tartalmát pedig több adatbázissal összehasonlítva keres különféle mutációkat.

„Ha például az én génállományomban található olyan mutáció, amiről már tudományosan igazolták, hogy a vastagbélrák magas rizikófaktorát hordozza, akkor gyakrabban kell szűrővizsgálatra mennem” – részletezte Csepregi Ádám. „A referencia adatbázisok különféle betegségtípusokra, országokra, népcsoportokra bontva eltérhetnek. Célunk, hogy az egészségügyi ellátórendszernek pénzt, a betegeknek és orvosaiknak pedig időt spóroljunk meg. A mi szoftveres támogatásunkkal költséges vizsgálatok elvégzése nélkül is több különböző betegséget kizárhatunk, vagy épp ellenkezőleg, akár diagnosztizálhatunk.”

„A nőgyógyászati daganatos betegségek kialakulásáért felelős, úgynevezett BRCA-gének vizsgálata ma a magánegészségügyben nagyjából kétszázezer forintba kerül. Ha a pácienst nem ilyen új generációs eljárással diagnosztizálják, akkor el kell mennie nőgyógyászhoz, ott mintát vesznek tőle, ezt át kell szállítani egy citopatológiai laborba, ahol a mintát megvizsgálják, majd ezután kiállítják a leletet. A lelet ezt követően visszakerül a szakorvoshoz, aki értékeli, és ha szükséges, értesíti a pácienst. Ez pedig csak egyetlen vizsgálat, hasonló folyamat játszódna le például egy mammográfiás szűrésnél is.” – érzékeltette a helyzetet Csepregi Ádám egy hétköznapi és gyakori példával. „A mi szoftveres támogatásunkkal és az újgenerációs szekvenálás segítségével elég csupán egy egészségügyi szolgáltatóhoz elmenni, ahol mintát vesznek, és innentől a hagyományos lépések jelentős részben vagy akár teljes egészében is elhagyhatóak, valamint a további vizsgálatok is célzottabbak lehetnek. A vérből kimutatott, pácienshez is eljuttatott eredmény még pontosabb diagnózisok felállítására is alkalmas a hagyományos szűréshez képest, mivel a jelenlegi tudományos ismereteink szerint a BRCA-gén vizsgálatával 99 százalékos valószínűséggel kizárható a daganatos betegség kialakulása.

A szakember még egy fontos aspektusára rámutatott a szoftvernek: „a génszekvenálás egy laboratóriumi automata rendszeren keresztül történik, az eredménye pedig egy olyan digitális állomány, egy olyan fájlformátum, amit bioinformatikusok értékelnek ki bioinformatikai módszerekkel, de más formátumú adatrendszerekben is rögzíthető, így a genetikus szakorvosok által is értékelhető eredmény születik belőle. Ehhez viszont az informatika által támogatott és minőségbiztosított csatornákra van szükség – azonban, ha ezek adottak, a rendszer automatikusan működik, a pácienseknek pedig elegendő a mintavételre elmennie”.

A mesterséges intelligencia mérsékelheti az egyre növekvő igényekből is fakadó szakorvoshiányt

A 4iG szakértői eleinte az egyszerűbb génmutációkat kezdték keresni, hogy az informatikai eszközökben rejlő lehetőségekkel a lehető legkevesebb energiát és egészségügyi szaktudást igénylő módon tudjanak pontos diagnózishoz jutni.

„Az egészségügy leterheltségére, illetve nehézségeire kiváló megoldást nyújtanak a hasonló szoftverek” – mutatott rá Csepregi Ádám. Több ilyen megoldás van a világban, akár a bőrgyógyászatban, akár a radiológián, ahol mesterséges intelligencia segítségével állítanak fel elsődleges diagnózist.

A génszekvenálás találkozása a nyomtatóiparral

A 4iG munkatársai arra is felhívták a figyelmet, hogy a génszekvenálásra használt eszközök hasonlítanak a nyomtatókhoz: minél nagyobb terjedelemmel és minél nagyobb „példányszámmal” dolgoznak, fajlagosan annál olcsóbb az üzemeltetésük.

„Egy kisebb gépen egyszerre például 50 mintát lehet megvizsgálni, míg egy nagyobb teljesítményű eszközön akár 200-at is” – magyarázta a szakember. „A projektben egyfajta aggregációt is próbáltunk megvalósítani, ami informatikai szempontból szép kihívás, mivel óriási számítókapacitásra van szükség, hiszen sok száz gigabájtnyi adattal dolgozunk. Az ilyen nagyméretű adatok nehezen mozgathatók és nehezen elemezhetők, ezért jóval több időbe telne egy kisebb gépen lefuttatni ezeket a vizsgálatokat. Ráadásul, mivel érzékeny egészségügyi adatokról van szó, az adattárolást is alaposan körbe kellett járni, hogy hol és miként lehet ezeket központosítani, illetve milyen további kutatásokhoz használhatók fel ezek a jól strukturált adatok”.

„Például az emlő- és petefészek-daganatoknál bizonyították, hogy kialakulásukban jelentős szerepe van a nőági öröklődésnek, ezért egy szűrővizsgálatra olyanokat tudnánk behívni, akiknek a kórelőzményében a felmenőknél szerepel hasonló daganatos megbetegedés, így feltételezhetjük, hogy nagy valószínűséggel a leszármazott is hordozza a kockázatot rejtő géneket” – mondta Csepregi Ádám. „Fontos leszögezni, hogy ez nem jelenti feltétlenül azt, hogy a hordozónál ki is alakul a betegség, de az biztos, hogy nagyobb odafigyelésre lesz szüksége a jövőben”. A szakember azt is elmondta, hogy jelenleg humángenetikával foglalkoznak a 4iG fejlesztői, de idővel szeretnék a technológiát kiterjeszteni az élelmiszerbiztonságra, valamint a növénytermesztésre és állattenyésztésre is.

Csökkenő költségek, temérdek adat, összehangolt folyamatok

„A génszekvenálás költségei ráadásul jelentősen csökkentek az elmúlt években” – mutatott rá Szücs Imre. „A kétezres években ezek a vizsgálatok még brutális anyagi ráfordítással jártak volna, de mostanra már kezelhető és az idő előrehaladtával egyre csökkenő költségekel kell számolnunk.” A szakember kiemelte, hogy az új generációs eljárásnak köszönhetően, várhatóan 2025-re akár 10-szer annyi genomikai adat áll majd rendelkezésre, mint a YouTube jelenlegi adatvagyona, ami a 40 exabyte-ot is elérheti.

„Ráadásul, ha egyszer létrejön egy ilyen, az egész folyamatot lefedő IT-rendszer, akkor az skálázhatóvá válik” – tette hozzá a szakember. „Ahogy növeljük a volumeneket, úgy lesz egyre költséghatékonyabb, szemben a humán-alapú ellátással. Sőt, a korlátosan rendelkezésre álló emberi erőforrások miatt az egészségügyi ellátórendszerben pont ellentétes folyamat, lefelé skálázódás figyelhető meg és világszerte szintén ez a várakozás.” Szücs Imre is felhívta a figyelmet az adatvédelem fontosságára, hiszen az érzékeny egészségügyi adatokat anonimizálni kell.

„A projektben – a hatalmas mennyiségű adat miatt – hangsúlyos a gépi tanulás (machine learning) szerepe, amit a hagyományos biostatisztikában, bioinformatikában évek óta bevált módszerekkel lehet ötvözni, lényegesen pontosabb eredményekkel” – hangsúlyozta a 4iG szakértője. „Ráadásul ezek a módszerek felgyorsítják a vizsgálatokat: egységnyi idő alatt több pácienst tudunk kiszolgálni. A célzott vizsgálatok mellett pedig lehetséges akár teljes analízis is, azaz, a minták alapján ismert betegségekről meg tudjuk mondani, hogy a páciensre nézve milyen kockázatok léteznek.

Összegezve elmondhatjuk, hogy a mesterséges intelligencia sokkal több mindent észre tud venni, ráadásul nem fárad el. Sőt, a rendszer a jövőben már olyan mintázatokra is tud majd figyelni, mint két hasonló, vagy ugyanolyan betegéletút kezelésének változásai, ez pedig fontos lépés a személyre szabott gyógyászat felé.