Merre tart a mesterséges intelligencia az orvostudományban?

2024-05-24 10:41:00 FORRÁS: Orvosok Lapja. Fotó: Steve Johnson, Unsplash

Szerző: Antal Péter egyetemi docens, Budapesti Műszaki és Gazdaságtudományi Egyetem

Orvosok lapja - Konzílium

A mesterséges intelligencia (MI) tudományterületi elnevezése 1956-ban született meg, a tudományterület alapvető célkitűzése azonban több ezer éves: a cselekedetek tudományos vizsgálata és automatizálása. Ez magába foglalja a következtetések racionális voltának a vizsgálatát és automatizálását is, legyen szó akár egy megfigyelés, de akár adatok milliárdjai alapján történő következtetésről. A szabályozástechnikának avagy kibernetikának, illetve a közgazdaság-tudománynak és pszichológiának is meghatározó tulajdonsága a cselekvések és beavatkozások rendszerének a vizsgálata, azonban a mesterséges intelligencia unikálisan az a tudományterület, amely nem csupán komplex modelleket alkot meg, hanem azokat meg is valósítja. Olyannyira, hogy a tudományterületet empirikus matematikának és modern (számítógépes) filozófiának is nevezik, mivel az univerzális számítás és az azt realizáló számítógépek segítségével a modellek valóban létre is hozhatóak, így a mesterséges intelligencia a mérnöki tudományokhoz is nagyon közel áll.

Az MI és az élettudományok

Az MI az élettudományokhoz is ezer szállal kötődik: az 1940-es években született meg az a mesterséges neuron modell, amely mai napig új és új MI modelleket inspirál, és amelynek a hatékony számítási megvalósítása a modern félvezetőipar legfőbb hajtóereje. Az élettudományok azonban alkalmazási területként is mindig fontos kihívást jelentettek az MI számára: a kezdetektől jelen lévő diagnosztikai modellek után 1980-ban már átfogó belgyógyászati diagnosztikai modellek jelentek meg, 1989-ben pedig elindult az Artificial Intelligence in Medicine című folyóirat. Az ezredfordulóra már nem csupán olyan diagnosztikai modellek voltak jelen, amelyek orvosi leírókat használva az emberi szakértők diagnosztikai pontosságát meghaladták, hanem olyan komplex modellek is, amelyek terápiák optimális megválasztását is lehetővé tették [1]. Az oksági és döntési hálózatok megjelenése pedig azt jelentette, hogy az MI nem csupán a diagnosztikában vagy egy optimális terápia megválasztásában tud segíteni, hanem egy adott terápia hatása alapján potenciális egyéb terápiák hasznosságát is segíthet megbecsülni, ami szakmai ellátási protokollok változtatása esetén alapvető fontosságú [2].

Mélytanulás az élettudományokban

Az ezredforduló után az adatok digitalizációja révén az elérhető és MI-rendszerek fejlesztésére is felhasználható adatmennyiség gyarapodása exponenciális ütemű lett, analóg módon a számítási teljesítmény növekedésével. A 2010-es években az adatok mennyisége, az elérhető számítási kapacitás és új módszertani eljárások az MI egy új területének a létrejöttéhez vezettek, a mélytanuláséhoz, amelynek alapvető modelljei a komplex mesterséges neurális hálózatok. A mélytanulás képes lett olyan modelleket létrehozni, amelyek egy tág alkalmazási területet átfogtak és hordozható, azaz újrafelhasználható reprezentációkat biztosítottak. Az első ilyen nagy alkalmazási terület a képfeldolgozás lett, amelynek MI modelljeit az önvezető járművek fejlesztése is finanszírozta. Bár a mesterséges neurális hálózatok tanulásához fűzött több évtizedes remények arról szóltak, hogy ez automatizálja a látens leírók és akár a természetes nyelvi kommunikációban is használt fogalmak megalkotását, a kialakult reprezentációk bár hordozhatóak lettek, értelmezésük rejtély maradt. Vagyis ezeknek a modelleknek egyes részeit lehetséges kombinálni, de részleteiket tekintve úgynevezett nem megérthető, átláthatatlan „fekete dobozok” maradtak. A magyarázhatóság és megbízhatóság hiányának ellenére az egyes egészségügyi területeken létrehozott képfelismerési rendszerek pontossága az emberi szakértői teljesítményt meghaladta, és a trendek azt jelezték, hogy a teljesítmény tovább javulhat jó minőségű, diagnosztikai címkékkel ellátott adatok elérhetőségétől függően [3–6]. Így 2010-től már nem csupán az emberi szakértők által létrehozott diagnosztikai leírókon alapuló, hanem a nyers, például képi adatokat használó MI-rendszerek teljesítménye is elérte nem csupán egy kezdő diagnosztikai szakember vagy több évtizedes gyakorlattal rendelkező szakorvos szintjét, hanem az adott szakterület vezető szakértőinek a szintjét is. A mélytanulási rendszerek kiemelkedő élettudományi alkalmazása például a fehérjék térszerkezetét megjósló AlphaFold MI-rendszer, amelynek pontossága és széles körű alkalmazhatósága tudománytörténi áttörést jelentett a strukturális biológiai kutatásokban.

Adaptív kísérlettervezés MI-vel

A mesterséges intelligencia 2010-ben indult mélytanulási irányát a megerősítéses tanulás 2000-től kibontakozó fejlődése is erősítette. A megerősítéses tanulás új eredményei lehetővé tették az akár igen sok lépésből álló, szekvenciális problémák kezelését is, amelynek nagy figyelmet kapó eredményei voltak a GO játék emberi szakértői szintet messze meghaladó MI-rendszerei. A megerősítéses tanulás egészségügyi felhasználásának példái az adaptív klinikai vizsgálatok, illetve általánosabban az adaptív kísérlettervezés vagy aktív tanulás, amikor az adatok gyűjtését az adatok folyamatos kiértékelése vezérli akár egy előre megadott korlátú költség mellett optimalizálva a teljes folyamatot [7]. Az MI-technológiák egyéni és társadalmi szintű veszélyeit mutatja a megerősítéses tanulás ajánlórendszerekben és közösségi platformokban való alkalmazása, amely egyes elemzések szerint növelheti a digitális függések és egyes pszichiátriai betegségek kialakulásának a valószínűségét.

Általános intelligencia transzformerekkel?

A mesterséges intelligencia mai, széles körű ismertségét a természetes nyelvi szövegek feldolgozásának új szintje hozta el, nevezetesen a mélytanulási rendszerek reprezentációtanulási képessége és az azt kihasználó dialógusrendszerek. A természetes nyelvek kezelésének meghatározó paradigmája a generatív nyelvtanokon alapult, továbbá a matematikai logika szintaxis és szemantika (jelentés) dualitásán. A 2017-ben bevezetett transzformer modellek a mélytanulás legsikeresebb modelljének bizonyultak, amely a természetes nyelvi szövegek reprezentálására egy forradalmi változást hozott. A transzformerek sikeressége azonban messze túlmutat a természetes nyelvi feldolgozáson, mivel a jelek szerint elsőként sikerült az általános emberi háttértudást és egyfajta hétköznapi gondolkodásmódot automatizálni. Továbbá, a transzformeralapú MI-rendszerek már középiskolai és egyetemi vizsgák teljes skáláján is jeles teljesítményt nyújtanak, amely felveti, hogy ezek az MI-rendszerek már az általános intelligenciának az automatizálásai. Ezt tovább erősíti, hogy a transzformerek képesek több modalitású adatot is együttesen feldolgozni és integrálni, azaz például egy egészségügyi képalkotó eljárás kimenetét, a hozzá tartozó zárójelentést, a beteg teljes kórképét gyógyszerezéssel és laboradatokkal, illetve az esethez tartozó konzílium hanganyagát [8]. A multimodális transzformerek képesek a természetes nyelvi képességeiket, az általános emberi háttértudást és egy ilyen multimodális egészségügyi tudást integrálni és egy dialógusrendszerben ezt biztosítani.

Az MI társadalmi eszközzé válása

A diagnosztikai és klinikai döntéstámogatási rendszerek azonban hiába értek el kimagasló szakértői teljesítményt egyes egészségügyi területeken már az ezredforduló előtt is, elterjedésüket a megbízhatóság garantálásának hiánya és a felelőség kérdésének tisztázatlansága is gátolta. Gondoljunk bele, hogy mi mindenre van szükség egy MI-rendszer egészségügyi alkalmazásához: a létrehozásához szakértői tervezés kell, az adatok gyűjtése, előkészítése, elemzése és a modell szakértői megvizsgálása, esetleges finomítása, alkalmazhatóságának behatárolása, majd a modell informatikai megvalósítása, végül a rendszer orvosi alkalmazása, illetve a beteg általi elfogadása és tanácsainak követése [6]. Ez komplex, sok személyt érintő munkafolyamat, amelynek jogi háttere csak napjainkban teremtődik meg a Medical Device Regulation (MDR) és az AI Act jogi szabályozások révén.

Az MI további fejlődésével várható, hogy a racionális egyéni gondolkodás és viselkedés automatizálására irányuló kutatások mellett egyre nagyobb szerepet kap az MI-rendszerek létrehozásának jogi szabályozása és az annak megvalósításához szükséges sokrétű társadalmi szerepvállalás, egészségügyi-mérnöki-jogi hibrid képzésű szakemberekkel [9]. A kialakuló szabályozás pedig analóg módon követni fogja a modern ipari társadalmakra már létező átfogó szabályozásokat, mint például az érintésvédelmi, a gyógysze-rengedélyeztetési vagy a nukleáris, vegyi és biológiai fegyverekre vonatkozó nemzetközi szabályozásokat.

[1] Antal, P. – Fannes, G. – Timmerman, D. – Moreau, Y. – De Moor, B. 2004: Using literature and data to learn Bayesian networks as clinical models of ovarian tumors. Artificial Intelligence in medicine, 30(3), 257–281.

[2] Antal, P. – Reiter, J. – Mátyus, P. 2015: Biomarkerek hálózatától a klinikai döntéstámogatásig. Orvosi Hetilap, 156(51), 2077–2081.

[3] Altrichter, M. – Ludányi, Z. – Horváth, G. 2005: Joint analysis of multiple mammographic views in CAD systems for breast cancer detection. In Image Analysis: 14th Scandinavian Conference, SCIA 2005, Joensuu, Finland, June 19-22, 2005. Proceedings, 760–769. Berlin–Heidelberg, Springer.

[4] Harvey, H. – Heindl, A. – Khara, G. – Korkinof, D. – O’Neill, M. – Yearsley, J. – Karpati, E. – Rijken, T. – Kecskemethy, P. – Forrai, G. 2019: Deep learning in breast cancer screening. Artificial intelligence in medical imaging: opportunities, applications and risks, 187–215.

[5] Pataki, B. Á. – Olar, A. – Ribli, D. – Pesti, A. – Kontsek, E. – Gyöngyösi, B. – Bilecz, Á. – Kovács, T. – Kovács, K. A. – Kramer, Z. – Kiss, A. – Szócska, M. – Csabai, I. 2022: HunCRC: annotated pathological slides to enhance deep learning applications in colorectal cancer screening. Scientific Data, 9(1), 370.

[6] Ng, A. Y. – Oberije, C. J. – Ambrózay, É. – Szabó, E. – Serfőző, O. – Karpati, E. – Fox, G. – Glocker, B. – Morris, E. A. – Forrai, G. – Kecskemethy, P. D. 2023: Prospective implementation of AI-assisted screen reading to improve early detection of breast cancer. Nature Medicine, 29(12), 3044–3049.

[7] Antos, A. – Grover, V. – Szepesvári, C. 2010: Active learning in heteroscedastic noise. Theoretical Computer Science, 411(29–30), 2712–2728.

[8] Antal, M. – Marosi, M. – Nagy, T. – Juhász, G. – Antal, P. 2023: M-BioBERTa: Modular RoBERTa-based Model for Biobank-scale Unified Representations. https://openreview.net/pdf?id=VUR7STEajx

[9] Todorova, C. – Sharkov, G. – Aldewereld, H. – Leijnen, S. – Dehghani, A. – Marrone, S. – Sansone, C. – Lynch, M. – Pugh, J. – Singh, T. – Mezei, K. – Hanák, P. – Antal, P. – Barducci, A. 2023: December. The European AI Tango: Balancing Regulation Innovation and Competitiveness. In Proceedings of the 2023 Conference on Human Centered Artificial Intelligence: Education and Practice, 2–8.

A legégetőbb szakmapolitikai kérdések és vitatémák rovata.