Szerző:
Dr. Pukoli Dániel neurológus adjunktus, Esztergomi Vaszary Kolos Kórház, programozó, a Vakcinainfó – Az orvos válaszol Facebook-csoport alapító tagja
A technológiai innovációk robbanásszerű fejlődése az elmúlt évtizedekben alapvetően alakította át az orvostudományt. A mesterséges intelligencia (MI) megjelenése és integrációja az egészségügyi szektorban nem csupán új eszközöket és módszereket hozott, hanem paradigmaváltást is eredményezett a diagnosztika, a terápiatervezés és a betegellátás terén. Az MI alkalmazása lehetővé teszi az orvosok számára, hogy hatékonyabban, pontosabban és személyre szabottabban nyújtsanak ellátást. Ebben a cikkben részletesen bemutatjuk a generatív mesterséges intelligencia alapjait és működési mechanizmusait. Különös hangsúlyt fektetünk a szövegkorpuszokra, a vektorizációra, valamint a gépi és emberi felügyelettel történő tanulásra és finomhangolásra. Továbbá, egy saját fejlesztésű, magyar mesterséges intelligencia alapú orvosi chatbot működésén keresztül ismertetjük az orvostudományban való alkalmazásának aktuális lehetőségeit.
Mi az a mesterséges intelligencia?
A mesterséges intelligencia az informatika azon ága, amelynek célja olyan hardverek és szoftverek
fejlesztése, amelyek képesek emberi jellegű feladatok elvégzésére, mint például a tanulás, érvelés,
problémamegoldás és döntéshozatal. Az MI-rendszerek képesek önállóan tanulni az adatokból,
alkalmazkodni az új információkhoz és optimalizálni működésüket a feladatok hatékonyabb
végrehajtása érdekében.
Az MI fejlődése számos területre kiterjed, beleértve a gépi tanulást, a természetes nyelvfeldolgozást,
a számítógépes látást és a robotikát. Ezek az alágazatok lehetővé teszik az MI számára, hogy
különböző típusú adatokat dolgozzon fel és értelmezzen, ami különösen fontos az
orvostudományban, ahol a komplex és változatos adatok elemzése kulcsfontosságú.
Az MI működése: gépi tanulás és neurális hálók
A gépi tanulás alapjai
A gépi tanulás az MI egyik legfontosabb területe, amely algoritmusok és statisztikai modellek
segítségével teszi lehetővé a rendszerek számára, hogy tanuljanak az adatokból anélkül, hogy explicit
módon programoznánk minden lépést. A gépi tanulás fő kategóriái:
● Felügyelt tanulás: az algoritmust előre címkézett adatokkal tanítjuk. A bemeneti adatokhoz
(inputok) ismert kimeneti értékek (outputok vagy ún. célváltozók) tartoznak. Az algoritmus
célja, hogy megtanulja az inputok és outputok közötti kapcsolatot, és képes legyen új
inputokra előrejelzéseket adni. Hasznos a diagnosztikai modellek kialakításában, ahol az
algoritmust ismert diagnózisokkal rendelkező betegadatokkal tanítják.
● Felügyelet nélküli tanulás: itt az algoritmus címkézetlen adatokból tanul, önállóan keresve a
mintákat, struktúrákat vagy csoportosulásokat egy adathalmazban. Ez különösen hasznos
lehet például a betegcsoportok azonosításában és alkalmazható új betegségmintázatok
felfedezésére az adatokban.
● Megerősítéses tanulás: az algoritmus interakcióba lép a környezetével, döntéseket hoz, és
visszajelzést kap – általában emberi beavatkozással – a teljesítményéről, amely alapján javítja
a döntéshozatali stratégiáját.
Neurális hálók és mélytanulás
A neurális hálók az MI-rendszerek olyan típusai, amelyek az emberi agy neuronhálózatainak
működését modellezik. Ezek a hálózatok több rétegből állnak:
● Bemeneti réteg: az adatok bevitele történik itt.
● Rejtett rétegek: ezek a rétegek feldolgozzák az információt, és minél több ilyen réteg van,
annál mélyebb a hálózat (innen a „mélytanulás” elnevezés).
● Kimeneti réteg: itt történik a végső eredmény vagy előrejelzés előállítása.
A mélytanulási modellek, amelyek több rejtett réteggel rendelkeznek, képesek komplex mintázatok
és összefüggések felismerésére a nagy adathalmazokban.
Nyelvi modellek, szövegkorpuszok és vektorizáció az MI-ben
Nyelvi modellek és szövegkorpuszok
A nyelvi modellek az MI azon ágai, amelyek a nyelvi adatok feldolgozására és megértésére
specializálódtak. Ezek a modellek hatalmas mennyiségű, strukturált szöveges adatot, úgynevezett
szövegkorpuszokat használnak tanulásra. A szövegk
orpuszok lehetnek orvosi dokumentációk,kutatási publikációk vagy akár betegadatok.
Vektorizáció: a szöveg numerikus reprezentációja
A szöveges adatok feldolgozásához a nyelvi modellek a szavakat és mondatokat numerikus formába,
azaz vektorokká alakítják. A vektorizáció során a szavakat többdimenziós térben reprezentálják, ahol
a szavak közötti távolság szemlélteti azok jelentésbeli hasonlóságát. Ez lehetővé teszi a számítógépek
számára a nyelvi adatok matematikai és statisztikai módszerekkel való elemzését.
Példa a vektorizációra az orvostudományban
Ha egy MI-rendszernek meg kell értenie a „tüdőgyulladás” és a „légúti fertőzés” közötti kapcsolatot,
a vektorizáció segítségével a két kifejezést olyan vektorokká alakítja, amelyek közel vannak
egymáshoz a többdimenziós térben. Így a rendszer felismeri, hogy a két kifejezés hasonló vagy
összefüggő.
Nagy nyelvi modellek alkalmazása az orvostudományban
Az emberi felügyelet szerepe
Az emberi szakértelem kulcsfontosságú a gépi tanulási modellek fejlesztésében és
finomhangolásában. Az orvosok és szakértők bevonása lehetővé teszi a modellek teljesítményének
javítását és a klinikai relevancia biztosítását. A finomhangolás során a modellek paramétereit és
hiperparamétereit módosítják a jobb eredmények elérése érdekében.
● Adatcímkézés és előkészítés: orvosok és szakértők segítenek a pontos adatcímkézésben,
biztosítva a megbízható tanulási folyamatot.
● Modell validálása: az emberi felügyelet biztosítja, hogy a modell klinikailag releváns és
megbízható eredményeket adjon.
● Etikai felügyelet: az emberi szakértők gondoskodnak arról, hogy a modell megfeleljen az
etikai normáknak.
Finomhangolás
A finomhangolás a modell teljesítményének optimalizálását jelenti:
● Hiperparaméterek beállítása: olyan paraméterek módosítása, mint a tanulási ráta vagy a
hálózat mélysége.
● Adatbővítés: az adathalmaz kibővítése vagy módosítása a jobb általánosítás érdekében.
● Iteratív fejlesztés: a modell folyamatos tesztelése és javítása emberi visszajelzések alapján.
Transfer learning (transzformerek) és előre betanított modellek használata
A nyelvi modellek, mint például a transzformerek képesek a természetes nyelv megértésére és
generálására (innen a GPT: generative pre-trained transformer). Az orvostudományban gyakran
alkalmaznak előre (köztük neurális hálók révén mélytanulással) betanított nagy nyelvi modelleket
(large language modell, LLM), amelyeket általános szövegkorpuszokon tanítottak, majd
finomhangolnak specifikus orvosi feladatokra emberi felügyelet alatt.
Hogyan alkalmazhatóak a nagy nyelvi modellek az orvosi diagnosztikában és a terápia
megtervezésében?
Diagnosztika
Az MI-rendszerek az előzetesen finomhangolt, emberi felügyelet alatt betanított, specifikált nagy
nyelvi modellek segítségével jelentősen javítják a diagnosztikai folyamatokat – klinikai
döntéstámogatást elérhetővé téve –, valós idejű ajánlásokat nyújtanak az orvosoknak a betegellátás
során.
Egy ilyen döntéstámogató rendszer a saját fejlesztésű Magyar Orvosi ChatGPT Pro webalkalmazás is,
mely az egészségügyi ellátás hagyományos munkafolyamatának kiegészítéseként, szakorvosok által
ellenőrzötten, evidence-based módon képes felállítani egy lehetséges differenciáldiagnosztikai listát
valószínűség szerint az orvos által közölt adatok (beleértve az anamnézist, jelen panaszt, státuszt,
szedett gyógyszereket, labor- és képalkotó eredményeket stb.) alapján. Ez a szoftver több tízezer
szabadon hozzáférhető szakirodalmi forrásokból, lexikonokból, guideline-okból tréningezve
„tanulta meg” az orvostudományt, szigorúan evidence-based módon.
Terápiatervezés
A Magyar Orvosi ChatGPT Pro nemcsak a differenciáldiagnosztikát támogatja, hanem felállít egy
lehetséges diagnosztikai és kezelési tervet is, amely támogatja az orvost a megfelelő betegellátás
(protokollok, irányelveknek alapján) megtervezésében. Képes labor- és különböző képalkotási leletek
értelmezésére, továbbá bármilyen orvosi témájú kérdés megválaszolására, mindezt szakirodalmi
hivatkozások és evidenciaszintek megjelölésével.
A legjobb találatokat tekintve a megoldási pontosság az általános orvos és szakorvos közé esik, így
szinte mindenki tudja majd használni a saját szakterületének megfelelően, legyen szó
differenciáldiagnosztikai kérdésről, diagnosztikus teendőkről, terápiás javaslatról.
Összegzés
Az elmúlt években a mesterséges intelligencia fejlődése jelentős előrelépést jelentett a betegellátás
és az orvosi diagnosztika területén (például stroke-ellátás). Az MI-alapú megoldások képesek
pontosabb diagnózisok felállítására, személyre szabott terápiás javaslatok kidolgozására, valamint a
kezelési eredmények javítására azáltal, hogy mélyebb betekintést nyújtanak a páciensek egészségi
állapotába.
Ezek a technológiák lehetővé teszik számunkra, hogy gyorsabban és hatékonyabban értékeljük az
egészséggel kapcsolatos adatokat, így a kezelési terv kialakítása során pontosabb döntéseket
hozhassunk. Az MI-alapú diagnosztikai eszközök és terápiás megoldások használata emellett
csökkentheti az emberi hiba lehetőségét és növelheti a kezelések sikerességét is. Ez a webalkalmazás
egy izgalmas és innovatív lehetőség a magyar orvosok számára, amely hozzájárulhat mind a betegek
egészségi állapotának javításához és kezelésének hatékonyságához, mind pedig az
orvoskollégák betegellátás során meghozott döntéseinek támogatásához.