Tekoäly lääketieteellisessä tutkimuksessa - ChatGPT-4 ylilääkärin assistenttina
Kuvittelet, että ystäväsi sairastuu, ja saavut palaveriin, jossa maailman 10 parasta kyseisen sairauden asiantuntijaa ovat valmiina vastaamaan kysymyksiisi - ilmaiseksi ja välittömästi. Tämän järjestäminen ihmisten kesken on käytännön mahdottomuus, mutta tekoälyn avulla päästään jo lähelle.
Maksullinen versio ChatGPT:stä (GPT-4) on lääketieteen erityisasiantuntija. Se on tutkimuksissa osoittautunut jopa etevämmäksi kuin monet lääketieteeseen erikoistuneet tekoälyt(1). Lisäksi siinä on se hieno piirre, että sen voi pyytää selittämään asian niin kuin kymmenvuotiaalle - ilman lääketieteen erikoistermejä. Voit syöttää sinne myös oman lääkärinlausuntosi ja pyytää sen kertomaan, mitä siinä sanotaan. Ehkä silloin ensimmäisen kerran ymmärrät, mitä lääkäri on siihen kirjoittanut. (Jos pelkäät tietojesi vuotava, voi laittaa ChatGPT:n historian pois päältä, jolloin OpenAI lisenssiehtojensa mukaisesti ei käytä tietoja tekoälyn opettamiseen.)
Sain tilaisuuden huhti-toukokuussa tänä vuonna (2023) syventyä GPT-4:n osaamiseen lääketieteen alueella alan asiantuntijan kanssa. Syventyminen tapahtui useamman viikon aikana ja se oli tiedon ja ymmärryksen hankintaa siitä, kuinka syvällisesti tämä tekoäly todella ymmärtää lääketiedettä ja tieteellistä tutkimusta.
Tutustuminen aiheeseen oli epämuodollista ja sitä voidaan kuvata tilaisuuteen tarttumiseksi. Siitä voidaan kuitenkin näin jälkeenpäin erottaa kolme vaihetta: 1) haarukointi yksittäisillä kysymyksillä (one-shot kehotteet), 2) kontekstin luonti olemassa olevien lääketieteellisten tutkimusten avulla ja 3) syvällinen pureutuminen solun sisäisen signaalitien ymmärtämiseen ja mutaatioiden vaikutukset siihen.
Ensimmäinen vaihe
Ensimmäisessä vaiheessa tutkittiin GPT-4:n lääketieteellistä kyvykkyyttä suorilla kysymyksillä. Jo tämä antoi nopeasti ymmärryksen siitä, että sen kanssa voidaan tehokkaasti keskustella lääketieteellisistä aiheista. Se pysyy mukana keskustelussa, ymmärtää kysymykset ja osaa ottaa huomioon kysymysten ympärillä olevat tekijät tuoden keskusteluun mukaan uusia ulottuvuuksia.
Keskustelun ensimmäinen vaihe paljasti, että se tuntee mutaatioiden (SNP) vaikutuksen genomin eri alueisiin. Se ymmärtää solun toimintaa, metabolisia prosesseja ja signaaliteitä. Kaikki tämä antoi aihetta tutkia asiaa syvemmin.
Toinen vaihe
Toisessa vaiheessa ChatGPT:lle annettiin kymmenen eri lääketieteellisen tutkimuksen tiedot (2). Tämän kontekstin luonti ChatGPT:n pureskeltavaksi oli nopeaa ja yksinkertaista. Thetiin haku PubMed-tietokantaan ja haun tulosten kopiointi suoraan ChatGPT:n kehotteeseen. (PubMed tietokanta sisältää käytännössä suurimman osan lääketieteen tutkimuksista maailmanlaajuisesti.) Tämän jälkeen sitä pyydettiin tekemään yhteenvedot näistä tutkimuksista. Yhteenvetojen perusteella valittiin pari tutkimusta, joista pyysin tarkemman analyysin sekä vertailun keskenään.
Tässä vaiheessa kiinnostuin syvemmin, mistä se voi tietää näiden tutkimusten sisällön näin tarkkaan, sillä kyseisellä ChatGPT versiolla ei ollut reaaliaikaista pääsyä Internettiin, vaikka hakutuloksissa olikin linkit alkuperäisiin tutkimuksiin. Paljastui pitkähkön kaivelun jälkeen, että sille on opetettu kaikki PubMedin tietokannan tutkimusten johdanto-osuudet.
Lisäksi paljastui, että joistakin tutkimuksista se tietää enemmän kuin toisista. Tämän eron tutkiminen johti paljastukseen, että joihinkin toisiin tutkimusartikkelitietokantoihin sillä on ollut laajempi pääsy. Se oli siis opetettu joillakin tutkimuksilla kokonaisuudessaan.
Se pystyi myös ymmärtämään tieteellisen tutkimuksen periaatteita syvällisesti antamalla kritiikkiä tutkimuksista. Pyysin sitä myös ehdottamaan sopivan jatkotutkimuksen. Se ehdotti, kritiikkiinsä viitaten, tutkimusta, joissa otanta olisi laajempi ja kansainvälisempi. Se siis ymmärsi hyvin tieteellisen tutkimuksen tekemistä ja vaikkapa kansallist erot ihmisten genomissa.
Kolmas vaihe
Kolmannessa vaiheessa tutkimme insuliinin signaalitietä solun sisällä. Tämä on moniportainen signaalireitti, joka kulkee usean eri proteiinin kautta. Tutkimme myös miten GPT-4 ymmärtää eri pistemutaatioiden vaikutuksen näihin proteiineihin. Tämä on kiinnostava alue lääketieteessä, koska jotkin lääkeaineet eivät auta potilasta, jos hänellä on tietty mutaatio. Testasimme myös, mitä lääkeaineita se ehdottaa tällaisten mutaatioiden tapauksessa.
Yllättävää tällaisessa keskustelussa oli, että se osasi kieltä, jota en tiennyt olevan olemassa: Systems Biology Markup Language (SBML). GPT-4 on suuri kielimalli. Se osaa noin sataa puhuttua kieltä, mutta sen lisäksi se osaa kymmeniä, ellei satoja, tietokoneiden käyttämiä kieliä. Yksi näistä kielistä on tämä biologian ja lääketieteen tutkimuksissa käytetty systeemikieli SBML. GPT-4 osasi kuvailla insuliinin signaalitietä tällä kielellä. Meillä ei kuitenkaan ollut mahdollisuutta testata tuottiko GPT-4 toimivaa koodia, mutta olettaisin näin, koska se osaa tuottaa toimivaa koodia muillakin ohjelmointikielillä.
Toinen yllätys oli, että se osasi arvioida, mitä vaihtoehtoisia reittejä solu voisi käyttää tietyn pistemutaation tapauksessa. Näistä on mahdoton sanoa, että toistiko se vain jonkin tutkimuksen tuloksia vai osasiko se päätellä asian muista tekijöistä.
Lopuksi
Lopputulema näistä pitkähköistä mutta vapaamuotoisista testeistä oli, että GPT-4 on erityisen kykenevä ymmärtämään ihmisen biologiaa syvällisesti. Tietonsa se on saanut niistä lääketieteen tutkimuksista, millä se on opetettu. Jo tänään se toimii sellaisenaan erinomaisena tutkijan assistenttina ja nopeuttaa esimerkiksi lääkkeiden kehittämistä. Lisäksi sen käyttö lääkäreiden kouluttamisessa ja kysymyksiin vastauksissa olisi hyödyllistä. Kuitenkin niin tässä kuin muussakin ChatGPT:n käytössä tuli vastaan se, että sen asema on parhaillaan juuri assistenttina - ei johtavana tutkijana. Myös yksityiskäytössä on syytä muistaa, että se ei ole lääkäri. Tosin lääkärikäyntiin valmistautumisessa se voi olla hyvä sparraaja, jotta sitten lääkärissä ollessaan osaa tehdä oikeat kysymykset ja ymmärtää lääkärin 'kieltä'.
Yllä tiiviisti kuvaamani keskustelurypäs on pisin ja yksityiskohtaisin tutkimukseni ChatGPT:n osaamiseen. Keskustelut olivat pitkiä ja niitä oli useita. Liitänkin tähän vain lyhyen esimerkin, jonka toistin vain tätä blogikirjoitusta varten. Tästä esimerkistä näkee hieman sen tyyliä keskustella tämän aihealueen asioista: https://chat.openai.com/share/a7c32859-7d16-4154-997c-1c6f8cf9ccd5
![]() |
Solu ja sen tietojenkäsittely on monimutkaista ja siksi on hämmästyttävää, että tekoäly pystyy sitä ymmärtämään, vaikka on pohjimmiltaan kielimalli. |
Viitteet:
1. Capabilities of GPT-4 on Medical Challenge Problems Harsha Nori , Nicholas King , Scott Mayer McKinney , Dean Carignan , and Eric Horvitz: https://www.microsoft.com/en-us/research/uploads/prod/2023/03/GPT-4_medical_benchmarks.pdf
2. Tutkimukset, jotka annettiin ChatGPT:n analysoitavaksi: https://pubmed.ncbi.nlm.nih.gov/?term=male+hormonal+contraception+efficacy+testosterone+undecaonate+trial+men&sort=pubdate
Kommentit
Lähetä kommentti