OpenAI raportoi, että GPT-5.5 Instant suoriutuu terveyskysymyksissä yhtä hyvin kuin sen huippuluokan Thinking-mallit ja saa korkeammat pisteet kuin GPT-5.3 Instant HealthBench- ja HealthBench Professional -testeissä . Riippumaton akateeminen tutkimus vahvistaa selkeän sukupolvien välisen parannuksen: kliinisten vinjettien diagnostinen tarkkuus nousi 74,4 %:sta (58/78) GPT-3.5 Turbolla 93,6 %:iin (73/78) GPT-o3:lla ja 91,0 %:iin (71/78) GPT-5:llä
.
Vaativimmassa vertailussa, HealthBench Professionalissa, erikoistunut GPT-5.4 ChatGPT for Clinicians -järjestelmässä sai 59,0 pistettä, mikä ylitti selvästi ihmislääkäreiden perustason 43,7 (p = 3,7 × 10⁻¹⁰) . Kirjoitus- ja dokumentaatiotehtävissä se suoriutui lähes 2 kertaa lääkärien perustason verran (64,1 vs. 32,1)
.
Laajempi Nature-lehdessä (2025) julkaistu meta-analyysi ei löytänyt tilastollisesti merkitsevää eroa generatiivisten tekoälymallien ja lääkäreiden välillä diagnostisissa tehtävissä – lääkärit olivat 9,9 % tarkempia, mutta ero ei ollut merkitsevä (p = 0,10) . Tekoälymallit olivat kuitenkin merkittävästi heikompia kuin erikoislääkärit (tarkkuusero: 15,8 %, p = 0,007)
. Johtopäätös: huipputason tekoäly on suunnilleen yleislääkärin tasolla diagnostiikassa, mutta jää edelleen jälkeen erikoislääkäreistä.
NEJM AI -lehdessä julkaistussa vertaisarvioidussa tutkimuksessa Boston Children's Hospitalin Manton Centerin, Harvardin yliopiston ja OpenAI:n tutkijat käyttivät o3 Deep Research -päättelymallia analysoidakseen uudelleen 376 aiemmin ratkaisematonta lasten harvinaissairaustapausta . Järjestelmä yhdisti kliinisiä piirteitä, periytymismalleja ja tieteellistä kirjallisuutta diagnoosihypoteesien luomiseksi. Se onnistui tunnistamaan diagnoosit 18 lapselle neljällä sairausalueella – 10 neurokehityshäiriötä, 4 hermo-lihassairautta, 2 äkillistä kuolemaa ja 2 varhaislapsuuden psykoositapausta
. Tämä toi lähes 5 %:n diagnostisen saannon, jota tutkijat kutsuivat "täydelliseksi pelinmuuttajaksi", koska nämä genomit oli jo analysoitu perusteellisesti ihmisasiantuntijoiden toimesta
.
Lisäksi Boston Children'sin laajempi tekoälyn integrointi koko organisaatioon on auttanut diagnosoimaan yli 40 harvinaista sairautta, jotka olivat aiemmin jääneet ratkaisematta, säästänyt 60 000 työtuntia vuodessa (vastaa 7 miljoonan dollarin uudelleen kohdennettua työvoimaa) ja vähentänyt toimintakustannuksia samalla kun hoidon saatavuus on parantunut .
OpenAI lanseerasi vuonna 2026 kolme erillistä terveystuotetta:
ChatGPT Health (7. tammikuuta 2026) – Kuluttajaominaisuus, jonka avulla käyttäjät voivat kysellä terveysaiheista, ladata lääketieteellisiä asiakirjoja ja yhdistää turvallisesti hyvinvointisovelluksia, kuten Apple Health ja MyFitnessPal. OpenAI korostaa, että sitä ei ole suunniteltu diagnosointiin tai hoitoon .
OpenAI for Healthcare (8. tammikuuta 2026) – Yritystuote, joka on HIPAA-yhteensopiva ja tarjoaa GPT-5-pohjaisia työkaluja terveydenhuolto-organisaatioille. Se lanseerattiin suurten asiakkaiden, kuten AdventHealthin, Baylor Scott & White Healthin, Boston Children's Hospitalin, Cedars-Sinai Medical Centerin, HCA Healthcare, Memorial Sloan Kettering Cancer Centerin, Stanford Medicine Children's Healthin ja UCSF:n kanssa .
ChatGPT for Clinicians (22. huhtikuuta 2026) – Ilmainen, erikoistunut versio yhdysvaltalaisille lääkäreille, sairaanhoitajille, lääkärinavustajille ja farmaseuteille. Se auttaa lääketieteellisen näytön tiivistämisessä, kliinisen dokumentaation laatimisessa, potilasohjemateriaalien tuottamisessa sekä kliinisten ohjeiden ja tutkimuksen integroinnissa . HealthBench Professionalissa tämä työkalu ylitti merkittävästi ihmislääkäreiden suorituskyvyn
.
Neljäs mallipäivitys, GPT-Rosalind (kesäkuu 2026), yhdisti GPT-5.5:n agenttisen koodauksen tehostettuun tieteelliseen älykkyyteen biolääketieteen tutkimuksen työnkulkuja varten .
OpenAI:n terveyspanostus vuonna 2026 on merkittävä ja sitä tukevat todelliset tulokset – 52,5 %:n laskusta lääketieteellisissä harhoissa aina 18 uuteen ratkaistuun harvinaissairaustapaukseen. Yritys on rakentanut selkeän kolmitasoisen strategian: kuluttajavalistus, ilmaiset työkalut lääkäreille ja yritysratkaisut. Vaikka varovaisuus on paikallaan – OpenAI:n vertailuarvot ovat yrityksen itsensä laatimia, ja Nature-meta-analyysi vahvistaa, että tekoäly on edelleen erikoislääkäreitä jäljessä – näyttö viittaa siihen, että rutiiniterveyskysymyksissä ja kliinisissä tukitehtävissä GPT-5.5 Instant on nyt aidosti hyödyllinen työkalu, ei pelkkä lelu.
Comments
0 comments