OpenAI meldt dat GPT-5.5 Instant nu vergelijkbaar presteert met zijn geavanceerde Thinking-modellen op gezondheidsvragen en hoger scoort dan GPT-5.3 Instant op HealthBench en HealthBench Professional . Onafhankelijk academisch onderzoek bevestigt een duidelijke generatieverbetering: de diagnostische nauwkeurigheid op klinische vignetten steeg van 74,4% (58/78) voor GPT-3.5 Turbo naar 93,6% (73/78) voor GPT-o3 en 91,0% (71/78) voor GPT-5
.
Op de meest rigoureuze benchmark, HealthBench Professional, scoorde het gespecialiseerde systeem GPT-5.4 in ChatGPT voor Clinici 59,0, aanzienlijk beter dan de menselijke artsenbaseline van 43,7 (p = 3,7 × 10⁻¹⁰) . Het presteerde bijna 2× de artsenbaseline op schrijf- en documentatietaken (64,1 vs. 32,1)
.
Een bredere meta-analyse gepubliceerd in Nature (2025) vond geen statistisch significant verschil tussen generatieve AI-modellen in het algemeen en artsen op diagnostische taken – artsen waren 9,9% nauwkeuriger, maar het verschil was niet significant (p = 0,10) . AI-modellen waren echter significant slechter dan expert-artsen (verschil in nauwkeurigheid: 15,8%, p = 0,007)
. De conclusie: geavanceerde AI is ruwweg vergelijkbaar met een algemene arts op het gebied van diagnostiek, maar blijft nog steeds achter bij specialisten.
In een peer-reviewed studie gepubliceerd in NEJM AI gebruikten onderzoekers van het Manton Center van het Boston Children's Hospital, Harvard University en OpenAI het o3 Deep Research redeneermodel om 376 voorheen onopgeloste pediatrische zeldzame ziektegevallen opnieuw te analyseren . Het systeem koppelde klinische kenmerken, overervingspatronen en wetenschappelijke literatuur om diagnostische hypothesen te genereren. Het identificeerde met succes diagnoses voor 18 kinderen in vier ziektegebieden – 10 neurologische ontwikkelingsstoornissen, 4 neuromusculaire aandoeningen, 2 plotselinge sterfgevallen en 2 gevallen van vroege kinderpsychose
. Dit leverde een diagnostisch rendement van bijna 5% op, wat onderzoekers een "totale game changer" noemden, gezien het feit dat deze genomen al uitputtend waren geanalyseerd door menselijke experts
.
Daarnaast heeft de bredere AI-integratie van het Boston Children's Hospital in de hele organisatie geholpen bij het diagnosticeren van meer dan 40 zeldzame aandoeningen die voorheen onopgelost waren gebleven, heeft het 60.000 werkuren per jaar bespaard (gelijk aan $7 miljoen aan heringezette arbeid) en heeft het de operationele kosten verlaagd terwijl de toegang tot zorg werd uitgebreid .
OpenAI lanceerde in 2026 drie verschillende gezondheidsproducten:
ChatGPT Health (7 januari 2026) – Een consumentenfunctie waarmee gebruikers vragen kunnen stellen over gezondheidsonderwerpen, medische documenten kunnen uploaden en veilig wellness-apps zoals Apple Health en MyFitnessPal kunnen koppelen. OpenAI stelt nadrukkelijk dat het niet bedoeld is voor diagnose of behandeling .
OpenAI voor de Gezondheidszorg (8 januari 2026) – Een enterprise, HIPAA-compliant product met GPT-5-gestuurde tools voor zorgorganisaties. Het werd gelanceerd met grote klanten waaronder AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health en UCSF .
ChatGPT voor Clinici (22 april 2026) – Een gratis, gespecialiseerde versie voor geverifieerde Amerikaanse artsen, verpleegkundig specialisten, physician assistants en apothekers. Het helpt met het samenvatten van medisch bewijs, het opstellen van klinische documentatie, het genereren van patiëntenvoorlichtingsmateriaal en het integreren van klinische richtlijnen en onderzoek . Op HealthBench Professional overtrof deze tool aanzienlijk de prestaties van menselijke artsen
.
Een vierde modelupdate, GPT-Rosalind (juni 2026), combineerde de agentische codering van GPT-5.5 met verbeterde wetenschappelijke intelligentie voor biomedische onderzoeksworkflows .
OpenAI's gezondheidsinspanningen in 2026 zijn substantieel en worden ondersteund door echte resultaten – van een daling van 52,5% in medische hallucinaties tot 18 nieuw opgeloste zeldzame ziektegevallen. Het bedrijf heeft een duidelijke drieledige strategie opgebouwd: consumentenvoorlichting, gratis clinici-tools en enterprise-implementatie. Hoewel voorzichtigheid geboden is – OpenAI's benchmarks zijn intern, en de Nature-meta-analyse bevestigt dat AI nog steeds achterloopt op expert-artsen – suggereert het bewijs dat GPT-5.5 Instant voor routinematige gezondheidsvragen en klinische ondersteuningstaken nu een echt nuttig hulpmiddel is, niet slechts een speeltje.
Comments
0 comments