OpenAI rapporterer at GPT-5.5 Instant nå presterer på nivå med sine avanserte Thinking-modeller på helsespørsmål og scorer høyere enn GPT-5.3 Instant på HealthBench og HealthBench Professional . Uavhengig akademisk forskning bekrefter en klar forbedring mellom generasjonene: diagnostisk nøyaktighet på kliniske vinjetter steg fra 74,4 % (58/78) for GPT-3.5 Turbo til 93,6 % (73/78) for GPT-o3 og 91,0 % (71/78) for GPT-5
.
På den mest krevende referansetesten, HealthBench Professional, scoret det spesialiserte GPT-5.4-systemet i ChatGPT for Clinicians 59,0, noe som var betydelig bedre enn den menneskelige lege-baseline på 43,7 (p = 3,7 × 10⁻¹⁰) . Det presterte nesten 2 ganger lege-baseline på skrive- og dokumentasjonsoppgaver (64,1 vs. 32,1)
.
En bredere metaanalyse publisert i Nature (2025) fant ingen statistisk signifikant forskjell mellom generative KI-modeller og leger på diagnostiske oppgaver – legene var 9,9 % mer nøyaktige, men forskjellen var ikke signifikant (p = 0,10) . KI-modeller var imidlertid signifikant dårligere enn ekspertleger (forskjell i nøyaktighet: 15,8 %, p = 0,007)
. Hovedkonklusjonen: avansert KI er omtrent på nivå med en allmennlege på diagnostikk, men henger fortsatt etter spesialister.
I en fagfellevurdert studie publisert i NEJM AI brukte forskere fra Boston Children's Hospitals Manton Center, Harvard University og OpenAI o3 Deep Research-resonneringsmodellen til å reanalysere 376 tidligere uløste pediatriske tilfeller med sjeldne sykdommer . Systemet koblet kliniske kjennetegn, arvemønstre og vitenskapelig litteratur for å generere diagnostiske hypoteser. Det identifiserte med suksess diagnoser for 18 barn innen fire sykdomsområder – 10 nevrologiske utviklingsforstyrrelser, 4 nevromuskulære lidelser, 2 plutselige dødsfall og 2 tilfeller av tidlig barndompsykose
. Dette ga en diagnostisk gevinst på nesten 5 %, noe forskerne kalte en "total game changer" ettersom disse genomene allerede var grundig analysert av menneskelige eksperter
.
I tillegg har Boston Children's bredere KI-integrasjon på tvers av organisasjonen hjulpet med å diagnostisere mer enn 40 sjeldne tilstander som tidligere ikke var løst, spart 60 000 arbeidstimer årlig (tilsvarende 7 millioner dollar i omarbeidet arbeidskraft) og redusert driftskostnadene samtidig som tilgangen til behandling er utvidet .
OpenAI lanserte tre distinkte helseprodukter i 2026:
ChatGPT Health (7. januar 2026) – En forbrukerfunksjon som lar brukere stille spørsmål om helseemner, laste opp medisinske dokumenter og trygt koble til velværeapper som Apple Health og MyFitnessPal. OpenAI understreker at den ikke er designet for diagnose eller behandling .
OpenAI for Healthcare (8. januar 2026) – Et bedriftsprodukt som er HIPAA-kompatibelt og tilbyr GPT-5-drevne verktøy for helseorganisasjoner. Det ble lansert med store kunder som AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health og UCSF .
ChatGPT for Clinicians (22. april 2026) – En gratis, spesialisert versjon for verifiserte leger i USA, inkludert sykepleiere og farmasøyter. Den hjelper med å oppsummere medisinsk evidens, utkast til klinisk dokumentasjon, generere pasientundervisningsmateriell og integrere kliniske retningslinjer og forskning . På HealthBench Professional overgikk dette verktøyet menneskelig legeprestasjon
.
En fjerde modelloppdatering, GPT-Rosalind (juni 2026), kombinerte GPT-5.5s agentiske koding med forbedret vitenskapelig intelligens for biomedisinske forskningsarbeidsflyter .
OpenAIs helsesatsing i 2026 er omfattende og støttet av virkelige resultater – fra en 52,5 % reduksjon i medisinske hallusinasjoner til 18 nylig løste tilfeller av sjeldne sykdommer. Selskapet har bygget en tydelig tre-delt strategi: forbrukerundervisning, gratis klinikerverktøy og bedriftsdistribusjon. Selv om forsiktighet er på sin plass – OpenAIs referansetester er interne, og Nature-metaanalysen bekrefter at KI fortsatt henger etter ekspertleger – tyder bevisene på at for rutinemessige helsespørsmål og kliniske støtteoppgaver er GPT-5.5 Instant nå et virkelig nyttig verktøy, ikke bare en leke.
Comments
0 comments