OpenAI rapporterer, at GPT-5.5 Instant nu klarer sig på niveau med deres avancerede Thinking-modeller på sundhedsspørgsmål og scorer højere end GPT-5.3 Instant på HealthBench og HealthBench Professional . Uafhængig akademisk forskning bekræfter en klar generationsforbedring: Diagnostisk nøjagtighed på kliniske cases steg fra 74,4 % (58/78) for GPT-3.5 Turbo til 93,6 % (73/78) for GPT-o3 og 91,0 % (71/78) for GPT-5
.
På den mest krævende benchmark, HealthBench Professional, scorede det specialiserede GPT-5.4 i ChatGPT for Clinicians-system 59,0 – markant bedre end den menneskelige læge-baseline på 43,7 (p = 3,7 × 10⁻¹⁰) . Det præsterede næsten 2 gange lægernes baseline på opgaver inden for skrivning og dokumentation (64,1 vs. 32,1)
.
En bredere meta-analyse offentliggjort i Nature (2025) fandt ingen statistisk signifikant forskel mellem generative AI-modeller samlet set og læger på diagnostiske opgaver – læger var 9,9 % mere præcise, men forskellen var ikke signifikant (p = 0,10) . Dog var AI-modeller signifikant ringere end ekspertlæger (forskel i nøjagtighed: 15,8 %, p = 0,007)
. Konklusionen er, at AI på frontlinjen er nogenlunde på niveau med en almen praktiserende læge, men stadig halter bagefter specialister.
I et peer-reviewet studie offentliggjort i NEJM AI brugte forskere fra Boston Children's Hospitals Manton Center, Harvard University og OpenAI o3 Deep Research-modellen til at genanalysere 376 tidligere uløste pædiatriske tilfælde af sjældne sygdomme . Systemet forbandt kliniske træk, arvemønstre og videnskabelig litteratur for at generere diagnostiske hypoteser. Det identificerede med succes diagnoser for 18 børn fordelt på fire sygdomsområder – 10 neuro-udviklingsforstyrrelser, 4 neuromuskulære lidelser, 2 pludselige dødsfald og 2 tilfælde af tidlig barndomspsykose
. Dette gav et diagnostisk udbytte på næsten 5 %, hvilket forskerne kaldte en "total game changer", da disse genomer allerede var blevet grundigt analyseret af menneskelige eksperter
.
Derudover har Boston Children's bredere AI-integration på tværs af organisationen hjulpet med at diagnosticere mere end 40 sjældne tilstande, der tidligere var uopklarede, sparet 60.000 arbejdstimer årligt (svarende til 7 millioner dollars i omfordelt arbejdskraft) og reduceret driftsomkostningerne, samtidig med at adgangen til pleje er blevet udvidet .
OpenAI lancerede tre forskellige sundhedsprodukter i 2026:
ChatGPT Health (7. januar 2026) – En forbrugerfunktion, der giver brugerne mulighed for at stille spørgsmål om sundhedsemner, uploade medicinske dokumenter og sikkert forbinde wellness-apps som Apple Health og MyFitnessPal. OpenAI understreger, at den ikke er designet til diagnose eller behandling .
OpenAI for Healthcare (8. januar 2026) – Et enterprise-produkt, der er HIPAA-kompatibelt og tilbyder GPT-5-drevne værktøjer til sundhedsorganisationer. Det blev lanceret med store kunder som AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health og UCSF .
ChatGPT for Clinicians (22. april 2026) – En gratis, specialiseret version til verifikerede amerikanske læger, sygeplejersker med speciale, lægeassistenter og farmaceuter. Den hjælper med at opsummere medicinsk evidens, udkast til klinisk dokumentation, generere patientundervisningsmateriale og integrere kliniske retningslinjer og forskning . På HealthBench Professional overgik dette værktøj markant menneskelige lægers præstation
.
En fjerde modelopdatering, GPT-Rosalind (juni 2026), kombinerede GPT-5.5's agentiske kodning med forbedret videnskabelig intelligens til biomedicinske forskningsarbejdsgange .
OpenAI's sundhedssatsning i 2026 er substantiel og understøttet af reelle resultater – fra et fald på 52,5 % i medicinske hallucinationer til 18 nyligt diagnosticerede tilfælde af sjældne sygdomme. Virksomheden har opbygget en klar trelagsstrategi: forbrugeruddannelse, gratis klinikerværktøjer og enterprise-implementering. Selvom forsigtighed er på sin plads – OpenAI's benchmarks er interne, og Nature-metaanalysen bekræfter, at AI stadig halter bagefter ekspertlæger – tyder beviserne på, at GPT-5.5 Instant til rutinemæssige sundhedsspørgsmål og kliniske supportopgaver nu er et ægte nyttigt værktøj, ikke bare et legetøj.
Comments
0 comments