OpenAI rapporterar att GPT-5.5 Instant nu presterar jämförbart med sina främsta tänkandemodeller på hälsofrågor och får högre poäng än GPT-5.3 Instant på HealthBench och HealthBench Professional . Oberoende akademisk forskning bekräftar en tydlig generationsförbättring: diagnostisk noggrannhet på kliniska vinjetter steg från 74,4 % (58/78) för GPT-3.5 Turbo till 93,6 % (73/78) för GPT-o3 och 91,0 % (71/78) för GPT-5
.
På det mest rigorösa testet, HealthBench Professional, fick det specialiserade GPT-5.4-systemet i ChatGPT för Clinicians 59,0, vilket var betydligt högre än den mänskliga läkarbaslinjen på 43,7 (p = 3,7 × 10⁻¹⁰) . Det presterade nästan 2 gånger läkarbaslinjen på skriv- och dokumentationsuppgifter (64,1 mot 32,1)
.
En bredare meta-analys publicerad i Nature (2025) fann ingen statistiskt signifikant skillnad mellan generativa AI-modeller som helhet och läkare i diagnostiska uppgifter – läkare var 9,9 % mer träffsäkra, men skillnaden var inte signifikant (p = 0,10) . Däremot var AI-modellerna betydligt sämre än expertläkare (skillnad i noggrannhet: 15,8 %, p = 0,007)
. Slutsatsen: frontlinjens AI är ungefär jämförbar med en allmänläkare, men ligger fortfarande efter specialister.
I en peer-review-granskad studie publicerad i NEJM AI använde forskare från Boston Children's Hospitals Manton Center, Harvard University och OpenAI o3 Deep Research-modellen för att omanalysera 376 tidigare olösta pediatriska fall av sällsynta sjukdomar . Systemet kopplade samman kliniska egenskaper, ärftlighetsmönster och vetenskaplig litteratur för att generera diagnostiska hypoteser. Det identifierade framgångsrikt diagnoser för 18 barn inom fyra sjukdomsområden – 10 neuropsykiatriska tillstånd, 4 neuromuskulära sjukdomar, 2 plötsliga dödsfall och 2 fall av tidig barndomspsykos
. Detta gav en diagnostisk framgång på nästan 5 %, vilket forskarna kallade en "total game changer" med tanke på att dessa genom redan hade analyserats uttömmande av mänskliga experter
.
Separat har Boston Childrens bredare AI-integration i organisationen hjälpt till att diagnostisera mer än 40 sällsynta tillstånd som tidigare varit olösta, sparat 60 000 arbetstimmar årligen (motsvarande 7 miljoner dollar i omfördelad arbetskraft) och minskat driftskostnaderna samtidigt som vårdtillgången ökat .
OpenAI lanserade tre distinkta hälsoverktyg under 2026:
ChatGPT Health (7 januari 2026) – En konsumentfunktion som låter användare ställa frågor om hälsa, ladda upp medicinska dokument och säkert koppla samman friskvårdsappar som Apple Health och MyFitnessPal. OpenAI betonar att det inte är avsett för diagnos eller behandling .
OpenAI for Healthcare (8 januari 2026) – En HIPAA-kompatibel företagsprodukt som erbjuder GPT-5-drivna verktyg för vårdorganisationer. Den lanserades med stora kunder som AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health och UCSF .
ChatGPT for Clinicians (22 april 2026) – En gratis, specialiserad version för verifierade amerikanska läkare, sjuksköterskor, läkarassistenter och farmaceuter. Den hjälper till med att sammanfatta medicinsk evidens, utkast till klinisk dokumentation, generera patientutbildningsmaterial och integrera kliniska riktlinjer och forskning . På HealthBench Professional överträffade detta verktyg signifikant mänsklig läkarpotential
.
En fjärde modelluppdatering, GPT-Rosalind (juni 2026), kombinerade GPT-5.5:s agentiska kodning med förbättrad vetenskaplig intelligens för biomedicinska forskningsflöden .
OpenAIs hälsosatsning 2026 är substantiell och backas upp av verkliga resultat – från en 52,5-procentig minskning av medicinska hallucinationer till 18 nyligen lösta fall av sällsynta sjukdomar. Företaget har byggt en tydlig trestegsstrategi: konsumentutbildning, kostnadsfria verktyg för kliniker och företagsdistribution. Även om försiktighet är på sin plats – OpenAIs riktmärken är interna, och Nature-metaanalysen bekräftar att AI fortfarande ligger efter expertläkare – tyder bevisen på att GPT-5.5 Instant för rutinfrågor och kliniska stöduppgifter nu är ett genuint användbart verktyg, inte bara en leksak.
Comments
0 comments