OpenAI gibt an, dass GPT-5.5 Instant bei Gesundheitsfragen nun mit den leistungsstärksten Thinking-Modellen mithalten kann und in den Benchmarks HealthBench und HealthBench Professional besser abschneidet als GPT-5.3 Instant . Unabhängige akademische Forschung bestätigt einen klaren Generationssprung: Die diagnostische Genauigkeit bei klinischen Fallbeispielen stieg von 74,4 % (58/78) für GPT-3.5 Turbo auf 93,6 % (73/78) für GPT-o3 und 91,0 % (71/78) für GPT-5
.
Im strengsten Benchmark, HealthBench Professional, erreichte das auf GPT-5.4 basierende System in ChatGPT for Clinicians einen Wert von 59,0 und übertraf damit die menschliche Arzt-Baseline von 43,7 deutlich (p = 3,7 × 10⁻¹⁰) . Besonders bei Schreib- und Dokumentationsaufgaben war die KI mit 64,1 fast doppelt so gut wie die Ärzte (32,1)
.
Eine umfassende Meta-Analyse, veröffentlicht in Nature (2025), ergab jedoch, dass es insgesamt keinen statistisch signifikanten Unterschied zwischen generativen KI-Modellen und Ärzten bei Diagnoseaufgaben gab – Ärzte waren 9,9 % genauer, aber der Unterschied war nicht signifikant (p = 0,10) . Allerdings waren die KI-Modelle Fachexperten deutlich unterlegen (Genauigkeitsunterschied: 15,8 %, p = 0,007)
. Fazit: Die neueste KI ist in der Diagnostik in etwa mit einem Allgemeinmediziner vergleichbar, bleibt aber hinter Spezialisten zurück.
In einer von Experten begutachteten Studie, veröffentlicht in NEJM AI, nutzten Forscher des Manton Center des Boston Children's Hospital, der Harvard University und von OpenAI das o3 Deep Research-Modell, um 376 zuvor ungelöste pädiatrische Fälle seltener Krankheiten erneut zu analysieren . Das System verknüpfte klinische Merkmale, Vererbungsmuster und wissenschaftliche Literatur, um Diagnose-Hypothesen zu generieren. Es konnte erfolgreich Diagnosen für 18 Kinder in vier Krankheitsbereichen finden – darunter 10 neurologische Entwicklungsstörungen, 4 neuromuskuläre Erkrankungen, 2 plötzliche Todesfälle und 2 Fälle von frühkindlicher Psychose
. Die Diagnoserate von fast 5 % bezeichnen die Forscher als "total game changer" (eine echte Revolution), da diese Genome zuvor bereits von menschlichen Experten erschöpfend analysiert worden waren
.
Darüber hinaus hat die umfassende KI-Integration am Boston Children's Hospital dazu beigetragen, mehr als 40 seltene Krankheiten zu diagnostizieren, die zuvor ungelöst geblieben waren. Zudem wurden jährlich 60.000 Arbeitsstunden eingespart (umgerechnet 7 Millionen US-Dollar), während die Betriebskosten gesenkt und der Zugang zur Versorgung verbessert wurden .
OpenAI hat 2026 drei verschiedene Gesundheitsprodukte auf den Markt gebracht:
ChatGPT Health (7. Januar 2026) – Ein Verbraucher-Feature, das es Nutzern ermöglicht, sich zu Gesundheitsthemen zu informieren, medizinische Dokumente hochzuladen und Wellness-Apps wie Apple Health und MyFitnessPal sicher anzubinden. OpenAI stellt klar, dass es nicht für die Diagnose oder Behandlung entwickelt wurde .
OpenAI for Healthcare (8. Januar 2026) – Ein HIPAA-konformes Unternehmensprodukt, das GPT-5-gestützte Tools für Gesundheitsorganisationen bereitstellt. Es startete mit großen Kunden wie AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai, HCA Healthcare, Memorial Sloan Kettering und Stanford Medicine .
ChatGPT for Clinicians (22. April 2026) – Eine kostenlose, spezialisierte Version für verifizierte US-Ärzte, Pflegekräfte und Apotheker. Sie hilft bei der Zusammenfassung medizinischer Evidenz, der Erstellung klinischer Dokumentationen und Patientenaufklärungsmaterialien. Im HealthBench Professional-Benchmark übertraf dieses Tool die menschliche Ärzteleistung signifikant .
Ein viertes Modell-Update, GPT-Rosalind (Juni 2026), vereinte die agentischen Programmierfähigkeiten von GPT-5.5 mit verbesserter wissenschaftlicher Intelligenz für biomedizinische Forschungsabläufe .
OpenAIs Gesundheitsvorstoß im Jahr 2026 ist substanziell und wird durch echte Ergebnisse untermauert – von einem Rückgang medizinischer Halluzinationen um 52,5 % bis hin zu 18 neu diagnostizierten Fällen seltener Krankheiten. Das Unternehmen hat eine klare Drei-Säulen-Strategie aufgebaut: Verbraucherbildung, kostenlose Ärzte-Tools und Unternehmenseinsatz. Auch wenn Vorsicht geboten ist – die Benchmarks stammen von OpenAI selbst, und die Nature-Meta-Analyse bestätigt, dass KI noch hinter Fachexperten zurückbleibt –, deuten die Belege darauf hin, dass GPT-5.5 Instant für alltägliche Gesundheitsfragen und klinische Unterstützungsaufgaben inzwischen ein echtes Werkzeug und kein Spielzeug mehr ist.
Comments
0 comments