OpenAI, GPT-5.5 Instant'ın sağlık sorularında artık öncül Thinking modelleriyle eşdeğer performans gösterdiğini ve HealthBench ile HealthBench Professional'da GPT-5.3 Instant'dan daha yüksek puan aldığını belirtiyor . Bağımsız akademik araştırmalar net bir nesil iyileştirmesi olduğunu doğruluyor: klinik senaryolardaki tanı doğruluğu GPT-3.5 Turbo için %74,4'ten (58/78) GPT-o3 için %93,6'ya (73/78) ve GPT-5 için %91,0'a (71/78) yükseldi
.
En zorlu kriter olan HealthBench Professional'da, Klinisyenler için ChatGPT'deki özel GPT-5.4 sistemi 59,0 puan alarak insan doktor taban çizgisi olan 43,7'yi önemli ölçüde geride bıraktı (p = 3,7 × 10⁻¹⁰) . Yazma ve belgeleme görevlerinde doktor taban çizgisinin neredeyse 2 katı performans gösterdi (64,1'e karşı 32,1)
.
Nature dergisinde yayınlanan daha kapsamlı bir meta-analiz (2025), genel olarak üretken yapay zeka modelleri ile doktorlar arasında tanısal görevlerde istatistiksel olarak anlamlı bir fark bulamadı — doktorlar %9,9 daha doğruydu, ancak fark anlamlı değildi (p = 0,10) . Bununla birlikte, yapay zeka modelleri uzman doktorlardan önemli ölçüde daha düşük performans gösterdi (doğruluk farkı: %15,8, p = 0,007)
. Çıkarım: Öncül yapay zeka, tanı koymada genel bir pratisyen doktorla kabaca eşdeğer, ancak uzmanların hâlâ gerisinde.
NEJM AI'da yayınlanan hakemli bir çalışmada, Boston Çocuk Hastanesi Manton Merkezi, Harvard Üniversitesi ve OpenAI'den araştırmacılar, o3 Deep Research akıl yürütme modelini kullanarak daha önce çözülememiş 376 pediatrik nadir hastalık vakasını yeniden analiz etti . Sistem, klinik özellikleri, kalıtım modellerini ve bilimsel literatürü birleştirerek tanısal hipotezler oluşturdu. Dört hastalık alanında — 10 nörogelişimsel bozukluk, 4 nöromüsküler bozukluk, 2 ani ölüm ve 2 erken çocukluk psikozu vakası — 18 çocuk için başarıyla tanı belirlendi
. Bu, araştırmacıların "tam bir oyun değiştirici" olarak nitelendirdiği yaklaşık %5'lik bir tanısal verim anlamına geliyor, çünkü bu genomlar daha önce insan uzmanlar tarafından defalarca analiz edilmişti
.
Ayrıca, Boston Çocuk Hastanesi'nin kurum genelindeki daha geniş yapay zeka entegrasyonu, daha önce çözülememiş 40'tan fazla nadir hastalığın teşhis edilmesine yardımcı oldu, yıllık 60.000 iş saati tasarrufu sağladı (7 milyon dolarlık yeniden tahsis edilmiş iş gücüne eşdeğer) ve operasyonel maliyetleri düşürürken bakıma erişimi genişletti .
OpenAI, 2026'da üç ayrı sağlık ürünü başlattı:
ChatGPT Health (7 Ocak 2026) — Kullanıcıların sağlık konularını sorgulamasına, tıbbi belgeler yüklemesine ve Apple Health ile MyFitnessPal gibi wellness uygulamalarını güvenle bağlamasına olanak tanıyan bir tüketici özelliği. OpenAI, bunun teşhis veya tedavi için tasarlanmadığını açıkça belirtiyor .
OpenAI for Healthcare (8 Ocak 2026) — Sağlık kuruluşları için HIPAA uyumlu, GPT-5 destekli araçlar sunan bir kurumsal ürün. AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health ve UCSF gibi büyük müşterilerle piyasaya sürüldü .
ChatGPT for Clinicians (22 Nisan 2026) — ABD'deki doğrulanmış doktorlar, hemşire pratisyenleri, doktor asistanları ve eczacılar için ücretsiz, özel bir sürüm. Tıbbi kanıtları özetleme, klinik belgeleri hazırlama, hasta eğitim materyalleri oluşturma ve klinik kılavuzlar ile araştırmaları entegre etme konularında yardımcı olur . HealthBench Professional'da bu araç, insan doktor performansını önemli ölçüde aştı
.
Dördüncü bir model güncellemesi olan GPT-Rosalind (Haziran 2026), GPT-5.5'in aracılı kodlama yeteneklerini biyomedikal araştırma iş akışları için gelişmiş bilimsel zeka ile birleştirdi .
OpenAI'in 2026'daki sağlık hamlesi, tıbbi halüsinasyonlarda %52,5'lik bir düşüşten 18 yeni çözülmüş nadir hastalık vakasına kadar somut sonuçlarla desteklenen önemli bir adımdır. Şirket, net bir üç kademeli strateji oluşturdu: tüketici eğitimi, ücretsiz klinisyen araçları ve kurumsal dağıtım. Dikkatli olunması gerekse de — OpenAI'in kriterleri kendi iç değerlendirmeleridir ve Nature meta-analizi yapay zekanın hâlâ uzman doktorların gerisinde kaldığını doğrulamaktadır — kanıtlar, rutin sağlık soruları ve klinik destek görevleri için GPT-5.5 Instant'ın artık gerçekten kullanışlı bir araç olduğunu, sadece bir oyuncak olmadığını gösteriyor.
Comments
0 comments