OpenAI melaporkan bahawa GPT-5.5 Instant kini berprestasi setanding dengan model Thinking peringkat atasan mereka pada soalan kesihatan dan mendapat skor lebih tinggi daripada GPT-5.3 Instant pada HealthBench dan HealthBench Professional . Penyelidikan akademik bebas mengesahkan peningkatan generasi yang jelas: ketepatan diagnostik pada vignet klinikal meningkat daripada 74.4% (58/78) untuk GPT-3.5 Turbo kepada 93.6% (73/78) untuk GPT-o3 dan 91.0% (71/78) untuk GPT-5
.
Pada penanda aras yang paling ketat, HealthBench Professional, sistem khusus GPT-5.4 dalam ChatGPT for Clinicians mendapat skor 59.0, mengatasi prestasi garis dasar doktor manusia iaitu 43.7 dengan ketara (p = 3.7 × 10⁻¹⁰) . Ia berprestasi hampir 2× garis dasar doktor pada tugasan penulisan dan dokumentasi (64.1 berbanding 32.1)
.
Satu meta-analisis yang lebih luas yang diterbitkan dalam Nature (2025) mendapati tiada perbezaan signifikan secara statistik antara model AI generatif secara keseluruhan dan doktor dalam tugasan diagnostik — doktor adalah 9.9% lebih tepat, tetapi perbezaan itu tidak signifikan (p = 0.10) . Walau bagaimanapun, model AI adalah jauh lebih rendah berbanding doktor pakar (perbezaan ketepatan: 15.8%, p = 0.007)
. Kesimpulannya: AI peringkat atasan secara kasarnya setanding dengan doktor am dalam diagnostik, tetapi masih ketinggalan di belakang pakar.
Dalam kajian yang disemak rakan sebaya yang diterbitkan dalam NEJM AI, penyelidik dari Manton Center Boston Children's Hospital, Universiti Harvard, dan OpenAI menggunakan model pemikiran o3 Deep Research untuk menganalisis semula 376 kes penyakit jarang jumpa pediatrik yang sebelum ini tidak dapat diselesaikan . Sistem ini menghubungkan ciri klinikal, corak pewarisan, dan literatur saintifik untuk menjana hipotesis diagnostik. Ia berjaya mengenal pasti diagnosis untuk 18 kanak-kanak merentasi empat kawasan penyakit — 10 gangguan perkembangan saraf, 4 gangguan neuromuskular, 2 kematian mengejut, dan 2 kes psikosis awal kanak-kanak
. Ini menghasilkan kadar diagnostik hampir 5%, yang dipanggil oleh penyelidik sebagai "pengubah permainan sepenuhnya" memandangkan genom ini telah dianalisis secara menyeluruh oleh pakar manusia
.
Secara berasingan, integrasi AI yang lebih luas di Boston Children's merentas organisasi telah membantu mendiagnosis lebih daripada 40 keadaan jarang jumpa yang sebelum ini tidak dapat diselesaikan, menjimatkan 60,000 jam kerja setiap tahun (bersamaan dengan $7 juta dalam buruh yang digunakan semula), dan mengurangkan kos operasi sambil meluaskan akses penjagaan .
OpenAI melancarkan tiga produk kesihatan berbeza pada 2026:
ChatGPT Health (7 Januari 2026) — Ciri pengguna yang membenarkan pengguna bertanya tentang topik kesihatan, memuat naik dokumen perubatan, dan menghubungkan aplikasi kesejahteraan seperti Apple Health dan MyFitnessPal secara selamat. OpenAI secara jelas menyatakan ia tidak direka untuk diagnosis atau rawatan .
OpenAI for Healthcare (8 Januari 2026) — Produk perusahaan, patuh HIPAA yang menawarkan alat berkuasa GPT-5 untuk organisasi penjagaan kesihatan. Ia dilancarkan dengan pelanggan utama termasuk AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health, dan UCSF .
ChatGPT for Clinicians (22 April 2026) — Versi khusus percuma untuk doktor, pengamal jururawat, pembantu doktor, dan ahli farmasi yang disahkan di AS. Ia membantu meringkaskan bukti perubatan, menyediakan draf dokumentasi klinikal, menjana bahan pendidikan pesakit, dan menyepadukan garis panduan klinikal dan penyelidikan . Pada HealthBench Professional, alat ini dengan ketara melebihi prestasi doktor manusia
.
Satu lagi kemas kini model, GPT-Rosalind (Jun 2026), menggabungkan pengekodan ejen GPT-5.5 dengan kecerdasan saintifik yang dipertingkatkan untuk aliran kerja penyelidikan bioperubatan .
Dorongan kesihatan OpenAI pada 2026 adalah substantif dan disokong oleh hasil sebenar — daripada penurunan 52.5% dalam halusinasi perubatan kepada 18 kes penyakit jarang jumpa yang baru didiagnosis. Syarikat itu telah membina strategi tiga peringkat yang jelas: pendidikan pengguna, alat klinikal percuma, dan penggunaan perusahaan. Walaupun berhati-hati adalah wajar — penanda aras OpenAI adalah dalaman, dan meta-analisis Nature mengesahkan AI masih ketinggalan di belakang doktor pakar — bukti menunjukkan bahawa untuk soalan kesihatan rutin dan tugasan sokongan klinikal, GPT-5.5 Instant kini merupakan alat yang benar-benar berguna, bukan sekadar mainan.
Comments
0 comments