أفادت OpenAI أن GPT-5.5 Instant يؤدي الآن بشكل مماثل لنماذجها الرائدة التفكيرية في الأسئلة الصحية، ويسجل درجات أعلى من GPT-5.3 Instant على HealthBench وHealthBench Professional . ويؤكد البحث الأكاديمي المستقل تحسنًا واضحًا بين الأجيال: ارتفعت دقة التشخيص على السيناريوهات السريرية من 74.4% (58/78) لنموذج GPT-3.5 Turbo إلى 93.6% (73/78) لنموذج GPT-o3 و91.0% (71/78) لنموذج GPT-5
.
في الاختبار الأكثر صرامة، HealthBench Professional، سجل نظام GPT-5.4 المخصص في ChatGPT for Clinicians 59.0، متجاوزًا بشكل كبير خط الأساس البشري للأطباء البالغ 43.7 (p = 3.7 × 10⁻¹⁰) . وقد حقق أداءً يقرب من ضعف خط الأساس للأطباء في مهام الكتابة والتوثيق (64.1 مقابل 32.1)
.
وجد تحليل تلوي أوسع نُشر في مجلة Nature (2025) أنه لا يوجد فرق ذو دلالة إحصائية بين نماذج الذكاء الاصطناعي التوليدية بشكل عام والأطباء في مهام التشخيص — كان الأطباء أفضل بنسبة 9.9%، لكن الفرق لم يكن ذا دلالة إحصائية (p = 0.10) . ومع ذلك، كانت نماذج الذكاء الاصطناعي أدنى بشكل ملحوظ من الأطباء الخبراء (فرق في الدقة: 15.8%، p = 0.007)
. الاستنتاج: الذكاء الاصطناعي المتقدم يقارب طبيب عام في التشخيص، لكنه لا يزال متخلفًا عن الأطباء المتخصصين.
في دراسة محكمة نُشرت في NEJM AI، استخدم باحثون من مركز مانتون لمستشفى بوسطن للأطفال وجامعة هارفارد وOpenAI نموذج التفكير o3 Deep Research لإعادة تحليل 376 حالة أمراض نادرة لدى الأطفال لم يتم حلها من قبل . قام النظام بربط السمات السريرية وأنماط الوراثة والأبحاث العلمية لتوليد فرضيات تشخيصية. نجح في تحديد التشخيص لـ 18 طفلاً عبر أربعة مجالات مرضية — 10 اضطرابات نمائية عصبية، و4 اضطرابات عصبية عضلية، ووفاتين مفاجئتين، وحالتي ذهان مبكر
. أدى هذا إلى تحقيق نسبة تشخيصية تقارب 5%، وصفها الباحثون بأنها "مغير كامل للعبة" بالنظر إلى أن هذه الجينومات كانت قد حللت بالفعل بشكل شامل من قبل خبراء بشريين
.
بشكل منفصل، ساعد دمج الذكاء الاصطناعي في مستشفى بوسطن للأطفال على مستوى المنظمة في تشخيص أكثر من 40 حالة نادرة لم يتم حلها سابقًا، وتوفير 60,000 ساعة عمل سنويًا (أي ما يعادل 7 ملايين دولار من العمالة المعاد توجيهها)، وتقليل التكاليف التشغيلية مع توسيع نطاق الوصول إلى الرعاية .
أطلقت OpenAI ثلاثة منتجات صحية متميزة في عام 2026:
ChatGPT Health (7 يناير 2026) — ميزة للمستهلكين تتيح لهم الاستفسار عن الموضوعات الصحية، وتحميل المستندات الطبية، وربط تطبيقات العافية مثل Apple Health وMyFitnessPal بشكل آمن. تنص OpenAI صراحةً على أنها ليست مصممة للتشخيص أو العلاج .
OpenAI for Healthcare (8 يناير 2026) — منتج مؤسسي متوافق مع قانون HIPAA (قانون قابلية التأمين الصحي والمساءلة في الولايات المتحدة) يقدم أدوات مدعومة بـ GPT-5 للمؤسسات الصحية. تم إطلاقه مع عملاء رئيسيين بما في ذلك AdventHealth وBaylor Scott & White Health وBoston Children's Hospital وCedars-Sinai Medical Center وHCA Healthcare وMemorial Sloan Kettering Cancer Center وStanford Medicine Children's Health وUCSF .
ChatGPT for Clinicians (22 أبريل 2026) — إصدار مجاني ومتخصص للأطباء والممرضين الممارسين ومساعدي الأطباء والصيادلة المعتمدين في الولايات المتحدة. يساعد في تلخيص الأدلة الطبية، وصياغة التوثيق السريري، وإنشاء مواد تثقيف المرضى، ودمج الإرشادات السريرية والأبحاث . في معيار HealthBench Professional، تجاوز هذا الأداة أداء الأطباء البشريين بشكل كبير
.
تحديث رابع للنموذج، GPT-Rosalind (يونيو 2026)، جمع بين البرمجة الوكيلية لـ GPT-5.5 والذكاء العلمي المحسّن لسير العمل في الأبحاث الطبية الحيوية .
توجه OpenAI الصحي في عام 2026 جوهري ومدعوم بنتائج حقيقية — من انخفاض بنسبة 52.5% في الهلاوس الطبية إلى 18 حالة مرضية نادرة تم تشخيصها حديثًا. بنت الشركة استراتيجية ثلاثية المستويات واضحة: التثقيف الاستهلاكي، وأدوات الأطباء المجانية، والنشر المؤسسي. بينما يجب توخي الحذر — معايير OpenAI داخلية، ويؤكد التحليل التلوي في Nature أن الذكاء الاصطناعي لا يزال متخلفًا عن الأطباء الخبراء — تشير الأدلة إلى أنه وبالنسبة للأسئلة الصحية الروتينية ومهام الدعم السريري، أصبح GPT-5.5 Instant الآن أداة مفيدة حقًا، وليس مجرد لعبة.
Comments
0 comments