OpenAI מדווחת כי GPT-5.5 Instant מתפקד כעת ברמה דומה למודלי ה- Thinking המתקדמים שלה בשאלות בריאות, ומשיג ציונים גבוהים יותר מ-GPT-5.3 Instant במבחני HealthBench ו-HealthBench Professional . מחקר אקדמי עצמאי מאשר שיפור דורי ברור: דיוק אבחוני בתרחישים קליניים עלה מ-74.4% (58/78) עבור GPT-3.5 Turbo ל-93.6% (73/78) עבור GPT-o3 ול-91.0% (71/78) עבור GPT-5
.
במבחן המחמיר ביותר, HealthBench Professional, מערכת GPT-5.4 המיוחדת ב- ChatGPT for Clinicians השיגה ציון 59.0, גבוה משמעותית מקו הבסיס של רופאים אנושיים שעמד על 43.7 (p = 3.7 × 10⁻¹⁰) . היא ביצעה כמעט פי 2 מקו הבסיס של הרופאים במשימות כתיבה ותיעוד (64.1 לעומת 32.1)
.
מטא-אנליזה רחבה יותר שפורסמה בכתב העת Nature (2025) לא מצאה הבדל מובהק סטטיסטית בין מודלי AI גנרטיביים בכלל לבין רופאים במשימות אבחון - רופאים היו מדויקים ב-9.9% יותר, אך ההבדל לא היה מובהק (p = 0.10) . עם זאת, מודלי ה-AI היו נחותים משמעותית לעומת רופאים מומחים (הבדל בדיוק: 15.8%, p = 0.007)
. המסקנה: ה-AI המוביל הוא בערך ברמה של רופא כללי באבחונים, אך עדיין מפגר אחרי מומחים.
במחקר שנבדק על ידי עמיתים ופורסם ב-NEJM AI, חוקרים ממרכז מנטון של בית החולים בוסטון צ'ילדרן, אוניברסיטת הרווארד ו-OpenAI השתמשו במודל ההסקה o3 Deep Research כדי לנתח מחדש 376 מקרים של מחלות נדירות בילדים שלא פוענחו בעבר . המערכת חיברה בין מאפיינים קליניים, דפוסי תורשה וספרות מדעית כדי לייצר השערות אבחוניות. היא זיהתה בהצלחה אבחנות עבור 18 ילדים בארבעה תחומי מחלה - 10 הפרעות נוירו-התפתחותיות, 4 הפרעות עצב-שריר, 2 מקרי מוות פתאומי ו-2 מקרים של פסיכוזה בגיל רך
. תשואה אבחנתית זו, של כמעט 5%, כונתה על ידי החוקרים "משנה משחק מוחלטת", בהתחשב בכך שהגנומים הללו כבר נותחו ביסודיות על ידי מומחים אנושיים
.
בנפרד, השילוב הרחב יותר של AI בבוסטון צ'ילדרן ברחבי הארגון סייע באבחון של יותר מ-40 מצבים נדירים שלא אובחנו בעבר, חסך 60,000 שעות עבודה בשנה (שווה ערך ל-7 מיליון דולר בעבודה שהוקצתה מחדש), והפחית עלויות תפעול תוך הרחבת הגישה לטיפול .
OpenAI השיקה שלושה מוצרי בריאות מובחנים בשנת 2026:
ChatGPT Health (7 בינואר 2026) - תכונה צרכנית המאפשרת למשתמשים לשאול על נושאי בריאות, להעלות מסמכים רפואיים ולחבר באופן מאובטח אפליקציות בריאות כמו Apple Health ו-MyFitnessPal. OpenAI מצהירה במפורש כי אינה מיועדת לאבחון או טיפול .
OpenAI for Healthcare (8 בינואר 2026) - מוצר ארגוני, תואם HIPAA, המציע כלים המופעלים על ידי GPT-5 לארגוני בריאות. הושק עם לקוחות גדולים כולל AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health ו-UCSF .
ChatGPT for Clinicians (22 באפריל 2026) - גרסה מיוחדת, חינמית, עבור רופאים, אחיות מוסמכות, עוזרי רופאים ורוקחים אמריקאים מאומתים. היא מסייעת בסיכום ראיות רפואיות, ניסוח תיעוד קליני, יצירת חומרי הדרכה לחולים, ושילוב הנחיות קליניות ומחקר . במבחן HealthBench Professional, כלי זה עלה באופן משמעותי על ביצועי רופאים אנושיים
.
עדכון מודל רביעי, GPT-Rosalind (יוני 2026), שילב את יכולות התכנות הסוכן של GPT-5.5 עם מודיעין מדעי משופר עבור זרימות עבודה במחקר ביו-רפואי .
המהלך הרפואי של OpenAI בשנת 2026 הוא מהותי ומגובה בתוצאות אמיתיות - מירידה של 52.5% בהזיות רפואיות ועד ל-18 מקרים חדשים של מחלות נדירות שפוענחו. החברה בנתה אסטרטגיה ברורה בת שלוש שכבות: חינוך צרכני, כלים חינמיים לרופאים ופריסה ארגונית. בעוד שנדרשת זהירות - אמות המידה של OpenAI הן פנימיות, ומטא-אנליזת Nature מאשרת ש-AI עדיין מפגר אחרי רופאים מומחים - העדויות מצביעות על כך שלשאלות בריאות שגרתיות ולמשימות תמיכה קליניות, GPT-5.5 Instant הוא כעת כלי שימושי באמת, לא רק צעצוע.
Comments
0 comments