OpenAI стверджує, що GPT-5.5 Instant тепер працює на рівні її флагманських Thinking-моделей у медичних питаннях і показує вищі результати, ніж GPT-5.3 Instant, на тестах HealthBench та HealthBench Professional . Незалежні академічні дослідження підтверджують чітке поколінне покращення: точність діагностики на клінічних сценаріях зросла з 74,4% (58/78) для GPT-3.5 Turbo до 93,6% (73/78) для GPT-o3 та 91,0% (71/78) для GPT-5
.
На найскладнішому тесті HealthBench Professional спеціалізована система GPT-5.4 у ChatGPT for Clinicians набрала 59,0 балів, значно випередивши базовий показник лікарів-людей у 43,7 бала (p = 3,7 × 10⁻¹⁰) . Вона показала майже 2-кратну перевагу над лікарями у завданнях з написання та оформлення документації (64,1 проти 32,1)
.
Більш широкий мета-аналіз, опублікований у Nature (2025), не виявив статистично значущої різниці між генеративними ШІ-моделями загалом і лікарями в діагностичних завданнях — лікарі були точнішими на 9,9%, але ця різниця не була значущою (p = 0,10) . Однак ШІ-моделі були значно гіршими за лікарів-експертів (різниця в точності: 15,8%, p = 0,007)
. Висновок: флагманський ШІ приблизно на рівні лікаря загальної практики, але все ще поступається вузьким спеціалістам.
У рецензованому дослідженні, опублікованому в NEJM AI, дослідники з Manton Center Бостонської дитячої лікарні, Гарвардського університету та OpenAI використали модель міркування o3 Deep Research для повторного аналізу 376 раніше нерозгаданих випадків рідкісних дитячих хвороб . Система пов'язувала клінічні ознаки, спадкові патерни та наукову літературу для генерації діагностичних гіпотез. Вона успішно визначила діагнози для 18 дітей у чотирьох групах захворювань — 10 нейророзвиткових розладів, 4 нервово-м'язові захворювання, 2 випадки раптової смерті та 2 випадки психозу в ранньому дитинстві
. Діагностична ефективність склала майже 5%, що дослідники назвали "повною зміною правил гри", враховуючи, що ці геноми вже були ретельно проаналізовані людськими експертами
.
Окремо, ширша інтеграція ШІ в Бостонській дитячій лікарні допомогла діагностувати понад 40 рідкісних захворювань, які раніше залишалися нерозгаданими, заощадила 60 000 робочих годин щорічно (еквівалент $7 млн перерозподіленої праці) та знизила операційні витрати, розширивши доступ до лікування .
OpenAI запустила три різні продукти для сфери здоров'я у 2026 році:
ChatGPT Health (7 січня 2026 року) — споживча функція, яка дозволяє користувачам ставити запитання про здоров'я, завантажувати медичні документи та безпечно підключати додатки для здоров'я, як-от Apple Health і MyFitnessPal. OpenAI прямо заявляє, що вона не призначена для діагностики чи лікування .
OpenAI for Healthcare (8 січня 2026 року) — корпоративний продукт, що відповідає стандартам HIPAA, пропонуючи інструменти на основі GPT-5 для медичних організацій. Запущений із великими клієнтами, зокрема AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health та UCSF .
ChatGPT for Clinicians (22 квітня 2026 року) — безкоштовна спеціалізована версія для верифікованих лікарів, медсестер, фельдшерів та фармацевтів США. Вона допомагає узагальнювати медичні докази, складати клінічну документацію, створювати матеріали для пацієнтів та інтегрувати клінічні рекомендації та дослідження . На тесті HealthBench Professional цей інструмент значно перевершив продуктивність лікарів-людей
.
Четверте оновлення моделі, GPT-Rosalind (червень 2026 року), поєднало агентське кодування GPT-5.5 з розширеним науковим інтелектом для біомедичних дослідницьких завдань .
Медичний наступ OpenAI у 2026 році є вагомим і підкріпленим реальними результатами — від зниження медичних галюцинацій на 52,5% до 18 нових діагнозів рідкісних хвороб. Компанія побудувала чітку трирівневу стратегію: освіта споживачів, безкоштовні інструменти для лікарів та корпоративне впровадження. Хоча варто зберігати обережність — тести OpenAI є внутрішніми, а мета-аналіз Nature підтверджує, що ШІ все ще відстає від лікарів-експертів — докази свідчать, що для повсякденних медичних питань та завдань клінічної підтримки GPT-5.5 Instant тепер є справді корисним інструментом, а не просто іграшкою.
Comments
0 comments