OpenAI сообщает, что GPT-5.5 Instant теперь работает на уровне своих флагманских «думающих» моделей в медицинских запросах и набирает больше баллов, чем GPT-5.3 Instant, на тестах HealthBench и HealthBench Professional . Независимые академические исследования подтверждают четкое поколенческое улучшение: точность диагностики на клинических сценариях выросла с 74,4% (58/78) для GPT-3.5 Turbo до 93,6% (73/78) для GPT-o3 и 91,0% (71/78) для GPT-5
.
На самом строгом тесте, HealthBench Professional, специализированная система GPT-5.4 в ChatGPT for Clinicians набрала 59,0 баллов, значительно превзойдя базовый уровень врачей — 43,7 балла (p = 3,7 × 10⁻¹⁰) . Особенно впечатляющий разрыв — почти в 2 раза выше врачей — показан в задачах по написанию и оформлению документации (64,1 против 32,1)
.
Более широкий метаанализ, опубликованный в журнале Nature (2025), не выявил статистически значимой разницы между генеративными ИИ-моделями в целом и врачами в диагностических задачах — врачи были точнее на 9,9%, но разница не была значимой (p = 0,10) . Однако ИИ-модели значительно уступали экспертам-врачам (разница в точности: 15,8%, p = 0,007)
. Вывод: передовой ИИ примерно сопоставим с обычным врачом по диагностике, но все еще отстает от узких специалистов.
В рецензируемом исследовании, опубликованном в NEJM AI, исследователи из Центра Мэнтона по изучению орфанных болезней Бостонской детской больницы, Гарвардского университета и OpenAI использовали модель рассуждений o3 Deep Research для повторного анализа 376 ранее нерешенных случаев редких педиатрических заболеваний . Система связывала клинические признаки, паттерны наследования и научную литературу для генерации диагностических гипотез. В итоге удалось поставить диагноз 18 детям по четырем категориям заболеваний: 10 случаев нарушений нейроразвития, 4 нервно-мышечных расстройства, 2 случая внезапной смерти и 2 случая раннего детского психоза
. Это дало диагностическую эффективность почти 5%, что исследователи назвали «полной сменой правил игры», учитывая, что эти геномы уже были тщательно проанализированы экспертами
.
Отдельно стоит отметить, что более широкая интеграция ИИ в Бостонской детской больнице помогла диагностировать свыше 40 редких заболеваний, которые ранее оставались невыявленными, сэкономила 60 000 человеко-часов в год (эквивалент 7 миллионам долларов перераспределенного труда) и сократила операционные расходы, одновременно расширяя доступ к медицинской помощи .
OpenAI запустила три отдельных медицинских продукта в 2026 году:
ChatGPT Health (7 января 2026) — Потребительская функция, позволяющая задавать вопросы о здоровье, загружать медицинские документы и безопасно подключать приложения вроде Apple Health и MyFitnessPal. OpenAI прямо заявляет, что этот инструмент не предназначен для диагностики или лечения .
OpenAI for Healthcare (8 января 2026) — Корпоративный продукт, соответствующий стандарту HIPAA, с инструментами на базе GPT-5 для медицинских организаций. Запущен с такими крупными клиентами, как AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health и UCSF .
ChatGPT for Clinicians (22 апреля 2026) — Бесплатная специализированная версия для верифицированных врачей, фельдшеров, ассистентов врачей и фармацевтов в США. Помогает обобщать медицинские данные, составлять клиническую документацию, готовить материалы для пациентов и интегрировать клинические рекомендации и исследования . На тесте HealthBench Professional этот инструмент значительно превзошел человеческих врачей
.
Четвертое обновление модели, GPT-Rosalind (июнь 2026), объединило агентные возможности кодирования GPT-5.5 с улучшенным научным интеллектом для биомедицинских исследований .
Медицинский прорыв OpenAI в 2026 году — это не просто громкие заявления, а реальные результаты: от снижения числа медицинских «галлюцинаций» на 52,5% до 18 новых диагнозов редких заболеваний. Компания выстроила четкую трехуровневую стратегию: просвещение потребителей, бесплатные инструменты для врачей и корпоративные решения. Хотя стоит сохранять осторожность — бенчмарки OpenAI являются внутренними, а метаанализ Nature подтверждает, что ИИ все еще уступает экспертам-врачам, — доказательства говорят о том, что для рутинных медицинских вопросов и задач клинической поддержки GPT-5.5 Instant теперь является genuinely полезным инструментом, а не просто игрушкой.
Comments
0 comments