OpenAI indique que GPT-5.5 Instant atteint désormais des performances comparables à ses modèles frontières Thinking sur les questions de santé et obtient des scores supérieurs à GPT-5.3 Instant sur HealthBench et HealthBench Professional . Les recherches académiques indépendantes confirment une amélioration générationnelle claire : la précision diagnostique sur des vignettes cliniques est passée de 74,4 % (58/78) pour GPT-3.5 Turbo à 93,6 % (73/78) pour GPT-o3 et 91,0 % (71/78) pour GPT-5
.
Sur le benchmark le plus rigoureux, HealthBench Professional, le système spécialisé GPT-5.4 intégré à ChatGPT for Clinicians a obtenu un score de 59,0, dépassant significativement le score de référence des médecins humains (43,7 ; p = 3,7 × 10⁻¹⁰) . Sa performance en rédaction et tâches documentaires a été près de deux fois supérieure à celle des médecins (64,1 contre 32,1)
.
Une méta-analyse plus large publiée dans Nature (2025) n’a trouvé aucune différence statistiquement significative entre les modèles d’IA générative dans leur ensemble et les médecins pour les tâches diagnostiques : les médecins étaient 9,9 % plus précis, mais la différence n’était pas significative (p = 0,10) . En revanche, les modèles d’IA étaient significativement inférieurs aux médecins experts (écart de précision : 15,8 %, p = 0,007)
. En résumé : une IA de pointe est à peu près comparable à un médecin généraliste pour le diagnostic, mais reste en retrait face aux spécialistes.
Dans une étude évaluée par des pairs et publiée dans NEJM AI, des chercheurs du Manton Center du Boston Children's Hospital, de l’Université Harvard et d’OpenAI ont utilisé le modèle de raisonnement o3 Deep Research pour réanalyser 376 cas pédiatriques de maladies rares non résolus . Le système a relié les caractéristiques cliniques, les modes de transmission et la littérature scientifique pour générer des hypothèses diagnostiques. Il a permis d’identifier des diagnostics pour 18 enfants dans quatre domaines pathologiques : 10 troubles neurodéveloppementaux, 4 troubles neuromusculaires, 2 cas de mort subite et 2 cas de psychose précoce
. Soit un rendement diagnostique de près de 5 %, que les chercheurs ont qualifié de « véritable révolution » étant donné que ces génomes avaient déjà été analysés de manière exhaustive par des experts humains
.
Par ailleurs, l’intégration plus large de l’IA au Boston Children's Hospital a permis de diagnostiquer plus de 40 maladies rares qui n’avaient pas été résolues auparavant, d’économiser 60 000 heures de travail par an (l’équivalent de 7 millions de dollars en main-d’œuvre redéployée) et de réduire les coûts opérationnels tout en élargissant l’accès aux soins .
OpenAI a lancé trois produits santé distincts en 2026 :
ChatGPT Health (7 janvier 2026) — Une fonctionnalité grand public permettant aux utilisateurs de poser des questions sur la santé, de télécharger des documents médicaux et de connecter en toute sécurité des applications de bien-être comme Apple Health et MyFitnessPal. OpenAI précise explicitement qu’elle n’est pas conçue pour le diagnostic ou le traitement .
OpenAI for Healthcare (8 janvier 2026) — Un produit d’entreprise conforme à la loi HIPAA offrant des outils basés sur GPT-5 aux organismes de santé. Il a été lancé avec de grands clients, dont AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health et l’UCSF .
ChatGPT for Clinicians (22 avril 2026) — Une version spécialisée et gratuite destinée aux médecins, infirmières praticiennes, assistants médicaux et pharmaciens américains vérifiés. Elle aide à résumer les preuves médicales, rédiger des documents cliniques, générer des supports d’éducation patient et intégrer les directives cliniques et la recherche . Sur HealthBench Professional, cet outil a significativement dépassé les performances des médecins humains
.
Une quatrième mise à jour, GPT-Rosalind (juin 2026), a combiné le codage agentique de GPT-5.5 avec une intelligence scientifique renforcée pour les workflows de recherche biomédicale .
L’offensive santé d’OpenAI en 2026 est substantielle et étayée par des résultats concrets — qu’il s’agisse d’une baisse de 52,5 % des hallucinations médicales ou de 18 nouveaux cas de maladies rares résolus. L’entreprise a construit une stratégie claire en trois niveaux : éducation du consommateur, outils gratuits pour les cliniciens et déploiement en entreprise. La prudence reste de mise — les benchmarks d’OpenAI sont internes, et la méta-analyse de Nature confirme que l’IA est encore inférieure aux médecins experts — mais les preuves suggèrent que pour les questions de santé courantes et les tâches de soutien clinique, GPT-5.5 Instant est désormais un outil véritablement utile, et plus un simple gadget.
Comments
0 comments