OpenAI podaje, że GPT-5.5 Instant osiąga obecnie wyniki porównywalne z jego zaawansowanymi modelami myślącymi w kwestiach zdrowotnych i uzyskuje wyższe wyniki niż GPT-5.3 Instant w testach HealthBench i HealthBench Professional . Niezależne badania akademickie potwierdzają wyraźną poprawę międzypokoleniową: dokładność diagnostyczna w przypadku winiet klinicznych wzrosła z 74,4% (58/78) dla GPT-3.5 Turbo do 93,6% (73/78) dla GPT-o3 i 91,0% (71/78) dla GPT-5
.
W najbardziej rygorystycznym teście, HealthBench Professional, wyspecjalizowany system GPT-5.4 w ChatGPT dla Klinicystów uzyskał wynik 59,0, znacząco przewyższając wynik lekarzy (43,7; p = 3,7 × 10⁻¹⁰) . W zadaniach związanych z pisaniem i dokumentacją osiągnął prawie 2-krotnie wyższy wynik niż lekarze (64,1 vs. 32,1)
.
Szersza metaanaliza opublikowana w Nature (2025) nie wykazała statystycznie istotnej różnicy między modelami sztucznej inteligencji a lekarzami w zadaniach diagnostycznych — lekarze byli o 9,9% dokładniejsi, ale różnica nie była istotna (p = 0,10) . Jednak modele AI były znacząco gorsze od lekarzy ekspertów (różnica w dokładności: 15,8%, p = 0,007)
. Wniosek: zaawansowana sztuczna inteligencja jest mniej więcej porównywalna z lekarzem ogólnym w diagnostyce, ale wciąż ustępuje specjalistom.
W recenzowanym badaniu opublikowanym w NEJM AI naukowcy z Manton Center w Boston Children's Hospital, Harvard University i OpenAI użyli modelu rozumowania o3 Deep Research do ponownej analizy 376 nierozwiązanych wcześniej przypadków rzadkich chorób u dzieci . System połączył cechy kliniczne, wzorce dziedziczenia i literaturę naukową, aby generować hipotezy diagnostyczne. Skutecznie zidentyfikował diagnozy dla 18 dzieci w czterech obszarach chorobowych — 10 zaburzeń neurorozwojowych, 4 zaburzeń nerwowo-mięśniowych, 2 przypadków nagłej śmierci i 2 przypadków psychozy wczesnodziecięcej
. Dało to skuteczność diagnostyczną na poziomie prawie 5%, co naukowcy nazwali „całkowitą zmianą reguł gry”, biorąc pod uwagę, że genomy te zostały już wyczerpująco przeanalizowane przez ludzkich ekspertów
.
Osobno, szersza integracja AI w Boston Children's Hospital pomogła zdiagnozować ponad 40 rzadkich schorzeń, które wcześniej pozostały nierozpoznane, zaoszczędziła 60 000 godzin pracy rocznie (co odpowiada 7 milionom dolarów przepracowanej siły roboczej) i obniżyła koszty operacyjne, jednocześnie zwiększając dostęp do opieki .
OpenAI uruchomiło w 2026 roku trzy odrębne produkty zdrowotne:
ChatGPT Health (7 stycznia 2026) – Funkcja konsumencka umożliwiająca użytkownikom zadawanie pytań na tematy zdrowotne, przesyłanie dokumentów medycznych i bezpieczne łączenie aplikacji wellness, takich jak Apple Health i MyFitnessPal. OpenAI wyraźnie stwierdza, że nie jest przeznaczony do diagnozowania lub leczenia .
OpenAI for Healthcare (8 stycznia 2026) – Korporacyjny produkt zgodny z HIPAA, oferujący narzędzia oparte na GPT-5 dla organizacji opieki zdrowotnej. Wystartował z dużymi klientami, takimi jak AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health i UCSF .
ChatGPT for Clinicians (22 kwietnia 2026) – Bezpłatna, wyspecjalizowana wersja dla zweryfikowanych amerykańskich lekarzy, pielęgniarek, asystentów lekarzy i farmaceutów. Pomaga w podsumowywaniu dowodów medycznych, sporządzaniu dokumentacji klinicznej, generowaniu materiałów edukacyjnych dla pacjentów i integrowaniu wytycznych klinicznych oraz badań . W teście HealthBench Professional narzędzie to znacząco przewyższyło wyniki lekarzy
.
Czwarta aktualizacja modelu, GPT-Rosalind (czerwiec 2026), połączyła agentyczne kodowanie GPT-5.5 z ulepszoną inteligencją naukową na potrzeby przepływów pracy w badaniach biomedycznych .
Wkroczenie OpenAI w ochronę zdrowia w 2026 roku jest znaczące i poparte rzeczywistymi rezultatami — od 52,5% spadku halucynacji medycznych po 18 nowo rozwiązanych przypadków rzadkich chorób. Firma zbudowała jasną, trójstopniową strategię: edukacja konsumencka, bezpłatne narzędzia dla klinicystów i wdrożenia korporacyjne. Chociaż należy zachować ostrożność — testy OpenAI są wewnętrzne, a metaanaliza z Nature potwierdza, że AI wciąż ustępuje lekarzom ekspertom — dowody sugerują, że w przypadku rutynowych pytań zdrowotnych i zadań pomocniczych w pracy klinicznej, GPT-5.5 Instant jest teraz naprawdę użytecznym narzędziem, a nie tylko zabawką.
Comments
0 comments