OpenAI รายงานว่า GPT-5.5 Instant มีประสิทธิภาพเทียบเท่าโมเดล Thinking ระดับสูงในคำถามด้านสุขภาพ และทำคะแนนสูงกว่า GPT-5.3 Instant ในการทดสอบ HealthBench และ HealthBench Professional งานวิจัยอิสระจากสถาบันการศึกษายืนยันถึงการปรับปรุงที่ดีขึ้นอย่างชัดเจน: ความแม่นยำในการวินิจฉัยโรค (จาก Clinical Vignettes) เพิ่มขึ้นจาก 74.4% (58/78) สำหรับ GPT-3.5 Turbo เป็น 93.6% (73/78) สำหรับ GPT-o3 และ 91.0% (71/78) สำหรับ GPT-5
ในการทดสอบที่เข้มงวดที่สุดคือ HealthBench Professional ระบบ GPT-5.4 ใน ChatGPT for Clinicians ทำคะแนนได้ 59.0 คะแนน สูงกว่าค่าเฉลี่ยของแพทย์มนุษย์ที่ 43.7 คะแนนอย่างมีนัยสำคัญ (p = 3.7 × 10⁻¹⁰) นอกจากนี้ยังทำคะแนนได้ดีเป็นเกือบสองเท่าของค่าเฉลี่ยแพทย์มนุษย์ในงานเขียนและเอกสาร (64.1 เทียบกับ 32.1)
การวิเคราะห์อภิมาน (Meta-analysis) ที่ตีพิมพ์ในวารสาร Nature (2025) พบว่าไม่มีความแตกต่างอย่างมีนัยสำคัญทางสถิติระหว่างโมเดล AI เจนเนอเรทีฟโดยรวมกับแพทย์ในงานวินิจฉัยโรค โดยแพทย์มีความแม่นยำมากกว่า 9.9% แต่ความแตกต่างนี้ไม่มีนัยสำคัญ (p = 0.10) อย่างไรก็ตาม โมเดล AI ด้อยกว่าแพทย์ผู้เชี่ยวชาญอย่างมีนัยสำคัญ (ความแม่นยำต่างกัน 15.8%, p = 0.007)
สรุปสั้น ๆ ก็คือ AI ระดับแนวหน้ามีประสิทธิภาพเทียบเท่าแพทย์ทั่วไปในการวินิจฉัยโรค แต่ยังตามหลังแพทย์ผู้เชี่ยวชาญเฉพาะทาง
ในการศึกษาที่ผ่านการตรวจสอบโดยผู้เชี่ยวชาญ (Peer-Reviewed) และตีพิมพ์ในวารสาร NEJM AI นักวิจัยจาก Manton Center ของ Boston Children's Hospital, มหาวิทยาลัยฮาร์วาร์ด และ OpenAI ใช้โมเดลการให้เหตุผล o3 Deep Research เพื่อวิเคราะห์เคสโรคหายากในเด็กที่ยังไม่ทราบสาเหตุถึง 376 เคส อีกครั้ง ระบบนี้เชื่อมโยงลักษณะทางคลินิก รูปแบบการถ่ายทอดทางพันธุกรรม และวรรณกรรมทางวิทยาศาสตร์เพื่อสร้างสมมติฐานในการวินิจฉัย ประสบความสำเร็จในการชี้ชัดโรคให้กับเด็ก 18 คน ใน 4 กลุ่มโรค ได้แก่ ความผิดปกติทางระบบประสาทและพัฒนาการ 10 ราย, ความผิดปกติของระบบประสาทและกล้ามเนื้อ 4 ราย, การเสียชีวิตอย่างกะทันหัน 2 ราย และโรคจิตเภทในเด็กปฐมวัย 2 ราย
ซึ่งถือเป็นอัตราความสำเร็จในการวินิจฉัยเกือบ 5% นักวิจัยเรียกสิ่งนี้ว่า "ตัวเปลี่ยนเกม" เพราะจีโนมเหล่านี้เคยผ่านการวิเคราะห์อย่างละเอียดจากผู้เชี่ยวชาญมนุษย์มาแล้ว
นอกจากนี้ การผสานรวม AI ในวงกว้างของ Boston Children's Hospital ยังช่วยวินิจฉัย โรคหายากกว่า 40 โรค ที่ไม่เคยหาสาเหตุได้มาก่อน ประหยัดเวลาทำงานได้ถึง 60,000 ชั่วโมงต่อปี (เทียบเท่ากับเงิน 7 ล้านดอลลาร์สหรัฐที่ถูกจัดสรรใหม่) และลดต้นทุนการดำเนินงานพร้อมขยายการเข้าถึงบริการ
OpenAI เปิดตัวผลิตภัณฑ์ด้านสุขภาพสามอย่างในปี 2026:
ChatGPT Health (7 มกราคม 2026) — ฟีเจอร์สำหรับผู้บริโภคที่ให้ผู้ใช้สอบถามหัวข้อเกี่ยวกับสุขภาพ อัปโหลดเอกสารทางการแพทย์ และเชื่อมต่อแอปพลิเคชันด้านสุขภาพอย่าง Apple Health และ MyFitnessPal ได้อย่างปลอดภัย OpenAI ระบุชัดเจนว่าฟีเจอร์นี้ออกแบบมาเพื่อการวินิจฉัยหรือการรักษาโรค
OpenAI for Healthcare (8 มกราคม 2026) — ผลิตภัณฑ์สำหรับองค์กรที่สอดคล้องกับ HIPAA ซึ่งนำเสนอเครื่องมือที่ขับเคลื่อนด้วย GPT-5 สำหรับองค์กรด้านการดูแลสุขภาพ โดยเปิดตัวพร้อมลูกค้ารายใหญ่ เช่น AdventHealth, Baylor Scott & White Health, Boston Children's Hospital, Cedars-Sinai Medical Center, HCA Healthcare, Memorial Sloan Kettering Cancer Center, Stanford Medicine Children's Health และ UCSF
ChatGPT for Clinicians (22 เมษายน 2026) — เวอร์ชันเฉพาะทางที่ให้บริการฟรีสำหรับแพทย์และบุคลากรทางการแพทย์ที่ได้รับการยืนยันตัวตนในสหรัฐฯ เช่น แพทย์ พยาบาลเวชปฏิบัติ ผู้ช่วยแพทย์ และเภสัชกร เครื่องมือนี้ช่วยสรุปหลักฐานทางการแพทย์ ร่างเอกสารทางคลินิก สร้างสื่อให้ความรู้ผู้ป่วย และผสานรวมแนวทางปฏิบัติทางคลินิกและงานวิจัย ในการทดสอบ HealthBench Professional เครื่องมือนี้ทำคะแนนได้สูงกว่าค่าเฉลี่ยแพทย์มนุษย์อย่างมีนัยสำคัญ
นอกจากนี้ยังมีการอัปเดตโมเดลครั้งที่สี่คือ GPT-Rosalind (มิถุนายน 2026) ซึ่งรวมความสามารถของ GPT-5.5 ในการเขียนโค้ดเข้ากับความฉลาดทางวิทยาศาสตร์ที่เพิ่มขึ้นสำหรับงานวิจัยชีวการแพทย์
การรุกด้านสุขภาพของ OpenAI ในปี 2026 มีสาระสำคัญและมีผลลัพธ์ที่จับต้องได้ ตั้งแต่การลดอาการหลอนทางการแพทย์ลง 52.5% ไปจนถึงการช่วยวินิจฉัยเคสโรคหายากที่ไม่เคยหาสาเหตุได้ถึง 18 ราย บริษัทได้สร้างกลยุทธ์สามชั้นที่ชัดเจน: การให้ความรู้แก่ผู้บริโภค, เครื่องมือฟรีสำหรับบุคลากรทางการแพทย์ และการปรับใช้ในองค์กร ถึงแม้ควรใช้ความระมัดระวัง (เนื่องจากมาตรวัดของ OpenAI เป็นของบริษัทเอง และ Meta-analysis ใน Nature ยืนยันว่า AI ยังตามหลังแพทย์ผู้เชี่ยวชาญ) แต่หลักฐานชี้ให้เห็นว่าสำหรับคำถามด้านสุขภาพทั่วไปและงานสนับสนุนทางคลินิก GPT-5.5 Instant เป็นเครื่องมือที่มีประโยชน์อย่างแท้จริง ไม่ใช่แค่ของเล่น
Comments
0 comments