คำตอบสั้น ๆ: Grok มีความสามารถค้นเว็บและ X ได้จริงตามเอกสารของ xAI แต่คำกล่าวที่ว่า Grok 4.3 ค้นหา “ดีกว่า” รุ่นก่อนยังไม่มีหลักฐานเพียงพอในแหล่งข้อมูลที่ให้มา xAI ระบุชัดเรื่อง Web Search, X Search และ real-time search ใน API แต่ยังไม่พบ benchmark แบบควบคุม, release note ทางการ หรือชุดทดสอบทำซ้ำได้ที่เทียบ Grok 4.3 กับ Grok รุ่นก่อนโดยตรง [13][
14][
16]
สิ่งที่ยืนยันได้: Grok มีช่องทางค้นข้อมูลสด
เอกสาร Web Search ของ xAI ระบุว่าเครื่องมือนี้ทำให้ Grok ค้นเว็บแบบเรียลไทม์และเปิดดูหน้าเว็บเพื่อหาข้อมูลได้ [13] ดังนั้นข้ออ้างพื้นฐานว่า Grok สามารถดึงข้อมูลจากเว็บเปิด ไม่ได้อาศัยแค่ความรู้ในโมเดลอย่างเดียว จึงมีหลักฐานรองรับ
ส่วนเอกสาร X Search ระบุว่า Grok ใช้ค้นหาบน X หรือแพลตฟอร์มที่เดิมคือ Twitter ได้หลายแบบ ได้แก่ keyword search, semantic search, user search และ thread fetch [14] พูดให้เป็นภาษาผู้ใช้คือ ไม่ได้มีแค่ค้นคำตรง ๆ แต่ยังมีงานเฉพาะของแพลตฟอร์ม เช่น ตามหาแอคเคานต์หรือดึงเธรดขึ้นมาอ่านได้
หน้าข้อมูล Grok API ของ xAI ก็อธิบายว่า API มี real-time search และโพสต์ของ xAI บน X ระบุว่า Live Search ให้ Grok ค้นข้อมูลเรียลไทม์จาก X และอินเทอร์เน็ตได้ [16][
23] เมื่อนำมาประกอบกัน ภาพที่เห็นค่อนข้างชัดว่า “การค้นข้อมูลสด” เป็นส่วนหนึ่งของผลิตภัณฑ์ Grok
จุดที่ยังไม่ชัด: Grok 4.3 ดีกว่าจริงหรือไม่
คำถามสำคัญไม่ใช่แค่ว่า Grok ค้นหาได้หรือไม่ แต่คือ Grok 4.3 ค้นหาได้ดีกว่า Grok 4, Grok 4.1 หรือ Grok 4.1 Fast หรือเปล่า
จากแหล่งข้อมูลที่ให้มา ข้อสรุปนั้นยังไปไม่ถึง เอกสารและข่าวของ xAI เกี่ยวกับ Grok 4, Grok 4.1 และ Grok 4.1 Fast พูดถึงเรื่องอย่าง native tool use, agentic search, tool calling และผลบน leaderboard บางประเภท [18][
24][
25] แต่ไม่ได้ให้ผลทดสอบเฉพาะของ Grok 4.3 ที่วัดการค้นคืนข้อมูล เช่น ความสดของแหล่งข่าว คุณภาพแหล่งข้อมูล ความถูกต้องของ citation หรือการจัดการเธรดบน X เทียบกับรุ่นก่อน [
18][
24][
25]
แหล่งข้อมูลเฉพาะ Grok 4.3 ที่มีในชุดนี้เป็นบทความบุคคลที่สามเกี่ยวกับ Grok 4.3 Beta ไม่ใช่ release note ทางการของ xAI และไม่ใช่ผลประเมิน retrieval ที่ตรวจซ้ำได้ [3] จึงใช้เป็นหลักฐานอ่อนมากสำหรับคำกล่าวว่า Grok 4.3 มีความได้เปรียบด้านการค้นเว็บหรือ X อย่างวัดผลได้
มีเครื่องมือ ไม่ได้แปลว่าใช้ได้ดีกว่ารุ่นก่อน
ในโลก AI คำว่า “ค้นหาได้” กับ “ค้นหาเก่งกว่า” เป็นคนละเรื่องกัน
คำถามแรกเป็นเรื่องความสามารถ: ระบบเข้าถึงเครื่องมือค้นหาได้หรือไม่? สำหรับ Grok คำตอบนี้มีหลักฐานจากเอกสาร Web Search และ X Search ของ xAI [13][
14]
แต่คำถามที่สองเป็นเรื่องประสิทธิภาพ: โมเดลเวอร์ชันหนึ่งใช้เครื่องมือเหล่านั้นได้ดีกว่าอีกเวอร์ชันจริงหรือไม่? การจะตอบต้องมีข้อมูลเปรียบเทียบ เช่น รุ่นใหม่เจอแหล่งข้อมูลที่สดกว่าไหม เลือกหน้าเว็บหรือโพสต์ X ที่ตรงประเด็นกว่าไหม อ่านเธรดครบไหม อ้างอิงตรงกับเนื้อหาจริงหรือไม่ และหลีกเลี่ยงการสรุปเกินหลักฐานได้ดีขึ้นหรือเปล่า เอกสาร xAI ที่อ้างถึงอธิบายเครื่องมือที่มี แต่ไม่ได้รายงานตัวชี้วัดแบบรุ่นต่อรุ่นเหล่านี้ [13][
14]
ถ้าจะทดสอบ Grok 4.3 ควรทำอย่างไร
การทดสอบที่ยุติธรรมควรให้ Grok 4.3 และ Grok รุ่นก่อนที่ยังใช้งานได้ตอบโจทย์ชุดเดียวกันในเวลาเดียวกัน เพราะโจทย์ข้อมูลสดเปลี่ยนได้เร็วมาก หากทดสอบคนละวัน ผลอาจสะท้อนการเปลี่ยนของเว็บหรือ X มากกว่าสะท้อนคุณภาพโมเดล
ชุดโจทย์ควรรวมงานที่ต้องเปิดหน้าเว็บจริง เพราะ Web Search ถูกอธิบายว่าใช้ค้นเว็บแบบเรียลไทม์และ browse web pages ได้ [13] และควรรวมงานเฉพาะของ X เช่น ค้นด้วยคำสำคัญ ค้นตามความหมาย ค้นผู้ใช้ และดึงเธรด เพราะนี่คือฟังก์ชันที่เอกสาร X Search ระบุไว้ [
14]
ที่สำคัญ ควรแยกคะแนน “การค้นคืนข้อมูล” ออกจาก “การเขียนคำตอบ” โมเดลอาจเขียนลื่นแต่หาแหล่งข้อมูลไม่ดี หรือหาแหล่งข้อมูลดีแต่สรุปพลาดก็ได้ เกณฑ์ที่ควรบันทึก ได้แก่ แหล่งที่ค้นเจอ ความสดและความน่าเชื่อถือของแหล่งนั้น ความสอดคล้องระหว่าง citation กับ claim การดึงเธรด X ครบถ้วน และจำนวนข้อสรุปที่ไม่มีหลักฐานรองรับ
บทสรุป
ข้อสรุปที่ปลอดภัยที่สุดตามหลักฐานคือ: Grok มีเครื่องมือค้นเว็บสดและค้น X จริง แต่แหล่งข้อมูลที่ให้มายังไม่พิสูจน์ว่า Grok 4.3 ค้นคืนคำตอบปัจจุบันได้มีประสิทธิภาพกว่า Grok 4, Grok 4.1 หรือ Grok 4.1 Fast [13][
14][
18][
24][
25]
สำหรับการใช้งานจริง ควรมอง Web Search และ X Search ของ Grok เป็นความสามารถที่มีอยู่จริง แต่ยังต้องตรวจแหล่งอ้างอิงที่มันคืนมาเสมอ ส่วนคำกล่าวว่า “Grok 4.3 ค้นหาเก่งขึ้น” ควรถือเป็นข้ออ้างที่ยังรอหลักฐาน จนกว่า xAI หรือผู้ประเมินอิสระจะเผยแพร่ผลทดสอบโดยตรงและทำซ้ำได้




