Câu trả lời ngắn gọn: Grok có khả năng tìm kiếm web và X là thật; còn tuyên bố “Grok 4.3 tìm tốt hơn các phiên bản trước” thì chưa được chứng minh bằng các nguồn hiện có. Tài liệu của xAI xác nhận Grok có tìm kiếm web trực tiếp, tìm kiếm trên X và tìm kiếm thời gian thực ở cấp API, nhưng bộ nguồn được cung cấp không có benchmark đối chứng, ghi chú phát hành chính thức hay bài kiểm thử có thể lặp lại cho thấy Grok 4.3 truy xuất thông tin mới tốt hơn Grok 4, Grok 4.1 hoặc Grok 4.1 Fast.[13][
14][
16]
Điều xAI đã xác nhận về khả năng tìm kiếm của Grok
Theo tài liệu Web Search của xAI, công cụ này cho phép Grok tìm kiếm web theo thời gian thực và duyệt các trang web để lấy thông tin.[13] Nói cách khác, việc Grok có thể lấy thông tin mới từ web mở là một khả năng được xAI mô tả rõ.
Với X — nền tảng trước đây là Twitter — tài liệu X Search của xAI cho biết Grok có thể tìm kiếm theo từ khóa, tìm kiếm ngữ nghĩa, tìm người dùng và lấy thread trên X.[14] Đây là điểm quan trọng vì tìm kiếm mạng xã hội không chỉ là “gõ từ khóa”, mà còn có các tác vụ có cấu trúc hơn, chẳng hạn tìm đúng tài khoản hoặc theo dõi một chuỗi bài đăng.
Trang API của xAI cũng mô tả Grok API có tìm kiếm thời gian thực, và một bài đăng của xAI trên X nói rằng Live Search cho phép Grok tìm dữ liệu thời gian thực từ X và internet.[16][
23] Ghép các nguồn này lại, có thể nói tìm kiếm trực tiếp là một phần trong bộ tính năng được xAI công bố cho Grok.
Nhưng Grok 4.3 “tốt hơn” thì chưa được chứng minh
Điểm cần tách bạch là: câu hỏi không chỉ là Grok có tìm kiếm được hay không. Câu hỏi khó hơn là Grok 4.3 có tìm kiếm hiệu quả hơn các bản Grok trước hay không.
Với bộ nguồn hiện có, kết luận mạnh hơn này chưa đứng vững. Các tài liệu chính thức về Grok 4, Grok 4.1 và Grok 4.1 Fast có nhắc đến native tool use, agentic search, tool calling và một số tuyên bố về bảng xếp hạng chung.[18][
24][
25] Tuy nhiên, chúng không đưa ra benchmark riêng cho Grok 4.3 về truy xuất thông tin, chẳng hạn độ mới của nguồn, chất lượng nguồn, độ chính xác của trích dẫn hoặc khả năng xử lý thread trên X so với các phiên bản Grok trước.[
18][
24][
25]
Nguồn duy nhất trong bộ tài liệu nhắc riêng đến Grok 4.3 là một bài viết bên thứ ba về Grok 4.3 Beta, không phải ghi chú phát hành chính thức của xAI hay một đánh giá truy xuất thông tin được công bố có phương pháp.[3] Vì vậy, nguồn này chưa đủ mạnh để khẳng định Grok 4.3 có lợi thế đo lường được trong tìm kiếm web hoặc X.
Có công cụ không đồng nghĩa với dùng công cụ tốt hơn
Trong đánh giá AI, nên phân biệt hai loại tuyên bố.
Tuyên bố về “khả năng” hỏi rằng: hệ thống có truy cập được công cụ tìm kiếm hay không? Với Grok, câu trả lời có cơ sở nhờ tài liệu Web Search và X Search của xAI.[13][
14]
Tuyên bố về “hiệu năng” lại hỏi rằng: một phiên bản mô hình có dùng các công cụ đó tốt hơn phiên bản khác hay không? Để trả lời, cần dữ liệu so sánh. Những tiêu chí hợp lý gồm: Grok 4.3 có tìm được nguồn mới hơn không, chọn trang web hoặc bài đăng X liên quan hơn không, theo đúng thread không, trích dẫn có khớp với nội dung trả lời không, và có tránh suy diễn thiếu căn cứ không. Tài liệu tìm kiếm của xAI mô tả công cụ sẵn có, nhưng không công bố các phép đo so sánh theo từng phiên bản như vậy.[13][
14]
Nếu muốn kiểm tra Grok 4.3, nên kiểm tra thế nào?
Một bài kiểm tra công bằng nên chạy cùng một bộ câu hỏi cần thông tin mới trên Grok 4.3 và các phiên bản Grok trước, trong cùng thời điểm. Phần web nên có các tác vụ buộc mô hình phải duyệt trang, vì Web Search được xAI mô tả là hỗ trợ tìm kiếm web thời gian thực và duyệt trang web.[13]
Phần X nên có các tác vụ riêng cho nền tảng này: tìm theo từ khóa, tìm ngữ nghĩa, tìm người dùng và lấy thread, vì đây là các chức năng được liệt kê trong tài liệu X Search của xAI.[14]
Khi chấm điểm, cần tách riêng khâu truy xuất nguồn và khâu viết câu trả lời. Với mỗi mô hình, người đánh giá nên ghi lại: nguồn nào được tìm thấy, nguồn có cập nhật không, các khẳng định trong câu trả lời có được nguồn hỗ trợ không, thread trên X có được lấy đúng không, và trích dẫn có khớp với từng mệnh đề không. Nếu không có so sánh song song kiểu này, số phiên bản cao hơn chưa đủ để chứng minh đây là một bản nâng cấp về tìm kiếm.
Kết luận
Kết luận an toàn nhất theo bằng chứng hiện có là: Grok có thể tìm kiếm web trực tiếp và X thông qua các công cụ được xAI mô tả, nhưng các nguồn được cung cấp chưa cho thấy Grok 4.3 truy xuất câu trả lời mới hiệu quả hơn Grok 4, Grok 4.1 hoặc Grok 4.1 Fast.[13][
14][
18][
24][
25]
Với người dùng thực tế, có thể xem tìm kiếm web và X của Grok là tính năng thật, nhưng vẫn nên kiểm tra lại nguồn mà hệ thống trả về. Còn trong so sánh sản phẩm, tuyên bố “Grok 4.3 tìm kiếm tốt hơn” nên được coi là câu hỏi còn bỏ ngỏ cho đến khi xAI hoặc các bên đánh giá độc lập công bố kết quả trực tiếp, có thể kiểm chứng và lặp lại.




