Jawaban singkatnya: Grok memang punya jalur pencarian live untuk web dan X, tetapi bukti yang tersedia belum menunjukkan bahwa Grok 4.3 mencari informasi terkini lebih baik daripada Grok 4, Grok 4.1, atau Grok 4.1 Fast.[13][
14][
18][
24][
25]
Bagi pengguna, perbedaannya penting. Ada kemampuan berarti model dapat memakai alat pencarian. Ada kinerja berarti model terbukti memakai alat itu lebih baik daripada versi lain. Untuk Grok 4.3, bagian pertama didukung; bagian kedua masih belum terbukti.
Yang sudah dikonfirmasi xAI
Dokumentasi Web Search xAI menyatakan alat ini memungkinkan Grok mencari web secara real time dan menjelajahi halaman web untuk menemukan informasi.[13] Jadi, klaim bahwa Grok dapat mengambil informasi terbaru dari web terbuka punya dasar resmi.
Dokumentasi X Search xAI menyebut Grok dapat melakukan keyword search, semantic search, user search, dan thread fetch di X, platform yang dulu dikenal sebagai Twitter.[14] Ini berarti Grok tidak hanya mencari kata kunci di X, tetapi juga memiliki fungsi yang lebih terstruktur, seperti mencari akun pengguna atau mengambil rangkaian percakapan.
Halaman API xAI juga memasarkan Grok API dengan fitur real-time search, sementara unggahan xAI di X menyebut Live Search memungkinkan Grok mencari data realtime dari X dan internet.[16][
23] Dengan kata lain, akses live retrieval memang bagian dari permukaan produk Grok yang terdokumentasi.
Yang belum terbukti soal Grok 4.3
Pertanyaan utamanya bukan lagi apakah Grok bisa mencari. Pertanyaannya: apakah Grok 4.3 mencari lebih baik daripada versi Grok sebelumnya?
Di titik itu, buktinya belum cukup. Kumpulan sumber yang tersedia mencakup materi resmi xAI tentang Grok 4, Grok 4.1, dan Grok 4.1 Fast, termasuk native tool use, agentic search, tool calling, dan klaim leaderboard umum.[18][
24][
25] Namun sumber-sumber itu tidak memberikan benchmark retrieval khusus Grok 4.3 yang membandingkan kesegaran informasi, kualitas sumber, akurasi sitasi, atau kemampuan menangani thread X dengan model Grok sebelumnya.[
18][
24][
25]
Satu-satunya sumber khusus Grok 4.3 yang tersedia dalam kumpulan ini adalah artikel pihak ketiga tentang Grok 4.3 Beta, bukan catatan rilis resmi xAI atau evaluasi retrieval yang terdokumentasi.[3] Karena itu, artikel tersebut belum cukup kuat untuk membuktikan bahwa Grok 4.3 punya keunggulan terukur dalam pencarian web atau X.
Kemampuan bukan berarti performa
Dalam membaca klaim produk AI, dua hal ini sebaiknya dipisahkan.
Klaim kemampuan bertanya: apakah sistem punya akses ke alat pencarian? Untuk Grok, jawabannya didukung oleh dokumentasi Web Search dan X Search xAI.[13][
14]
Klaim performa bertanya: apakah satu versi model memakai alat itu lebih efektif daripada versi lain? Klaim seperti ini butuh pembanding langsung. Ukurannya bisa berupa seberapa segar sumber yang ditemukan, seberapa relevan halaman web atau unggahan X yang dipilih, apakah thread diambil secara utuh, apakah sitasi cocok dengan klaim, dan apakah jawaban menghindari pernyataan tanpa dukungan. Dokumentasi pencarian xAI menjelaskan alat yang tersedia, tetapi tidak melaporkan pengukuran versi-ke-versi tersebut.[13][
14]
Cara menguji Grok 4.3 secara adil
Uji yang rapi perlu menjalankan prompt informasi terkini yang sama pada Grok 4.3 dan versi Grok sebelumnya pada waktu yang sama. Bagian web harus mencakup tugas yang membutuhkan browsing halaman, karena Web Search didokumentasikan untuk pencarian web real time dan penjelajahan halaman.[13]
Bagian X juga perlu mencakup tugas khusus X: keyword search, semantic search, user search, dan thread fetch, sesuai fungsi yang tercantum dalam dokumentasi X Search xAI.[14]
Penilaiannya sebaiknya memisahkan retrieval dari kualitas penulisan jawaban. Untuk tiap model, evaluator perlu mencatat sumber apa yang ditemukan, apakah sumber itu mutakhir, apakah klaim dalam jawaban didukung sumber, apakah thread X diambil dengan benar, dan apakah sitasi benar-benar menunjuk pada klaim yang relevan. Tanpa bukti berdampingan seperti itu, nomor versi yang lebih tinggi belum cukup untuk menyimpulkan ada peningkatan retrieval.
Kesimpulan
Kesimpulan paling aman dari bukti yang ada: Grok dapat mencari web live dan X lewat alat yang terdokumentasi, tetapi sumber yang tersedia belum menunjukkan bahwa Grok 4.3 mengambil jawaban terkini lebih efektif daripada Grok 4, Grok 4.1, atau Grok 4.1 Fast.[13][
14][
18][
24][
25]
Untuk penggunaan sehari-hari, anggap pencarian web dan X Grok sebagai kemampuan nyata, tetapi tetap periksa sumber yang dikembalikan. Untuk perbandingan produk, perlakukan klaim bahwa Grok 4.3 punya retrieval lebih baik sebagai pertanyaan terbuka sampai xAI atau evaluator independen menerbitkan hasil langsung yang dapat direproduksi.




