Điểm nguy hiểm nhất trong câu trả lời của AI thường không phải là câu chữ vụng về. Ngược lại, rủi ro nằm ở chỗ AI có thể viết rất mạch lạc, rất tự tin, có vẻ như đã kiểm chứng — nhưng dữ kiện bên trong vẫn sai, thiếu ngữ cảnh hoặc không có nguồn.
NIST GenAI text-2026 đánh giá mức độ văn bản do AI tạo ra khó phân biệt với bài viết của con người, cũng như độ đáng tin của các câu chuyện được tạo; chương trình này còn đề cập việc dùng những nội dung có vẻ đáng tin nhưng gây hiểu lầm để huấn luyện bộ phát hiện [1]. Một nghiên cứu khác xây dựng khung khái niệm để xem xét AI hallucinations như một nguồn thông tin không chính xác [
2]. Hướng dẫn số của chính phủ New Zealand cũng xem hallucinations là vấn đề có liên quan nhưng khác với misinformation và disinformation [
4].
Nguyên tắc cốt lõi rất đơn giản: đừng tin giọng văn tự tin của AI; hãy tin nguồn có thể kiểm tra được.
AI là điểm xuất phát, không phải bằng chứng
AI có thể giúp bạn tóm tắt vấn đề, gợi ý từ khóa tìm kiếm, liệt kê các tài liệu nên đọc hoặc phát hiện những điểm cần kiểm tra. Nhưng khi câu trả lời đụng đến dữ kiện, con số, chính sách, y tế, pháp luật, đầu tư hoặc tin tức, điều cần hỏi không phải là câu văn có trôi chảy không, mà là:
- Luận điểm này có truy được về nguồn gốc không?
- Nguồn gốc đó có thật sự nói đúng điều AI đang tóm tắt không?
- Ngày tháng, khu vực, định nghĩa và bối cảnh có khớp nhau không?
- Có nguồn độc lập đáng tin cậy nào xác nhận lại không?
Nếu một thông tin chỉ dẫn ngược về chính câu trả lời của AI, mà không truy được đến tài liệu công khai, văn bản gốc, dữ liệu hoặc phát ngôn của tổ chức liên quan, hãy coi đó là chưa được xác minh.
5 bước fact-check câu trả lời của AI
1. Tách câu trả lời thành từng claim có thể kiểm chứng
Đừng hỏi chung chung rằng cả đoạn trả lời đúng hay sai. Hãy tách nó thành từng mệnh đề nhỏ: số liệu ra số liệu, ngày tháng ra ngày tháng, kết luận ra kết luận, nhận định ra nhận định.
Bạn có thể dùng prompt này:
Hãy tách câu trả lời trên thành từng claim có thể kiểm chứng. Với mỗi claim, hãy liệt kê nguồn gốc, tổ chức hoặc tác giả, ngày công bố, URL và câu trích nguyên văn. Nếu không có nguồn, đánh dấu là chưa xác minh.
Sau bước này, bạn sẽ thấy ngay phần nào có thể đối chiếu, phần nào chỉ là AI tự nối ý hoặc suy đoán.
2. Mở nguồn ra xem, đừng chỉ nhìn tên nguồn
Có tên nguồn chưa có nghĩa là đã kiểm chứng. Hãy tự mở URL hoặc tìm văn bản gốc, rồi kiểm tra:
- URL có truy cập được không;
- tiêu đề, tác giả hoặc cơ quan phát hành, ngày công bố có khớp với lời AI nói không;
- văn bản gốc có thật sự ủng hộ câu tóm tắt của AI không;
- câu trích có đầy đủ không, hay bị cắt khỏi bối cảnh;
- AI có biến suy đoán, bình luận hoặc thông tin nền thành sự thật chắc chắn hay không.
Nếu nguồn không tồn tại, ngày tháng không khớp hoặc nội dung gốc nói khác với bản tóm tắt, hãy hạ mức claim đó xuống chưa xác minh hoặc có vấn đề.
3. Truy về tài liệu gốc, đừng dừng ở bản tóm tắt
Nguồn đáng ưu tiên nhất thường là nguồn gần nhất với sự kiện hoặc dữ liệu ban đầu, chẳng hạn:
- thông báo của cơ quan nhà nước, văn bản pháp luật, tài liệu của cơ quan quản lý;
- hồ sơ tòa án, phán quyết, biên bản hoặc tài liệu chính thức;
- thông cáo báo chí, báo cáo thường niên, công bố của doanh nghiệp;
- bài báo khoa học, báo cáo nghiên cứu, bộ dữ liệu;
- tuyên bố công khai của cá nhân, tổ chức hoặc nhóm nghiên cứu liên quan.
Báo chí, blog và bài đăng mạng xã hội có thể giúp bạn hiểu bối cảnh. Nhưng nếu bạn định trích dẫn, chia sẻ, đưa vào báo cáo hoặc dùng để ra quyết định, hãy cố gắng truy về tài liệu gốc. Nếu nhiều bài viết chỉ dẫn lẫn nhau nhưng không bài nào dẫn tới nguồn ban đầu, đó là tín hiệu rủi ro cao.
4. Đối chiếu với ít nhất một nguồn độc lập
Một nguồn có tồn tại không đồng nghĩa toàn bộ kết luận đã an toàn. Cách làm thực tế là kiểm tra theo hai lớp:
- Nguồn gốc: tài liệu chính thức, bài nghiên cứu, dữ liệu, hồ sơ tòa án, thông cáo hoặc văn bản của cơ quan liên quan.
- Nguồn độc lập: một nguồn đáng tin khác không chỉ sao chép lại nguồn đầu tiên, ví dụ cơ quan quản lý, tổ chức chuyên môn, cơ sở học thuật hoặc cơ quan báo chí có quy trình biên tập.
Nếu hai nguồn nói khác nhau, đừng vội chọn bên bạn muốn tin. Hãy ghi nhận là còn tranh cãi hoặc chưa thể xác nhận, rồi kiểm tra xem khác biệt đến từ thời điểm cập nhật, phạm vi địa lý, định nghĩa, phương pháp đo lường hay lỗi trích dẫn.
5. Phân loại kết quả, không ép mọi thứ thành đúng hoặc sai
Fact-check không phải lúc nào cũng cho ra kết luận trắng đen. Với câu trả lời của AI, cách an toàn hơn là phân loại từng claim theo mức độ chắc chắn:
| Trạng thái | Khi nào dùng | Nên xử lý thế nào |
|---|---|---|
| Đã xác minh | Truy được về nguồn gốc và nguồn đó thật sự ủng hộ claim | Có thể dùng, nhưng vẫn nên lưu nguồn |
| Chưa xác minh | Có thông tin được nêu ra nhưng chưa đủ nguồn đáng tin | Không trình bày như sự thật |
| Suy luận | AI hoặc người viết rút ra kết luận từ dữ liệu, nhưng nguồn không nói trực tiếp | Ghi rõ đây là suy luận |
| Còn tranh cãi | Nhiều nguồn đáng tin nói khác nhau | Nêu rõ khác biệt, tránh kết luận chắc chắn |
Cách phân loại này giúp bạn tránh lỗi phổ biến: biến những cụm như có thể, ước tính, nhiều người cho rằng thành sự thật đã được khẳng định.
6 điểm AI rất dễ làm sai
Số liệu: Phần trăm, số tiền, thứ hạng, tốc độ tăng trưởng, cỡ mẫu và mốc thời gian đều cần kiểm tra. Hãy xem rõ năm nào, khu vực nào, mẫu đo là gì và dữ liệu đến từ đâu.
Thời gian: Chính sách, giá cả, luật lệ, tính năng sản phẩm và tình trạng doanh nghiệp có thể thay đổi nhanh. Đừng chỉ xem ngày đăng; hãy xem cả ngày cập nhật nếu có.
Khu vực: Cùng một thuật ngữ có thể mang nghĩa khác nhau ở Việt Nam, Mỹ, EU hoặc các hệ thống pháp lý khác. Nội dung về luật, thuế, y tế, nhập cư, quyền riêng tư và đầu tư đặc biệt cần kiểm tra phạm vi áp dụng.
Định nghĩa: Những từ như AI, người dùng, doanh thu, rủi ro, tuân thủ, hiệu quả có thể được định nghĩa khác nhau tùy ngành và tùy báo cáo. Hãy xem văn bản gốc định nghĩa ra sao.
Trích dẫn: Có dấu ngoặc kép không có nghĩa là câu đó thật sự tồn tại. Hãy tìm nguyên văn, kiểm tra người nói, ngày nói và đoạn trước sau để xem AI có diễn giải quá mức hay không.
Chất lượng nguồn: Nguồn tồn tại không đồng nghĩa nguồn đáng tin. Cần phân biệt tài liệu chính thức, nghiên cứu học thuật, bài báo, nội dung tiếp thị của doanh nghiệp, blog cá nhân và trang chỉ sao chép lại thông tin.
Chủ đề rủi ro cao: đừng chỉ dựa vào AI
Với những chủ đề sau, chi phí của sai sót có thể rất lớn, nên tiêu chuẩn kiểm chứng phải cao hơn:
- chẩn đoán, thuốc, phác đồ điều trị và thông tin y tế;
- tư vấn pháp lý, hợp đồng, kiện tụng, nhập cư hoặc thuế;
- đầu tư, bảo hiểm và quyết định tài chính;
- an toàn cá nhân, an ninh mạng, ứng phó khẩn cấp;
- tin nóng, cáo buộc, rò rỉ thông tin và nội dung chính trị.
Pháp lý là một ví dụ rõ về rủi ro thực tế. OECD.AI từng ghi nhận một sự cố trong đó hallucination của AI tạo ra tác hại dưới dạng thông tin sai lệch ảnh hưởng đến thủ tục pháp lý [5]. Với các chủ đề như vậy, AI chỉ nên là công cụ giúp bạn chuẩn bị câu hỏi hoặc lập danh sách cần kiểm tra; nó không thay thế văn bản chính thức, chuyên gia đủ thẩm quyền hay quy trình chính quy.
Gặp những tín hiệu này, hãy coi là rủi ro cao
- Câu trả lời rất chắc chắn nhưng không có nguồn.
- Chỉ viết kiểu nghiên cứu cho thấy hoặc chuyên gia nhận định, nhưng không nêu tên nghiên cứu, tác giả, cơ quan và ngày công bố.
- Có nhiều chi tiết cụ thể nhưng bạn không tìm được văn bản gốc.
- Con số rất chính xác nhưng không có nguồn dữ liệu.
- Nội dung quá hợp với quan điểm của bạn, khiến bạn muốn tin ngay.
- Các nguồn chỉ trích dẫn lẫn nhau, cuối cùng không truy được tài liệu ban đầu.
- Nội dung nói về sự kiện mới nhưng không có mốc cập nhật rõ ràng.
NIST đặt độ đáng tin của câu chuyện do AI tạo ra và nội dung có vẻ đáng tin nhưng gây hiểu lầm vào bối cảnh đánh giá văn bản sinh bởi AI [1]. Nói ngắn gọn: càng giống thật, càng cần kiểm tra nguồn.
Prompt có thể sao chép để kiểm chứng nhanh
Chỉ liệt kê các nguồn gốc có thể kiểm tra công khai. Không tự suy đoán.
Với mỗi claim quan trọng, hãy thêm liên kết nguồn, tổ chức phát hành, ngày công bố và câu trích nguyên văn.
Nếu không chắc, hãy ghi là không biết hoặc chưa thể xác nhận. Không tự điền phần thiếu.
Hãy chia nội dung thành ba cột: đã xác minh, chưa xác minh, suy luận.
Hãy chỉ ra những điểm có khả năng sai nhất trong câu trả lời trên, gồm số liệu, ngày tháng, khu vực, định nghĩa và trích dẫn.
Quy tắc cuối cùng
Hãy nhớ một câu: truy được về nguồn gốc thì còn có thể xem xét; chỉ truy được về AI thì chưa phải là sự thật.
AI rất hữu ích để bắt đầu tìm kiếm, sắp xếp câu hỏi và tạo danh sách cần kiểm tra. Nhưng thứ quyết định một thông tin có đáng tin hay không vẫn là nguồn công khai, có thể đối chiếu và được đọc trong đúng bối cảnh.




