Trước khi dùng DeepSeek V4 để xử lý tài liệu công việc, dữ liệu khách hàng hay thông tin cá nhân, nên tách bạch hai chuyện. Các nguồn hiện có không cho phép kết luận rằng DeepSeek V4 “đánh cắp” dữ liệu. Điều có thể nói chắc hơn là DeepSeek có thể xử lý dữ liệu cá nhân liên quan đến dịch vụ của họ, và một số nội dung người dùng nhập vào có thể được thu thập [2][
3].
Cũng cần lưu ý: các nguồn được dẫn ở đây không phải là một chính sách quyền riêng tư riêng, chỉ dành cho “DeepSeek V4”. Chính sách chung của DeepSeek nói rằng chính sách này áp dụng cho dữ liệu cá nhân mà DeepSeek xử lý liên quan đến ứng dụng, trang web, phần mềm và các dịch vụ liên quan có liên kết hoặc tham chiếu đến chính sách đó [2].
Câu trả lời ngắn gọn
Hãy dùng DeepSeek V4 như cách bạn dùng một dịch vụ AI bên ngoài công ty hoặc bên ngoài thiết bị cá nhân. Nếu bạn dán mật khẩu, khóa API, hợp đồng mật, dữ liệu khách hàng hoặc thông tin cá nhân của người khác vào khung chat, vấn đề không còn nằm ở chữ “bị lấy cắp” hay không. Bạn đã chủ động gửi dữ liệu đó tới một hệ thống bên ngoài có thể xử lý nội dung người dùng [2][
3].
Quy tắc dễ nhớ: đừng nhập bất cứ thứ gì mà bạn không sẵn sàng chia sẻ với một nhà cung cấp dịch vụ bên thứ ba.
DeepSeek nói có thể thu thập những loại dữ liệu nào?
Chính sách quyền riêng tư của DeepSeek áp dụng cho dữ liệu cá nhân được xử lý liên quan đến các dịch vụ của hãng [2]. Một phiên bản chính sách khác trong các nguồn được cung cấp liệt kê cụ thể một số nhóm dữ liệu có thể được thu thập khi dùng dịch vụ [
3], gồm:
- Thông tin tài khoản, chẳng hạn ngày sinh khi áp dụng, tên người dùng khi áp dụng, email hoặc số điện thoại, và mật khẩu [
3].
- Nội dung người dùng nhập vào, gồm văn bản, prompt, tệp tải lên, phản hồi, lịch sử trò chuyện hoặc nội dung khác mà bạn cung cấp cho mô hình và dịch vụ [
3].
- Thông tin bạn gửi khi liên hệ với DeepSeek, chẳng hạn nội dung trong yêu cầu hỗ trợ hoặc giấy tờ dùng để xác minh danh tính [
3].
Điểm đáng chú ý nhất trong sử dụng hằng ngày là nhóm thứ hai. Prompt, tệp đính kèm và lịch sử trò chuyện nhiều khi nhạy cảm hơn cả thông tin đăng ký tài khoản, nhất là khi bạn sao chép dữ liệu công việc, dữ liệu khách hàng, thông tin hệ thống nội bộ hoặc dữ liệu của bên thứ ba.
Những thứ không nên đưa vào DeepSeek V4
Vì prompt, tệp tải lên, phản hồi và lịch sử chat có thể thuộc nhóm nội dung được dịch vụ thu thập [3], bạn nên tránh đưa vào những thông tin bí mật, có tính pháp lý hoặc khó thu hồi nếu đã lộ.
Cụ thể, không nên dán hoặc tải lên:
- mật khẩu, mã khôi phục, mã 2FA/OTP hoặc token phiên đăng nhập;
- khóa API, thông tin đăng nhập cloud, chuỗi kết nối cơ sở dữ liệu hoặc bí mật hạ tầng;
- tài liệu nội bộ, hợp đồng, bảng lương, kế hoạch kinh doanh hoặc tài liệu mật;
- thông tin ngân hàng, thuế, thẻ thanh toán hoặc dữ liệu thanh toán nhạy cảm;
- hồ sơ y tế hoặc dữ liệu sức khỏe;
- tên, email, số điện thoại, địa chỉ, mã định danh hoặc dữ liệu cá nhân của người khác;
- mã nguồn độc quyền, prompt nội bộ, chiến lược kinh doanh hoặc bí mật thương mại.
Điều này không có nghĩa DeepSeek chắc chắn sẽ dùng sai các dữ liệu đó. Vấn đề là một khi bạn gửi đi, dữ liệu không còn chỉ nằm trong môi trường của bạn nữa.
Người dùng cũng chịu trách nhiệm với nội dung mình gửi
Điều khoản sử dụng của DeepSeek nói rằng người dùng chịu trách nhiệm với mọi Input gửi lên dịch vụ và các Output tương ứng. Điều khoản này cũng nêu rằng khi gửi Input, người dùng cam kết mình có đủ quyền, giấy phép và sự cho phép cần thiết để làm việc đó [4].
Điểm này đặc biệt quan trọng trong môi trường công việc. Việc chép dữ liệu khách hàng, ticket nội bộ, tài liệu công ty, mã nguồn riêng hoặc thông tin cá nhân của người khác vào chatbot có thể tạo rủi ro về quyền riêng tư, tuân thủ, hợp đồng hoặc quy định nội bộ — kể cả khi mục đích ban đầu chỉ là nhờ tóm tắt, sửa câu chữ hoặc tìm lỗi.
Các tùy chọn quyền riêng tư nên kiểm tra
Trong tài liệu về cơ chế mô hình và phương pháp huấn luyện, DeepSeek nói người dùng có thể xem thông tin cơ bản về dịch vụ, chọn không cho dùng dữ liệu để huấn luyện mô hình và xóa dữ liệu lịch sử [7].
Tuy vậy, bạn vẫn nên kiểm tra các tùy chọn này trong đúng giao diện mình đang dùng. Trước khi làm việc với bất kỳ thông tin nào hơi nhạy cảm, hãy xem rõ:
- có tùy chọn loại trừ dữ liệu của bạn khỏi quá trình huấn luyện hay không;
- tùy chọn đó áp dụng cho cuộc trò chuyện trong tương lai, dữ liệu cũ hay cả hai;
- bạn có thể xóa lịch sử chat hay không;
- tệp đã tải lên có bị xóa cùng lịch sử hay không;
- thiết lập này áp dụng cho bản web, ứng dụng, API hay chỉ một phần dịch vụ.
Việc DeepSeek nói có các quyền kiểm soát nói chung không thay thế cho việc bạn tự kiểm tra tài khoản, sản phẩm và cấu hình cụ thể mà mình đang sử dụng.
Cách giảm rủi ro khi dùng DeepSeek V4
Nguyên tắc quan trọng nhất là giảm thiểu dữ liệu: chỉ gửi phần thật sự cần thiết cho nhiệm vụ.
1. Ẩn danh trước khi dán nội dung
Thay tên người, email, số điện thoại, địa chỉ, mã khách hàng, mã nhân viên, tên công ty hoặc tên dự án bằng ký hiệu như Khách hàng ACông ty B[email] hoặc [mã nội bộ]
2. Dùng đoạn trích, không dùng cả tài liệu
Nếu bạn chỉ cần kiểm tra một điều khoản, một đoạn văn hoặc một lỗi trong mã, hãy trích đúng phần đó. Đừng tải cả tệp nếu một mẫu nhỏ đã đủ để giải quyết câu hỏi.
3. Làm sạch tệp trước khi đính kèm
Tạo một bản sao đã loại bỏ bình luận, metadata, lịch sử chỉnh sửa, đường dẫn nội bộ hoặc dữ liệu ẩn. Không nên dùng tệp gốc nếu trong đó có thông tin không cần thiết cho yêu cầu của bạn.
4. Tách việc thử nghiệm cá nhân khỏi công việc
Không nên trộn thử nghiệm cá nhân, dữ liệu công việc và tài liệu nhạy cảm trong cùng một tài khoản nếu không có lý do rõ ràng. Một tài khoản thử nghiệm với dữ liệu giả sẽ giảm thiểu hậu quả nếu bạn thao tác nhầm.
5. Đổi hoặc thu hồi thông tin đăng nhập nếu lỡ gửi nhầm
Nếu bạn đã dán mật khẩu, token, khóa API hoặc bí mật hạ tầng, hãy đổi, thu hồi hoặc xoay vòng ngay. Xóa lịch sử chat có thể hữu ích nếu tùy chọn đó có sẵn, nhưng không nên xem đây là biện pháp duy nhất khi một thông tin đăng nhập đã bị lộ [7].
Nếu đã gửi dữ liệu nhạy cảm thì nên làm gì?
Cách xử lý phụ thuộc vào loại dữ liệu:
- Mật khẩu, token hoặc khóa API: đổi, thu hồi hoặc xoay vòng ngay.
- Dữ liệu cá nhân của người khác: ghi nhận rõ đã chia sẻ gì và làm theo quy trình quyền riêng tư của tổ chức bạn.
- Tài liệu nội bộ hoặc tài liệu mật: báo cho bộ phận bảo mật, pháp chế hoặc tuân thủ nếu phù hợp.
- Lịch sử chat: kiểm tra tùy chọn xóa, vì DeepSeek nói người dùng có thể xóa dữ liệu lịch sử [
7].
- Dữ liệu dùng cho huấn luyện: tìm tùy chọn loại trừ mà DeepSeek nói là có cung cấp đối với việc dùng dữ liệu để huấn luyện mô hình [
7].
Kết luận
Không có cơ sở trong các nguồn hiện có để nói rằng DeepSeek V4 “sẽ đánh cắp” dữ liệu của bạn. Nhưng có đủ cơ sở để đưa ra một cảnh báo thực tế: DeepSeek có thể xử lý dữ liệu cá nhân liên quan đến dịch vụ của họ [2], và một chính sách được dẫn nêu rằng prompt, tệp tải lên, phản hồi và lịch sử trò chuyện có thể thuộc nhóm dữ liệu được thu thập [
3].
Cách dùng thận trọng nhất là xem DeepSeek V4 như một dịch vụ AI bên thứ ba. Nếu dữ liệu là bí mật, dữ liệu cá nhân, dữ liệu có quy định ràng buộc, tài sản doanh nghiệp hoặc thứ khó thu hồi khi đã lộ, đừng dán vào.




