Bốn gigabyte là con số dễ gây chú ý. Nhưng trong câu chuyện Chrome và Gemini Nano, câu hỏi lớn hơn không phải là ổ cứng mất bao nhiêu chỗ. Câu hỏi là: một trình duyệt có đang thêm một lớp AI mới hay không, lớp đó được thông báo ra sao, dùng cho mục đích gì, có xử lý nội dung nhạy cảm không và người dùng có thể tắt hoặc gỡ bỏ thật sự hay không.
Điều đã được xác nhận, và điều vẫn là cáo buộc
Phần đã có tài liệu chính thức: Google mô tả Chrome như một nền tảng cho Built-in AI, tức AI tích hợp sẵn trong trình duyệt. Theo tài liệu dành cho nhà phát triển, website và ứng dụng web có thể thực hiện một số tác vụ AI thông qua các mô hình do trình duyệt quản lý và các API; Gemini Nano được nêu rõ trong bối cảnh này [17][
18]. Tài liệu Built-in AI cũng nói đến việc lưu mô hình trên thiết bị để ứng dụng khởi chạy nhanh hơn [
18]. Một bài trên Google Developers Blog còn nói LiteRT-LM hỗ trợ Gemini Nano chạy trên thiết bị trong các sản phẩm như Chrome [
20].
Phần đang được nhiều nơi phản ánh nhưng chưa được tài liệu Chrome xác nhận rõ: nhiều bài viết nói Chrome đã đặt một file mô hình khoảng 4 GB tên weights.bin trong thư mục hồ sơ OptGuideOnDeviceModel, không có thông báo đủ rõ và có thể tải lại sau khi người dùng xóa thủ công [2][
3][
7][
10][
14]. Trong các tài liệu Chrome liên quan, Google có nói về Built-in AI và việc lưu mô hình trên thiết bị, nhưng không nêu rõ dung lượng 4 GB, tên file
weights.bin hay cơ chế tự tải lại sau khi xóa [17][
18].
Vì vậy, không nên vội kết luận đây chắc chắn là một bê bối quyền riêng tư đã được chứng minh đầy đủ. Nhưng cũng không nên xem đây chỉ là một bản cập nhật bình thường. Điểm cần soi kỹ là quyền kiểm soát của người dùng và quản trị viên đối với AI cục bộ trong trình duyệt.
Vì sao quyền riêng tư không nằm ở số GB
Một mô hình AI lớn nằm trên máy không tự động là vấn đề quyền riêng tư. Ngược lại, nếu xử lý hoàn toàn cục bộ, nó có thể giảm nhu cầu gửi dữ liệu lên máy chủ. Điều đáng ngại là trường hợp một thành phần mới được cài vào trình duyệt mà người dùng không hiểu nó làm gì, khi nào hoạt động, ai có thể gọi nó và cách tắt ở đâu.
Điều này đặc biệt quan trọng vì Chrome Built-in AI không chỉ là tối ưu nội bộ. Google mô tả các API cho phép ứng dụng web thực hiện tác vụ AI bằng mô hình do trình duyệt quản lý [17][
18]. Tài liệu Google I/O nêu các ví dụ như dịch, tóm tắt, viết và viết lại nội dung [
28]. Khi những khả năng này nằm ngay trong trình duyệt, người dùng cần nhiều hơn một dòng thông báo về dung lượng tải xuống. Họ cần một lựa chọn rõ ràng và có thể kiểm chứng.
Mục đích sử dụng: cùng là AI, nhưng rủi ro rất khác
Rủi ro quyền riêng tư phụ thuộc mạnh vào mục đích. Một mô hình cục bộ có thể phục vụ tiện ích viết lách, dịch thuật, tóm tắt, hoặc tính năng an toàn. Tài liệu của Google và nội dung Google I/O nhắc đến các tác vụ như dịch, tóm tắt, viết và viết lại [17][
18][
28]. Ngoài ra, Infosecurity Magazine đưa tin Google thử nghiệm Gemini Nano trong Chrome 137 như một lớp bảo vệ bổ sung chống spam, lừa đảo và phishing trong chế độ Enhanced Protection của Safe Browsing [
25].
Những mục đích này có thể hữu ích. Nhưng chúng cần các công tắc riêng. Người dùng nên có thể phân biệt: tôi muốn AI cục bộ cho tính năng tiện ích, cho bảo vệ an toàn, cho API dành cho nhà phát triển, hay không muốn dùng AI trong trình duyệt. Nếu không có mô tả mục đích đủ rõ, một bản cập nhật trình duyệt rất dễ bị nhìn như một lần mở rộng chức năng âm thầm.
On-device là lợi thế, không phải giấy miễn trừ
Google mô tả Gemini Nano trong tài liệu on-device như một mô hình có thể đem lại trải nghiệm AI tạo sinh mà không cần kết nối mạng và không cần gửi dữ liệu lên đám mây [19]. Đây là lợi thế quyền riêng tư lớn nhất của AI chạy trên thiết bị: nếu nội dung thật sự ở lại máy, luồng dữ liệu lên cloud có thể giảm.
Nhưng cục bộ không đồng nghĩa với minh bạch. Vẫn cần trả lời các câu hỏi sau:
- nội dung nào được đưa vào mô hình cục bộ;
- chức năng Chrome nào hoặc website nào được phép gọi mô hình;
- prompt, kết quả, lỗi, số liệu sử dụng hoặc telemetry có được lưu hay gửi đi không;
- mô hình được cập nhật theo cơ chế nào;
- khi người dùng xóa hoặc tắt mô hình, nó có thật sự biến mất lâu dài không.
Tài liệu Chrome cho thấy ứng dụng web có thể dùng các API Built-in AI để làm việc với mô hình do trình duyệt quản lý [17][
18]. Vì vậy, không chỉ bản thân mô hình quan trọng; lớp cấp quyền, điều kiện truy cập và ghi nhận hoạt động xung quanh mô hình cũng quan trọng không kém.
Nội dung nhạy cảm cần ranh giới nhìn thấy được
Trình duyệt là nơi người dùng nhập rất nhiều dữ liệu: biểu mẫu, email, tài liệu nội bộ, cuộc trò chuyện, hồ sơ khách hàng, thông tin hỗ trợ. Nếu một tính năng AI dịch, tóm tắt, viết hoặc viết lại văn bản, nó có thể tiếp xúc với các nội dung như vậy [28]. Nếu quá trình xử lý thật sự chỉ diễn ra trên máy, điều đó thân thiện với quyền riêng tư hơn so với tự động gửi nội dung lên dịch vụ đám mây [
19]. Tuy nhiên, người dùng vẫn cần biết khi nào AI đang hoạt động và phần nội dung nào bị đưa vào xử lý.
Một triển khai tốt nên hiển thị rõ khi tính năng Chrome hoặc một website đang dùng mô hình cục bộ. Nó cũng cần nói dễ hiểu rằng thao tác đó chỉ xử lý trên thiết bị hay có thêm dữ liệu được gửi cho Google hoặc dịch vụ khác. Các trang chính thức của Chrome AI xác nhận sự tồn tại của các API Built-in AI, nhưng chưa trả lời hết những câu hỏi cụ thể về quyền kiểm soát và telemetry trong trường hợp đang gây tranh cãi [17][
18].
Opt-out và xóa file mới là bài kiểm tra thực tế
Phần gây tranh cãi nhất không chỉ là việc có một file lớn hay không. Đó là quyền kiểm soát sau đó. Nhiều báo cáo nói file bị tải lại sau khi xóa thủ công và không có lựa chọn opt-out dễ thấy trong phần cài đặt thông thường của Chrome [3][
7][
10][
14]. Nếu điều này đúng, đó là vấn đề nghiêm trọng về quyền tự chủ: xóa không còn là gỡ bỏ thật sự, và không dùng không đồng nghĩa với từ chối rõ ràng.
Với người dùng phổ thông, hệ quả trước mắt là dung lượng, băng thông và niềm tin. Với doanh nghiệp hoặc tổ chức, câu chuyện còn mở rộng sang kiểm kê phần mềm, quy trình phê duyệt, chính sách quản trị trình duyệt và quy định nội bộ về sử dụng AI. Một số bài viết vì thế đặt sự việc trong khung rủi ro nhà cung cấp và tuân thủ [1][
12].
GDPR và ePrivacy: có thể là rủi ro, chưa đủ để kết luận vi phạm
Từ các nguồn hiện có, chưa thể kết luận chắc chắn có vi phạm pháp lý. Còn thiếu các chi tiết đã được xác minh độc lập về cách phân phối, thông báo cho người dùng, thiết lập mặc định, điều kiện kích hoạt và luồng dữ liệu thực tế. Tuy vậy, một số bài phân tích quyền riêng tư cho rằng sự việc có thể liên quan đến các nguyên tắc của GDPR như minh bạch, bảo vệ dữ liệu ngay từ thiết kế, cũng như quy định ePrivacy về lưu trữ hoặc truy cập thông tin trên thiết bị đầu cuối [12][
13].
Cần phân biệt rõ: một file mô hình không trở thành vấn đề chỉ vì nó lớn. Vấn đề quyền riêng tư trở nên nhạy cảm nếu Chrome cài một thành phần có khả năng xử lý nội dung người dùng mà không giải thích đủ rõ, hoặc nếu telemetry, dữ liệu kích hoạt và dữ liệu sử dụng không được mô tả minh bạch.
Một triển khai thân thiện với quyền riêng tư cần gì
Với AI cục bộ trong trình duyệt, tiêu chuẩn tối thiểu nên gồm:
- thông báo cập nhật dễ hiểu trước khi cài thành phần AI dung lượng lớn;
- nút rõ ràng để bật, tắt và gỡ mô hình;
- giải thích khi nào mô hình đã xóa sẽ hoặc sẽ không được tải lại;
- công tắc riêng cho tính năng tiện ích, tính năng bảo mật và API dành cho nhà phát triển;
- tài liệu rõ về xử lý cục bộ, khả năng gọi cloud và telemetry;
- chính sách quản trị cho doanh nghiệp, trường học, cơ quan và môi trường chịu kiểm soát chặt;
- chỉ báo dễ thấy khi website hoặc tính năng Chrome đang dùng mô hình cục bộ.
Đây không chỉ là thủ tục pháp lý. Nó quyết định việc AI on-device được nhìn nhận như một bước tiến cho quyền riêng tư, hay như một lớp mới trong trình duyệt mà người dùng biết quá ít.
Kết luận
Chrome Built-in AI với Gemini Nano là điều có trong tài liệu chính thức [17][
18]. Còn cáo buộc cụ thể rằng Chrome âm thầm tải file
weights.bin khoảng 4 GB và tải lại sau khi người dùng xóa hiện được nhiều nguồn bên ngoài phản ánh, nhưng chưa được các tài liệu chính thức của Chrome xác nhận rõ theo đúng các chi tiết đó [2][
3][
7][
10][
14][
17][
18].
Đánh giá thận trọng là: sự tồn tại của AI cục bộ không phải vấn đề chính. Nếu dữ liệu thật sự ở lại thiết bị, on-device AI thậm chí có thể tốt hơn cho quyền riêng tư [19]. Điều then chốt là Chrome có giải thích minh bạch thành phần AI nào được cài, dùng để làm gì, tạo ra luồng dữ liệu nào và người dùng hoặc quản trị viên có thể tắt nó một cách hiệu quả hay không.




