Cốt lõi của lập luận mà Amnesty đưa ra là các đường ống dữ liệu nuôi sống những mô hình AI này thực chất là một hình thức giám sát hàng loạt. Báo cáo mô tả cách các công ty công nghệ sử dụng các công cụ tự động để "trích xuất kho dữ liệu trực tuyến khổng lồ—bao gồm hình ảnh, hoạt động trên mạng xã hội và các thông tin cá nhân khác—mà không có sự đồng ý rõ ràng của cá nhân" . Bởi vì hành vi trích xuất không có sự đồng thuận này được 'nhúng' vào kiến trúc cơ bản của các hệ thống, báo cáo gắn cho chúng cái mác "vi phạm pháp luật ngay từ thiết kế" (unlawful by design)
.
Amnesty đặt sự ngang hàng giữa việc thu hoạch dữ liệu tự động này với các hệ thống giám sát hàng loạt cấp nhà nước, lập luận rằng nó vi phạm quyền riêng tư ngay từ bước phát triển đầu tiên . Báo cáo nêu đích danh một số mô hình và công cụ công khai phổ biến trong nghiên cứu của mình, bao gồm GPT-3, Gemini, Llama, và những cái tên khác như DeepSeek, Midjourney, và Stable Diffusion
.
Để ủng hộ lời kêu gọi cấm đoán thay vì một cách tiếp cận quản lý dựa trên rủi ro, báo cáo nhấn mạnh ba nhóm tác hại riêng biệt nhưng có mối liên hệ chặt chẽ với nhau.
Tác hại đầu tiên và cũng là nền tảng chính là sự vi phạm quyền riêng tư. Báo cáo nêu chi tiết cách các bộ dữ liệu được xây dựng từ hàng tỷ bài đăng, bức ảnh và cuộc trò chuyện công khai mà không hề có sự cho phép. Đây không phải là một sự rò rỉ hay vi phạm dữ liệu; đó là phương pháp có chủ đích và mang tính cấu trúc để tạo ra AI. Amnesty lập luận rằng sự "lạm dụng quyền riêng tư" này là điểm khởi đầu, khiến toàn bộ quy trình phát triển trở nên bất hợp pháp theo các tiêu chuẩn nhân quyền .
Nhóm tác hại thứ hai bắt nguồn trực tiếp từ chính dữ liệu. Bởi vì tài liệu huấn luyện được thu thập một cách bừa bãi từ internet mở, nó đã bị "ô nhiễm bởi những định kiến trong thế giới thực". Amnesty cảnh báo rằng những định kiến này không được AI trung hòa; thay vào đó, chúng bị "khuếch đại trong các đầu ra của mô hình theo các khía cạnh chủng tộc, giới tính và văn hóa" . Báo cáo bày tỏ mối quan ngại đặc biệt đối với các cộng đồng bị gạt ra ngoài lề lịch sử, những người phải hứng chịu gánh nặng của sự phân biệt đối xử có tính hệ thống này khi các định kiến độc hại và các liên kết đầy thành kiến được tự động hóa và nhân rộng ở quy mô lớn
.
Nhóm tác hại cuối cùng chuyển trọng tâm từ thế giới số sang thế giới thực. Báo cáo đã ghi lại cái giá sinh thái đáng kể của việc xây dựng và vận hành các hệ thống này, chỉ ra "các trung tâm dữ liệu khổng lồ và mức tiêu thụ năng lượng cần thiết" . Tác động môi trường này, báo cáo lập luận, là một hậu quả nhân quyền bổ sung và thường bị bỏ qua trong cuộc đua AI không có sự kiểm soát.
Kết luận của Tổ chức Ân xá Quốc tế thật sự rất thẳng thắn. Tổ chức này nhận thấy rằng các hệ thống AI tạo sinh độc lập, phụ thuộc vào các đường ống thu thập dữ liệu web trái phép này, là "mâu thuẫn với IHRL" . Tổ chức này lập luận rằng các mô hình quản lý hiện tại, như khuôn khổ dựa trên rủi ro của Đạo luật AI của EU, là không đủ
. Thay vào đó, họ kêu gọi các chính phủ can thiệp bằng một "lệnh cấm hoàn toàn" đối với các hệ thống được xây dựng bằng các phương pháp này, coi toàn bộ hoạt động này là một cuộc khủng hoảng nhân quyền không thể chỉ đơn thuần được quản lý
.
Comments
0 comments