OpenAI đang áp dụng tiêu chuẩn C2PA – Coalition for Content Provenance and Authenticity, một chuẩn kỹ thuật mở cho phép gắn metadata có thể xác minh bằng mật mã vào file media.
Đối với ảnh do AI tạo ra, metadata này có thể bao gồm:
Điểm đáng chú ý là C2PA không chỉ dành cho AI. Các hãng sản xuất máy ảnh, tổ chức báo chí và phần mềm chỉnh sửa cũng có thể áp dụng tiêu chuẩn này để xác nhận nguồn gốc nội dung. Điều này giúp hình thành một hệ sinh thái rộng hơn để kiểm chứng tính xác thực của hình ảnh.
Tuy nhiên, metadata có một hạn chế lớn: nó có thể bị mất khá dễ dàng. Khi ảnh bị chụp màn hình, nén lại, chỉnh sửa bằng phần mềm không giữ metadata hoặc tải lại lên nền tảng không hỗ trợ, dữ liệu nguồn gốc có thể biến mất.
Để tăng khả năng nhận diện, OpenAI hợp tác với Google DeepMind để thêm SynthID, một watermark vô hình được nhúng trực tiếp vào pixel của ảnh.
Khác với metadata nằm ngoài nội dung file, SynthID hoạt động bằng cách mã hóa một tín hiệu rất nhỏ bên trong chính hình ảnh. Các công cụ chuyên dụng có thể phát hiện tín hiệu này sau đó.
Ưu điểm của phương pháp này gồm:
Theo nghiên cứu về hệ thống này, công nghệ SynthID đã được dùng để watermark hàng tỷ hình ảnh và khung video trên các dịch vụ của Google.
Dù vậy, watermark cũng không hoàn hảo. Việc chỉnh sửa mạnh, cắt ảnh, biến đổi hoặc các nỗ lực cố tình loại bỏ tín hiệu có thể làm giảm khả năng phát hiện, và watermark chỉ tồn tại trong những ảnh được tạo bởi hệ thống có chủ động thêm nó.
Hai phương pháp này giải quyết các vấn đề khác nhau khi truy vết nguồn gốc hình ảnh.
Metadata (C2PA)
Watermark vô hình (SynthID)
Chính vì vậy OpenAI kết hợp cả hai: metadata để cung cấp bối cảnh rõ ràng, còn watermark để tăng độ bền khi nội dung được lan truyền.
OpenAI cũng đang thử nghiệm một công cụ xác minh công khai cho phép người dùng tải ảnh lên để kiểm tra các dấu hiệu nguồn gốc.
Công cụ này sẽ phân tích:
Nếu phát hiện một trong hai tín hiệu, hệ thống có thể cho biết ảnh có khả năng được tạo từ các mô hình hình ảnh của OpenAI, chẳng hạn như những mô hình dùng trong ChatGPT hoặc API.
Điều quan trọng là: việc không tìm thấy tín hiệu không có nghĩa ảnh chắc chắn do con người tạo ra. Metadata có thể đã bị xóa, hoặc ảnh có thể đến từ hệ thống AI khác không dùng những phương pháp này.
Khi AI tạo sinh phát triển nhanh, việc tạo ra hình ảnh chân thực chưa từng dễ dàng như hiện nay. Vì vậy, nhiều công ty công nghệ đang chuyển hướng từ việc cố gắng “phát hiện AI tuyệt đối” sang cung cấp ngữ cảnh về nguồn gốc nội dung.
Chiến lược của OpenAI — kết hợp chuẩn mở, watermark và công cụ kiểm tra — là một phần của nỗ lực rộng hơn nhằm giúp nền tảng, nhà báo và người dùng thường ngày hiểu rõ hơn về nguồn gốc hình ảnh trên internet.
Điểm mấu chốt: trong tương lai gần, việc xác định nội dung do AI tạo ra sẽ dựa vào nhiều tín hiệu và sự hợp tác trong toàn ngành, chứ không phải một phép kiểm tra duy nhất.
Comments
0 comments