C2PA (Coalition for Content Provenance and Authenticity) là một tiêu chuẩn mở dùng để ghi lại thông tin về cách một nội dung số được tạo hoặc chỉnh sửa. Thông tin này được lưu dưới dạng metadata gắn với tệp media và có thể cho biết liệu hình ảnh có được tạo bởi AI hay không.
Nhờ cơ chế ký số và "provenance manifest", các công cụ tương thích có thể kiểm tra lịch sử của tệp — ví dụ: nội dung được tạo khi nào, bởi công cụ nào, và đã trải qua chỉnh sửa nào.
Tiêu chuẩn này đang được nhiều bên trong ngành áp dụng, từ nhà phát triển AI, hãng máy ảnh cho đến các tòa soạn và công ty phần mềm, nhằm tăng tính minh bạch cho nội dung số.
Dù hữu ích, metadata có một nhược điểm lớn: rất dễ bị mất hoặc bị loại bỏ.
Khi ảnh được chia sẻ trên internet, các thao tác phổ biến như tải xuống, chụp màn hình, chỉnh sửa, nén file hoặc đăng lại lên nền tảng khác thường làm mất metadata của tệp.
Khi đó, tín hiệu về nguồn gốc ban đầu cũng biến mất. Đây là lý do OpenAI quyết định bổ sung thêm một lớp nhận diện thứ hai.
SynthID là công nghệ watermark vô hình do Google DeepMind phát triển. Công nghệ này nhúng một tín hiệu đặc biệt trực tiếp vào pixel của ảnh.
Khác với metadata nằm ngoài dữ liệu hình ảnh, SynthID thay đổi cấu trúc pixel theo cách con người không thể nhìn thấy nhưng các công cụ xác minh có thể phát hiện.
Do watermark nằm trong chính dữ liệu hình ảnh, nó có thể tồn tại ngay cả khi ảnh bị:
Khi kết hợp C2PA với watermark ở cấp độ pixel, OpenAI tạo ra một hệ thống xác minh dự phòng: nếu một tín hiệu biến mất, tín hiệu còn lại vẫn có thể được phát hiện.
Song song với các tín hiệu truy vết, OpenAI cũng đang giới thiệu bản xem trước của công cụ kiểm tra công khai mang tên “Verify”.
Người dùng có thể tải một hình ảnh lên công cụ này để kiểm tra xem nó có được tạo bởi hệ thống của OpenAI hay không, bao gồm:
Quá trình xác minh dựa trên việc phát hiện các tín hiệu như metadata C2PA hoặc watermark SynthID trong ảnh.
Tuy vậy, công cụ này cũng có giới hạn. Một số báo cáo cho biết nó có thể không nhận diện chính xác những hình ảnh đã bị chỉnh sửa mạnh hoặc đã bị loại bỏ các tín hiệu nhận diện.
Internet hiện đã tràn ngập nội dung tổng hợp bằng AI. Khi các mô hình ngày càng tạo ra hình ảnh chân thực hơn, người xem sẽ càng khó phân biệt đâu là ảnh thật và đâu là ảnh do AI tạo ra.
Sáng kiến truy vết của OpenAI nhằm giúp giảm bớt sự mơ hồ này bằng cách cung cấp các tín hiệu nhận diện rõ ràng. Nếu được áp dụng rộng rãi, nó có thể giúp:
Các tín hiệu này không thể loại bỏ hoàn toàn ảnh giả — đặc biệt khi nhiều công cụ AI khác không áp dụng tiêu chuẩn truy vết — nhưng chúng giúp tăng tính minh bạch đối với nội dung được tạo bởi hệ thống OpenAI.
Động thái của OpenAI phản ánh xu hướng lớn hơn trong ngành công nghệ và truyền thông: xây dựng hệ thống truy vết nội dung chuẩn hóa cho kỷ nguyên AI.
Thay vì dựa vào một kỹ thuật duy nhất, các công ty đang kết hợp nhiều phương pháp như metadata, watermark và công cụ xác minh để theo dõi nguồn gốc của nội dung số.
Comments
0 comments