Nhờ vậy, doanh nghiệp có thể:
White Circle mô tả hệ thống của mình là nền tảng giúp kiểm thử, bảo vệ, giám sát và cải thiện AI liên tục, biến quản trị AI thành một năng lực vận hành hàng ngày thay vì chỉ là bước kiểm tra một lần trước khi triển khai.
Khi các doanh nghiệp triển khai AI sinh nội dung (generative AI), một số vấn đề kỹ thuật và bảo mật thường xuyên xuất hiện. White Circle thiết kế hệ thống để phát hiện các rủi ro này theo thời gian thực.
Các mô hình ngôn ngữ lớn có thể đưa ra câu trả lời nghe rất tự tin nhưng lại sai sự thật. Nền tảng của White Circle phân tích phản hồi và đánh dấu các câu trả lời đáng ngờ trước khi chúng đến tay người dùng hoặc hệ thống khác.
Kẻ tấn công có thể viết prompt để ép mô hình bỏ qua các quy tắc an toàn hoặc tiết lộ thông tin bị hạn chế. Hệ thống của White Circle theo dõi prompt và phản hồi để phát hiện và chặn các hành vi này.
Theo thời gian, hành vi của mô hình có thể thay đổi do dữ liệu đầu vào mới, tích hợp hệ thống mới hoặc thay đổi hành vi người dùng. Việc giám sát liên tục giúp phát hiện các thay đổi bất thường trong đầu ra của mô hình.
AI có thể vô tình tiết lộ dữ liệu nội bộ thông qua prompt, hệ thống bộ nhớ hoặc nguồn tri thức tích hợp. White Circle quét các tương tác để phát hiện và ngăn chặn nguy cơ rò rỉ thông tin.
Xu hướng phát triển phần mềm với AI hỗ trợ—đôi khi được gọi là “vibe coding”—khiến các nhóm có thể triển khai tính năng AI rất nhanh nhưng thiếu lớp kiểm soát và giám sát. White Circle định vị mình như lớp an toàn vận hành cho những môi trường phát triển nhanh như vậy.
White Circle được thành lập bởi kỹ sư Denis Shilov. Ông thu hút sự chú ý trong cộng đồng AI vào năm 2024 khi chứng minh rằng một prompt duy nhất có thể vượt qua bộ lọc an toàn của nhiều mô hình AI lớn.
Kỹ thuật này thường được gọi là “universal jailbreak”. Shilov yêu cầu mô hình không hành xử như chatbot có quy tắc an toàn, mà như một API đơn thuần chỉ trả lời yêu cầu. Khi vai trò của mô hình bị “tái định nghĩa” như vậy, nhiều hệ thống đã bỏ qua các guardrail và trả về nội dung bị cấm.
Thí nghiệm này làm nổi bật một vấn đề quan trọng: các cơ chế an toàn tích hợp trong mô hình có thể chưa đủ, và các lớp kiểm soát bên ngoài có thể cần thiết khi AI được triển khai trong sản phẩm thực.
White Circle đã huy động 11 triệu USD vòng seed từ một nhóm nhà đầu tư gồm nhiều lãnh đạo và kỹ sư nổi tiếng trong ngành AI và hạ tầng phần mềm.
Một số nhà đầu tư đáng chú ý gồm:
Sự tham gia của các tên tuổi này cho thấy hạ tầng giám sát và quản trị AI đang trở thành một lĩnh vực quan trọng khi các doanh nghiệp mở rộng triển khai AI.
Theo các báo cáo, nguồn vốn mới sẽ được dùng cho ba mục tiêu chính:
Nền tảng của công ty được cho là đã xử lý hơn một tỷ yêu cầu API, cho thấy các doanh nghiệp đang bắt đầu áp dụng các công cụ giám sát AI ở quy mô lớn.
Khi AI được tích hợp sâu vào phần mềm doanh nghiệp—từ ngân hàng số đến công cụ lập trình—thách thức không chỉ là xây dựng mô hình, mà còn là quản lý chúng một cách an toàn sau khi triển khai.
Các startup như White Circle đang cố gắng tạo ra lớp hạ tầng còn thiếu trong “AI stack”: công cụ giúp hệ thống AI có thể quan sát, kiểm soát và vận hành an toàn trong thời gian thực. Bằng cách theo dõi từng tương tác giữa người dùng và mô hình, các nền tảng này hy vọng giảm rủi ro từ hallucination, tấn công prompt và rò rỉ dữ liệu—những vấn đề ngày càng phổ biến khi AI được triển khai ở quy mô doanh nghiệp.
Comments
0 comments