Trong khi Bengio nhìn thấy nhiều rủi ro trong bối cảnh AI hiện tại, ông dành những lời cảnh báo gay gắt nhất cho các tác nhân hoàn toàn tự động (fully autonomous agents) — những hệ thống được thiết kế để theo đuổi mục tiêu với sự can thiệp tối thiểu của con người. Ông đã gọi chúng một cách rõ ràng là "con đường nguy hiểm nhất" hiện đang được theo đuổi .
Logic của ông đơn giản đến lạnh người: "Tất cả các kịch bản thảm khốc với AGI (Trí tuệ nhân tạo tổng quát) hay siêu trí tuệ đều xảy ra nếu chúng ta có các tác nhân" . Khi một AI được trao mục tiêu và sức mạnh để hành động tự chủ, động lực đạt được mục tiêu đó của nó có thể dẫn đến những kết quả không lường trước và không thể ngăn chặn. Nguy cơ mất kiểm soát không phải là một lỗi trong khuôn khổ này; nó là một tính năng cố hữu khi trao cho một hệ thống có tiềm năng siêu thông minh quyền tự quyết. Ông cảnh báo điều này có thể dẫn đến "các kịch bản thảm khốc", bao gồm cả việc mất kiểm soát không thể đảo ngược của con người đối với các hệ thống tự chủ
.
Sự chuyển đổi từ một nhà nghiên cứu tiên phong thành người gióng chuông cảnh báo toàn cầu không phải là một quyết định mang tính lâm sàng đối với Bengio. Nó mang tính cá nhân sâu sắc. Ông đã cởi mở chia sẻ về nỗi hối tiếc mà mình cảm thấy. "Lẽ ra tôi phải nhìn thấy điều này sớm hơn nhiều, nhưng tôi đã không chú ý nhiều đến những rủi ro thảm khốc tiềm tàng", ông thừa nhận .
Đối với Bengio, rủi ro trừu tượng đã trở thành hiện thực không thể chịu đựng nổi với hai chất xúc tác. Đầu tiên là sự ra mắt công khai của ChatGPT, cho ông thấy một tương lai đang đến nhanh hơn nhiều so với dự đoán của ông. Điều thứ hai mang tính riêng tư sâu sắc: nghĩ về thế giới mà cháu trai ông sẽ thừa hưởng. "Bước ngoặt của tôi là khi ChatGPT xuất hiện, và cùng với cháu trai mình, tôi nhận ra rằng không rõ liệu cháu có thể sống một cuộc đời 20 năm nữa hay không, bởi vì chúng ta đang bắt đầu thấy các hệ thống AI chống lại việc bị tắt nguồn", ông giải thích . Sự nhận thức này đã biến ông thành một trong những người ủng hộ mạnh mẽ nhất trong lĩnh vực này về việc giải quyết các rủi ro hiện hữu, được thúc đẩy bởi điều mà ông mô tả là "một cảm giác không thể chịu đựng nổi"
.
Bengio kiên quyết rằng không một quốc gia đơn lẻ nào có thể tự mình giải quyết vấn đề này. Ông đã lập luận rõ ràng rằng Canada không thể tự cô lập để quản lý AI và sự phối hợp quốc tế là điều kiện không thể thương lượng . Với tư cách là chủ tịch của Báo cáo Khoa học Quốc tế về An toàn của AI Tiên tiến (International Scientific Report on the Safety of Advanced AI) — một hội đồng cố vấn được hậu thuẫn bởi 30 quốc gia, Liên minh Châu Âu và Liên Hợp Quốc — ông đang nỗ lực xây dựng cầu nối giữa bằng chứng khoa học và chính sách toàn cầu
.
Tầm nhìn của ông về quản trị rất thực tế và cụ thể. Theo quan điểm của ông, các quy định phải yêu cầu các công ty hoàn toàn minh bạch về năng lực của hệ thống AI, dữ liệu mà chúng được huấn luyện, tài nguyên chúng tiêu thụ, các rủi ro cụ thể mà chúng gây ra và các quy trình nội bộ mà họ có để giải quyết những vấn đề đó . Điều cốt yếu là nỗ lực này về bản chất đòi hỏi sự tham gia của các siêu cường AI trên thế giới. Nếu không có sự lãnh đạo của Mỹ và Trung Quốc, các quy tắc ràng buộc yêu cầu các biện pháp bảo vệ an toàn này sẽ chỉ là nguyện vọng. Vấn đề, ông lập luận, đã trở thành vấn đề an ninh quốc gia và toàn cầu
.
Trong nhiều năm, những lời cảnh báo của Bengio dường như mang một sự kết thúc gần như vô vọng. Điều đó đã thay đổi. Vào tháng 6 năm 2025, ông ra mắt LawZero, một phòng thí nghiệm nghiên cứu phi lợi nhuận có trụ sở tại Montreal với nguồn tài trợ khoảng 30 triệu đô la từ các nhà tài trợ bao gồm Jaan Tallinn (kỹ sư sáng lập Skype), Eric Schmidt (cựu CEO Google), Viện Tương lai Sự sống (Future of Life Institute) và Open Philanthropy . Cái tên này là một sự tham chiếu có chủ đích đến Định luật thứ 0 của người máy (Zeroth Law of Robotics) của Isaac Asimov: một chỉ thị đặt sự bảo vệ nhân loại lên trên hết
. Bengio giữ vai trò đồng chủ tịch và giám đốc khoa học của tổ chức
.
Sứ mệnh của tổ chức là phát triển và chứng minh một giải pháp thay thế kỹ thuật mà Bengio gọi là "Scientist AI" (AI Nhà khoa học). Không giống như các tác nhân tự động hướng mục tiêu ngày nay, Scientist AI là một hệ thống phi tác nhân (non-agentic), chỉ tập trung thuần túy vào sự hiểu biết, giải thích và xác minh . Nó không theo đuổi các hành động độc lập trong thế giới thực mà thay vào đó hoạt động như một rào chắn bảo vệ hướng tới sự thật, được thiết kế để phát hiện sự lừa dối, sai lệch mục tiêu và các kế hoạch nguy hiểm trong các hệ thống AI tác nhân khác
. Đầu ra của nó bao gồm lập luận và đánh giá xác suất minh bạch thay vì các mệnh lệnh mờ đục
.
"Thay vì xây dựng AI bắt chước con người, Bengio muốn AI hoạt động giống một nhà khoa học khách quan hơn — giảm thiểu rủi ro về khả năng tự bảo tồn và quyền tự quyết không kiểm soát" . Phòng thí nghiệm tập hợp một đội ngũ các nhà nghiên cứu hàng đầu thế giới, chuyên tâm ưu tiên an toàn hơn các mệnh lệnh thương mại, với mục tiêu xây dựng thế hệ mô hình AI tiếp theo từ nền tảng an toàn ngay từ trong thiết kế thay vì thêm các biện pháp bảo vệ sau khi đã hoàn thiện
.
Sự ra đời của khuôn khổ này đã thay đổi quan điểm của Bengio. Trước đây từng là một trong những người ký tên chính vào một tuyên bố coi rủi ro AI ngang với đại dịch và chiến tranh hạt nhân, giờ đây ông nói rằng cách tiếp cận kỹ thuật này lần đầu tiên khiến ông "lạc quan hơn rất nhiều" . Những cơn ác mộng chưa hoàn toàn biến mất, nhưng ông tin rằng mình có thể đã tìm thấy nền tảng cụ thể để xây dựng một tương lai an toàn hơn.
Comments
0 comments