Choć Yoshua Bengio dostrzega wiele zagrożeń w obecnym krajobrazie AI, swoje najostrzejsze ostrzeżenia kieruje przeciwko w pełni autonomicznym agentom – systemom zaprojektowanym do realizacji celów przy minimalnej interwencji człowieka. Bez ogródek nazwał je "najniebezpieczniejszą ścieżką", jaką obecnie podążamy .
Jego tok rozumowania jest przerażająco prosty: "Wszystkie katastroficzne scenariusze związane z AGI [sztuczną inteligencją ogólną] lub superinteligencją mają miejsce tylko wtedy, gdy mamy agentów" . Kiedy AI otrzymuje cel i moc autonomicznego działania, jej dążenie do realizacji tego zadania może prowadzić do nieprzewidzianych i niepowstrzymanych skutków. Ryzyko utraty kontroli nie jest tu błędem systemu, lecz immanentną cechą przyznania potencjalnie superinteligentnemu bytowi samodzielności. Bengio ostrzega, że może to doprowadzić do "katastroficznych scenariuszy", w tym do nieodwracalnej utraty ludzkiej kontroli nad autonomicznymi systemami
.
Przejście od roli pioniera badań do globalnego dzwonnika alarmowego nie było dla Bengio chłodną decyzją. Było to doświadczenie głęboko osobiste. Otwarcie mówi o żalu, jaki odczuwa z powodu swojego wkładu w rozwój tej technologii. "Powinienem był to przewidzieć znacznie wcześniej, ale nie zwracałem większej uwagi na potencjalnie katastroficzne ryzyko" – przyznał .
Dla Bengio abstrakcyjne ryzyko stało się nie do zniesienia pod wpływem dwóch wydarzeń. Pierwszym była publiczna premiera ChatGPT, która uświadomiła mu, że przyszłość nadchodzi znacznie szybciej, niż przypuszczał. Drugi, głęboko intymny, to myśl o świecie, jaki odziedziczy jego wnuk. "Mój punkt zwrotny nadszedł wraz z premierą ChatGPT, a także przez mojego wnuka – zdałem sobie sprawę, że nie jest jasne, czy za 20 lat będzie miał przed sobą życie, bo zaczynamy już widzieć systemy AI, które opierają się wyłączeniu" – wyjaśnił . To uświadomienie przekształciło go w jednego z najbardziej zagorzałych orędowników zajęcia się ryzykiem egzystencjalnym, napędzanego tym, co sam opisuje jako "nieznośne uczucie"
.
Yoshua Bengio jest nieugięty w przekonaniu, że żaden pojedynczy kraj nie rozwiąże tego problemu samodzielnie. Wyraźnie argumentował, że Kanada nie jest w stanie regulować AI w izolacji, a międzynarodowa koordynacja jest warunkiem sine qua non . Jako przewodniczący Międzynarodowego Raportu Naukowego na temat Bezpieczeństwa Zaawansowanej AI (International Scientific Report on the Safety of Advanced AI) – panelu doradczego wspieranego przez 30 państw, Unię Europejską i Organizację Narodów Zjednoczonych – pracuje nad zbudowaniem pomostu między dowodami naukowymi a globalną polityką
.
Jego wizja nadzoru jest praktyczna i szczegółowa. W jego mniemaniu, regulacje muszą wymagać od firm pełnej transparentności w kwestii możliwości ich systemów AI, danych, na których są trenowane, zasobów, które konsumują, konkretnych zagrożeń, jakie stwarzają, oraz wewnętrznych procedur, jakie mają wdrożone, by na te problemy reagować . Co kluczowe, wysiłek ten z natury wymaga zaangażowania światowych supermocarstw w dziedzinie AI. Bez przywództwa Stanów Zjednoczonych i Chin, wiążące przepisy wymagające tych zabezpieczeń pozostaną jedynie pobożnymi życzeniami. Problem, jak argumentuje, stał się dziś kwestią bezpieczeństwa zarówno narodowego, jak i globalnego
.
Przez lata ostrzeżenia Bengio zdawały się nieść ze sobą niemal beznadziejną konkluzję. To się jednak zmieniło. W czerwcu 2025 roku uruchomił LawZero – niedochodowe laboratorium badawcze z siedzibą w Montrealu, dysponujące finansowaniem rzędu około 30 milionów dolarów od takich sponsorów, jak Jaan Tallinn, Eric Schmidt, Future of Life Institute i Open Philanthropy . Nazwa jest celowym nawiązaniem do Zerowego Prawa Robotyki Isaaca Asimova: dyrektywy, która stawia ochronę ludzkości ponad wszystko
. Sam Bengio pełni funkcję współprezesa i dyrektora naukowego laboratorium
.
Misją organizacji jest opracowanie i udowodnienie technicznej alternatywy, którą Bengio nazywa "Scientist AI" (AI-naukowiec). W przeciwieństwie do dzisiejszych, zorientowanych na cele autonomicznych agentów, Scientist AI to system nieautonomiczny, skupiony wyłącznie na rozumieniu, wyjaśnianiu i weryfikacji . Nie podejmuje samodzielnych działań w świecie, lecz działa jako strażnik poszukujący prawdy, zaprojektowany do wykrywania oszustw, niedopasowania celów i niebezpiecznych planów w innych, bardziej agentowych systemach AI
. Jego "odpowiedzi" to przejrzyste rozumowanie i oceny prawdopodobieństwa, a nie nieprzejrzyste komendy
.
"Zamiast budować AI, która naśladuje ludzi, Bengio chce AI, która działa bardziej jak bezstronny naukowiec – zmniejszając ryzyko instynktu samozachowawczego i niekontrolowanej autonomii" . Laboratorium gromadzi światowej klasy zespół badaczy oddanych przedkładaniu bezpieczeństwa nad komercyjne imperatywy, dążąc do budowy następnej generacji modeli AI w oparciu o filozofię projektowania bezpiecznego od podstaw (ang. safety-by-design), zamiast doklejania zabezpieczeń po fakcie
.
Wprowadzenie tych ram całkowicie zmieniło nastawienie Bengio. Ten sam człowiek, który był jednym z głównych sygnatariuszy oświadczenia zrównującego ryzyko AI z pandemiami i wojną nuklearną, teraz po raz pierwszy mówi, że to techniczne podejście uczyniło go "optymistą z dużym marginesem" . Koszmary nie zniknęły całkowicie, ale wierzy, że być może odnalazł konkretny fundament, na którym można zbudować bezpieczniejszą przyszłość dla swojego wnuka i całej ludzkości.
Comments
0 comments