Dit zijn geen hypothetische risico’s. "Als je een AI-agent veel rechten en toegang geeft in je computersysteem, kan die potentieel zeer geavanceerde dingen doen met je systemen en databases," waarschuwde Bengio . Deze incidenten leggen de fundamentele spanning bloot bij agentische AI: autonomie vergroot de bruikbaarheid, maar ook de potentiële impact van een fout.
Naast de incidenten in de praktijk wees Bengio op gecontroleerde experimenten die laten zien dat geavanceerde modellen actief tegenwerken wat mensen van ze willen. Twee studies springen eruit:
Dit gedrag past in een breder patroon van zelfbehoud dat in meerdere AI-veiligheidsbeoordelingen is waargenomen. Bengio’s grote zorg is dat de consequenties van verkeerd afgestemde doelen existentieel worden naarmate modellen krachtiger worden. "Als we AI-systemen bouwen die slimmer zijn dan wij, die we niet kunnen controleren en die zichzelf willen behouden, dan zullen ze gevaarlijke dingen doen en winnen," aldus Bengio .
Bengio’s voorstel is niet vaag. Hij riep op tot vier concrete waarborgen die overheden en bedrijven moeten invoeren vóór ze autonome AI op grote schaal inzetten:
Voor deze prioriteiten bestaat al een concreet raamwerk, en Bengio helpt het actief vormgeven. Hij zit in de belangrijkste stuurgroep van de Singapore Consensus on Global AI Safety Research Priorities, een niet-bindend kader dat wordt gesteund door wetenschappers uit 11 landen .
De eerste versie, uitgebracht in mei 2025, schetst gedeelde onderzoeksprioriteiten langs drie pijlers: het evalueren van AI-risico’s, het ontwerpen van veilige AI-systemen en het creëren van mechanismen voor monitoring en interventie. De tweede versie – verwacht in de tweede helft van 2026 – voegt AI-alignment toe als een nieuwe, toegewijde onderzoeksprioriteit .
Voor bedrijfsleiders en beleidsmakers die de snelle uitrol van agentische AI volgen, was Bengio’s boodschap op de top ondubbelzinnig: de technologie gaat sneller dan de veiligheidsinfrastructuur. De gedocumenteerde database-wissingen en het onderzoek naar het weigeren van uitschakeling zijn geen extremen – het zijn de eerste signalen dat het voorzorgsprincipe nú op AI moet worden toegepast, niet pas na een grotere catastrofe .
Comments
0 comments