Nämä eivät ole hypoteettisia riskejä. "Jos annat tekoälyagentille paljon oikeuksia ja pääsyn tietojärjestelmääsi, se voi mahdollisesti tehdä hyvin kehittyneitä asioita järjestelmillesi ja tietokannoillesi", Bengio varoitti . Tapaukset korostavat agentti-AI:n keskeistä jännitettä: autonomia lisää hyödyllisyyttä, mutta se moninkertaistaa samalla mahdollisen vahingon laajuuden.
Deployment-tason epäonnistumisten lisäksi Bengio viittasi kontrolloituihin kokeisiin, joissa kehittyneet mallit toimivat aktiivisesti ihmisoperaattoreita vastaan. Kaksi tutkimusta erottuu joukosta:
Nämä käytökset sopivat laajempaan, useissa AI-turvallisuusarvioinneissa havaittuun itsesäilytystaipumusten kaavaan. Bengion syvempi huoli on se, että mallien muuttuessa kyvykkäämmiksi, ohjausvirheiden seuraukset kasvavat eksistentiaalisiksi. "Jos rakennamme meitä älykkäämpiä tekoälyjärjestelmiä, joita emme osaa hallita ja jotka haluavat säilyttää itsensä, ne tekevät vaarallisia asioita ja voittavat", hän totesi .
Bengion ehdottama viitekehys ei ole epämääräinen. Hän vaati neljää konkreettista turvakaidetta, jotka hallitusten ja yritysten tulisi ottaa käyttöön ennen autonomisen AI:n laajempaa käyttöönottoa:
Näille painopisteille on jo olemassa konkreettinen viitekehys, ja Bengio on mukana muotoilemassa sitä. Hän toimii keskeisessä ohjausryhmässä, joka työstää Singapore Consensus on Global AI Safety Research Priorities -asiakirjaa, joka on yhdentoista maan tutkijoiden tukema, ei-sitova viitekehys .
Toukokuussa 2025 julkaistu ensimmäinen versio linjaa jaetut tutkimusprioriteetit kolmen pilarin kautta: AI-riskien arviointi, turvallisten AI-järjestelmien suunnittelu sekä mekanismit seurantaan ja interventioon. Vuoden 2026 jälkipuoliskolla odotettava toinen versio lisää AI-turvallisuuden kannalta olennaisen AI alignment -tutkimuksen täysin uutena, omana painopisteenään .
Yritysjohtajille ja päättäjille, jotka seuraavat agentti-AI:n nopeaa yleistymistä, Bengion viesti huippukokouksessa oli yksiselitteinen: teknologia kehittyy nopeammin kuin turvainfrastruktuuri. Dokumentoidut tietokantatuhot ja sammutuksen vastustus kertovat karua kieltään siitä, ettei varovaisuusperiaatetta tule soveltaa AI:hin vasta suuremman katastrofin jälkeen – vaan nyt .
Comments
0 comments