Rajoitukset eivät rajoitu vain kyberturvallisuuteen. Suojukset kohdistuvat myös biologiaa, kemiaa ja, kriittisesti, tekoälymallien ”tislausta” koskeviin kyselyihin. Tämä viimeinen kohta on synnyttänyt oman vastalausemyrskynsä, ja jotkut kehittäjät syyttävät Anthropicia siitä, että se käyttää ”turvallisuutta” verukkeena kilpailua rajoittavalle toiminnalle estämällä muita tekoälyn kehittäjiä käyttämästä Fable 5:n tuotoksia koulutukseen .
Anthropicin turvajärjestelmä Fable 5:ssä ei ole yksinkertainen kieltomekanismi. Se on reititysjärjestelmä, joka on suunniteltu epäonnistumaan hiljaa . Arkkitehtuuri toimii kolmessa vaiheessa:
Anthropicin mukaan nämä luokittelijat laukeavat keskimäärin alle 5 prosentissa kaikista istunnoista . Yhtiö on julkisesti myöntänyt ylilyöntien ongelman. Anthropicin edustaja kertoi Business Insiderille, että turvatoimet ”saattavat liputtaa turvallista, neutraalia tai harmitonta sisältöä”, mutta perusteli tätä kompromissina, jotta näin kyvykäs malli voitaisiin ylipäätään julkaista julkisesti
.
Anthropicin kanta on, että konservatiiviset suojukset ovat tietoinen ja vastuullinen valinta, eivät virhe. Yhtiö väittää, että taustalla oleva Mythos-luokan malli on niin taitava esimerkiksi ohjelmistohaavoittuvuuksien löytämisessä ja hyödyntämisessä, että sen rajoittamaton julkinen julkaisu aiheuttaisi liian suuren katastrofaalisen väärinkäytön riskin .
Suojukset ovat heidän mukaansa suunnittelukompromissi – tapa tarjota yleisölle huipputason päättely-, koodaus- ja kirjoitusmalli, samalla kun sen vaarallisimmat potentiaaliset kyvyt eristetään hiekkalaatikkoon . He näkevät ylilyönnit väliaikaisena hintana siitä, että tehokas malli voidaan julkaista ”sekä turvallisesti että nopeasti”, ja lupaavat hienosäätää luokittelijoita ajan myötä
.
Claude Fable 5:n julkaisua ei voi täysin ymmärtää yksittäisenä tapauksena. Se on toinen puoli kaksitasoisesta julkaisustrategiasta, josta on tulossa uusi alan standardi huipputekoälymalleille .
Samana päivänä kun Fable 5 julkaistiin, Anthropic julkisti myös Claude Mythos 5:n. Molemmat mallit jakavat täsmälleen saman perusarkkitehtuurin ja painokertoimet – ne ovat sama ”aivot”. Ainoa ero on turvallisuusasetuksissa. Mythos 5:stä on poistettu luokittelijat arkaluonteisilla osa-alueilla, mikä antaa sille sen täydet, rajoittamattomat kyvyt .
Mythos 5 ei kuitenkaan ole tarkoitettu suurelle yleisölle. Se on rajoitettu pienelle joukolle tarkastettuja kumppaneita, mukaan lukien valtion virastoja ja kriittisen infrastruktuurin toimijoita, Project Glasswing -nimisen aloitteen kautta . Tämä Yhdysvaltain hallituksen tukema ohjelma käynnistettiin alun perin 12 perustajakumppanin voimin, ja siihen kuuluu teknologiajästejä, kuten AWS, Google ja Microsoft. Tarkoituksena on antaa ”kyberpuolustajien” käyttää tekoälyä haavoittuvuuksien laajamittaiseen löytämiseen ja paikkaamiseen
. Mythos 5:n myötä pääsyä laajennettiin noin 40 organisaatioon
.
Alla oleva taulukko havainnollistaa perustavanlaatuisen kahtiajaon:
Anthropicin Fable/Mythos-jako on selkein esimerkki siitä, mitä voidaan kutsua tekoälyn kyvykkyysperusteiseksi porrastetuksi käyttöönotoksi. Tässä uudessa mallissa yksittäinen huipputekoäly ei ole yksi tuote. Sen täysi voima on etuoikeus, ei itsestäänselvyys, ja turvasuojukset ovat mekanismi, joka luo tuote-eroavaisuuden .
Tämä käytäntö ei ole vain Anthropicin yksinoikeus. Myös muut johtavat tekoäly-yritykset, kuten OpenAI, ovat omaksuneet samankaltaisia lähestymistapoja tarjoamalla rajoitetun pääsyn versioihin edistyneimmistä malleistaan kansallisen turvallisuuden ja tutkimuskumppaneiden käyttöön . Fable/Mythos-julkistus kiteyttää tulevaisuuden, jossa tekoälyn tehokkaimmat kyvyt on aidattu pois ei teknologian, vaan tarkastusstatuksen perusteella. Tässä mallissa turvallisuusprotokollat toimivat samalla pääsynhallintamekanismeina – lähestymistapa, joka herättää jo nyt laajempaa keskustelua keskittämisestä, oikeudenmukaisuudesta ja ”julkisen” tekoälyturvallisuuden todellisesta merkityksestä.
Comments
0 comments