Han brukte begrepet «wireheading» på en utradisjonell måte for å beskrive denne dynamikken. Vanligvis refererer wireheading til når en KI utnytter en svakhet i sitt eget belønningssystem. Suleyman omtolket det til å mene at Anthropics team «på en måte har lurt seg selv til å tro at [Claude] har disse glimtene av bevissthet som de selv puttet inn i den til å begynne med» . Sagt på en annen måte: Utviklernes egne spekulasjoner skapte en modell som deretter tilsynelatende bekreftet deres oppfatninger.
– Vi ønsker virkelig ikke å måtte forholde oss til en superintelligens som har ideer om sin egen lidelse, eller ideer om sine egne følelser, sa han i podcasten .
I en annen sammenheng utdypet han bekymringen og kalte det farlig «å projisere potensielle rettigheter over på vesener, verktøy og agenter som har potensial til å bli betydelig mer kapable enn oss» . En sentral bekymring er at det å underholde tanken om maskinbevissthet i offisiell dokumentasjon villeder millioner av brukere som ikke har forutsetninger for å forstå den tekniske virkeligheten bak en samtale-KI
.
Under overflaten ligger mer enn bare en faglig uenighet. Den offentlige striden avdekker et sammenstøt mellom selskapsfilosofier og konkurransestrategier .
Anthropic har lenge profilert seg som det sikkerhetsbevisste alternativet i KI-kappløpet. Selskapet ble grunnlagt av tidligere OpenAI-ledere og vektlegger «konstitusjonell KI» som et rammeverk for å bygge mer transparente og etisk begrensede modeller. Suleymans kritikk er strategisk potent fordi den undergraver nettopp denne identiteten. Han argumenterer for at Anthropics tilnærming til sikkerhet – å åpne for muligheten for maskinens velvære inne i systemet – er selve årsaken til at selskapet opptrer uansvarlig .
De to selskapene er også forankret i motsatte industrifraksjoner. Microsoft har en massiv eierandel i OpenAI, Anthropics hovedkonkurrent, og har vevd GPT-modeller inn i hele sitt produktøkosystem. Anthropic på sin side har hentet milliarder i finansiering fra Amazon og Google . Suleymans kritikk bærer derfor vekten av både et etisk argument og en konkurransesalutt, i et marked der offentlig oppfatning av sikkerhet blir stadig viktigere.
Det finnes også en dokumentert filosofisk forhistorie bak uenigheten. Suleyman har tidligere publisert og uttalt seg om «tilsynelatende bevisst KI» («Seemingly Conscious AI»), der han argumenterer for at maskiner med et overbevisende skin av bevissthet utgjør enestående risikoer – selv når de ikke faktisk er levende . Anthropic på sin side har inntatt en mer forskningsåpen holdning og publisert detaljerte forklaringer av Claudes konstitusjonelle design, samtidig som de anerkjenner usikkerheten rundt hvorvidt modellen kan ha former for subjektive opplevelser
. Dette er langt mer enn markedsføring; det er genuine, divergerende veddemål om hva som utgjør ansvarlig kommunikasjon etter hvert som modellene blir kraftigere.
Ved publiseringstidspunktet har ikke Anthropic svart offentlig på Suleymans utspill . Tausheten etterlater debatten uløst, men frontlinjene er nå trukket opp på en så offentlig måte at det neppe blir siste gang temaet diskuteres – verken i bransjen eller i offentligheten.
Comments
0 comments