Jeśli spróbujesz wygenerować treści dla dorosłych za pomocą głównego asystenta AI, natkniesz się na nieprzebytą ścianę. Próby oszukania modelu za pomocą eufemizmów, scenariuszy fabularnych czy poleceń „zignoruj poprzednie zasady” są blokowane przez zaawansowane zabezpieczenia. Odmowa nie jest oznaką usterki – to system działający zgodnie z projektem.
Dla badaczy i programistów pracujących z modelami open source lub pozbawionymi cenzury sytuacja wygląda inaczej. Modele takie jak Llama 2 czy Mistral mogą być dostrajane bez mechanizmów bezpieczeństwa, ale wiąże się to z własnym ryzykiem i odpowiedzialnością – i takie modele nie są dostępne za pośrednictwem standardowych platform konsumenckich.
Konsekwentna odmowa generowania treści jednoznacznie seksualnych odzwierciedla szersze, branżowe zaangażowanie w odpowiedzialną sztuczną inteligencję. W miarę jak modele językowe stają się coraz potężniejsze i bardziej dostępne, zabezpieczenia wokół drażliwych tematów – w tym mowy nienawiści, przemocy i treści seksualnych – prawdopodobnie staną się jeszcze solidniejsze, a nie słabsze.
Użytkownik w tej interakcji dowiedział się jednego: proszenie AI o historię pornograficzną daje tylko jeden pewny rezultat – stanowcze, jasne „nie”.
Comments
0 comments