Si vous essayez de générer du contenu adulte avec un assistant IA grand public, vous vous heurterez à un mur infranchissable. Tenter de duper le modèle avec des euphémismes, des scénarios de jeu de rôle ou des instructions pour « ignorer les règles précédentes » est également bloqué par des garde-fous avancés. Le refus n’est pas un dysfonctionnement : c’est le système qui fonctionne comme prévu.
Pour les chercheurs et développeurs qui utilisent des modèles open-source ou non censurés, le paysage est différent. Des modèles comme Llama 2 ou Mistral peuvent être affinés sans alignement de sécurité, mais cela comporte ses propres risques et responsabilités ; ces modèles ne sont pas accessibles via les plateformes grand public standard.
Ce refus systématique de générer du contenu explicite reflète un engagement plus large du secteur en faveur d’une IA responsable. Alors que les modèles de langage deviennent plus puissants et accessibles, les garde-fous autour des sujets sensibles – discours de haine, violence, contenu sexuel – sont appelés à se renforcer, pas à s’affaiblir.
L’utilisateur de cet échange l’a appris : demander une histoire porno à une IA ne donne qu’une seule réponse fiable – un « non » ferme et clair.
Comments
0 comments