उत्तरप्रकाशित3 दिन पहलेLast edited 3 दिन पहले32 स्रोत

क्यों साइबर सुरक्षा विशेषज्ञ कह रहे हैं कि एंथ्रोपिक का क्लॉड फेबल 5 इस्तेमाल के लिहाज से बहुत सुरक्षित है

साइबर सुरक्षा शोधकर्ता एंथ्रोपिक के क्लॉड फेबल 5 की आलोचना कर रहे हैं क्योंकि इसके सुरक्षा गार्डरेल्स मासूम सुरक्षा संबंधी सवालों तक को आक्रामक रूप से ब्लॉक कर देते हैं और उपयोगकर्ता को बिना बताए चुपचाप एक कमज़ोर मॉडल... विवाद का केंद्र एक ऐसी प्रणाली है जो साइबर सुरक्षा, जीव विज्ञान, रसायन विज्ञान और AI डिस्टिलेशन...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

27K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
AI संकेत
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

एंथ्रोपिक ने 9 जून, 2026 को क्लॉड फेबल 5 को जनता के लिए अपने अब तक के सबसे शक्तिशाली AI मॉडल के रूप में जारी किया, लेकिन इस लॉन्च को साइबर सुरक्षा समुदाय की तीखी प्रतिक्रिया का सामना करना पड़ा है। जहां कंपनी इस मॉडल को अपनी मिथोस-श्रेणी की तकनीक की एक जिम्मेदार रिलीज़ के रूप में पेश कर रही है, वहीं सुरक्षा पेशेवरों का तर्क है कि इसमें निर्मित सुरक्षा गार्डरेल्स इतने आक्रामक हैं कि यह मॉडल वैध अनुसंधान और रक्षात्मक कार्यों के लिए कार्यात्मक रूप से बेकार हो जाता है ।

आलोचना का केंद्र यह नहीं है कि सुरक्षा सुविधाएँ मौजूद हैं, बल्कि यह है कि उन्हें कैसे लागू किया गया: चुपचाप, व्यापक रूप से, और एक ऐसे फॉलबैक तंत्र के साथ जो उपयोगकर्ता की जानकारी के बिना एक कम सक्षम AI को स्थानापन्न कर देता है। यहाँ इस विवाद और इसके पीछे की तकनीक का विश्लेषण प्रस्तुत है।

आलोचना: व्यापक फ़िल्टर वैध काम को खत्म कर रहे हैं

शोधकर्ताओं की प्रमुख शिकायत फेबल 5 के कंटेंट क्लासिफ़ायर की अत्यधिक संवेदनशीलता है। IBM X-Force की एक प्रमुख सुरक्षा शोधकर्ता वैलेंटिना “चोम्पी” पाल्मियोटी ने TechCrunch को बताया कि मॉडल “किसी भी ऐसे अनुरोध को अस्वीकार कर देता है जो साइबर से संबंधित हो सकता है—यहाँ तक कि एक ब्लॉग पोस्ट पढ़ने जैसे मासूम कार्यों को भी” । इसका मतलब है कि केवल खतरनाक सवाल ही नहीं, बल्कि बुनियादी साइबर सुरक्षा अवधारणाओं को समझने में मदद के अनुरोध भी फ़्लैग किए जा रहे हैं।

यह ओवर-फ़्लैगिंग मॉडल की उपयोगिता पर सीधा, नकारात्मक प्रभाव डालता है। जब कोई क्वेरी फ़्लैग होती है, तो उपयोगकर्ता को एक पुराने AI से एक पतला जवाब मिलता है, एक ऐसा बदलाव जिसके बारे में उन्हें स्पष्ट रूप से सूचित नहीं किया जाता है । यह मुद्दा इस जानकारी के प्रकटीकरण के तरीके से और बढ़ गया। आलोचकों का तर्क है कि इस व्यवहार का खुलासा केवल 319 पन्नों के सिस्टम कार्ड में गहराई से किया गया था, जिसके चलते एंथ्रोपिक पर कुछ उपयोगकर्ताओं के लिए मॉडल की क्षमताओं में “गुप्त तोड़फोड़” करने के आरोप लगे ।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं