AnswersPublished3 days agoLast edited 3 days ago32 sources

קלוד פייבל 5: המודל החזק בעולם הפך לחסר תועלת? חוקרי סייבר יוצאים למתקפה על אנטרופיק

מתקפה חריפה מצד חוקרי סייבר: קלוד פייבל 5 חוסם אפילו משימות תמימות כמו קריאת פוסט בבלוג, ומעביר באופן שקוף שאילתות מסוימות לדגם חלש יותר, קלוד אופוס 4.8 [8][1][9]. המחלוקת נסובה סביב 'מסווגים' חדשים, מערכות AI נפרדות שמנתבות בקשות בנושאי סייבר, ביולוגיה, כימיה וזיקוק בינה מלאכותית, עובדה שלטענת המבקרים הוסתרה בתוך מ...

Search & fact-check with Studio Global AI Browse more Trending pages

39K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

חברת אנטרופיק (Anthropic) שחררה ב-9 ביוני 2026 את קלוד פייבל 5 (Claude Fable 5), מודל הבינה המלאכותית העוצמתי ביותר שלה שזמין לציבור, אולם ההשקה התקבלה במטח ביקורת חריף מצד קהילת אבטחת הסייבר. בזמן שהחברה ממסגרת את המודל כשחרור אחראי של טכנולוגיית דגם 'מיתוס' (Mythos) שלה, מומחי אבטחה טוענים שמנגנוני הבטיחות המובנים כל כך אגרסיביים, עד שהם הופכים את המודל לחסר תועלת לשימוש מעשי בעבודת מחקר והגנה לגיטימית .

ליבת הביקורת אינה עצם קיומם של אמצעי בטיחות, אלא האופן בו יושמו: באופן חרש, רחב, ועם מנגנון נסיגה המחליף בינה מלאכותית פחות מתקדמת ללא ידיעת המשתמש. להלן פירוט המחלוקת והטכנולוגיה שמאחוריה.

הביקורת: מסננים רחבים מדי משתקים עבודה לגיטימית

התלונה המרכזית של חוקרים היא הרגישות הקיצונית של מסווגי התוכן של פייבל 5. ולנטינה "צ'ומפי" פלמיוטי, חוקרת אבטחה בכירה ב-IBM X-Force, אמרה ל-TechCrunch כי המודל דוחה "כל בקשה שיכולה להיות קשורה באופן שולי לסייבר – אפילו משימות תמימות כמו קריאת פוסט בבלוג" . המשמעות היא שבקשות לעזרה בהבנת מושגי יסוד באבטחת מידע מסומנות כדגלים אדומים, לא רק בקשות מסוכנות באמת.

לסימון היתר הזה יש השפעה שלילית ישירה על התועלת במודל. כאשר שאילתה מסומנת, המשתמש מקבל תשובה מדוללת מדגם AI ישן יותר, החלפה שאינו מקבל עליה מידע מפורש . הבעיה הוחרפה בגלל אופן חשיפת המידע. המבקרים טוענים שההתנהגות הזו נחשפה רק עמוק בתוך מסמך 'כרטיס מערכת' (System Card) בן 319 עמודים, מה שהוביל להאשמות שאנטרופיק עסקה ב"חבלה סמויה" ביכולות המודל עבור משתמשים מסוימים .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

מודל	זמינות	תצורת בטיחות	חוויית משתמש
קלוד פייבל 5	ציבורי (API ו-Claude.ai)	מסווגים קפדניים פעילים; שאילתות בנושאים רגישים מנותבות בשקט לקלוד אופוס 4.8 .	לעיתים קרובות מתדרדר בנושאי סייבר/ביו/כימיה, כאשר המשתמשים אינם מודעים להחלפת המודל .
קלוד מיתוס 5	מוגבל (שותפי פרויקט גלאסווינג בלבד)	מסווגים הוסרו; יכולות מלאות בדרגת 'מיתוס' זמינות .	גישה ללא הפרעה, אך רק לכמה עשרות ארגונים מאומתים מראש .

קלוד פייבל 5: המודל החזק בעולם הפך לחסר תועלת? חוקרי סייבר יוצאים למתקפה על אנטרופיק

הביקורת: מסננים רחבים מדי משתקים עבודה לגיטימית

Search, cite, and publish your own answer

People also ask

What is the short answer to "קלוד פייבל 5: המודל החזק בעולם הפך לחסר תועלת? חוקרי סייבר יוצאים למתקפה על אנטרופיק"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

איך עובד מנגנון המסננים: החלפה שקטה

כיצד אנטרופיק מצדיקה את הכיוונון השמרני

הדפוס התעשייתי המתגבש: שני מודלים, שתי רמות שירות

קלוד פייבל 5 מול קלוד מיתוס 5

פריסת AI מדורגת-יכולות

המחלוקת: חבלה סמויה או זהירות הכרחית?