חוקרי בינה מלאכותית בתעשייה ובאקדמיה מסכימים פה אחד שדרישת "אפס פריצות" אינה ברת-השגה בשיטות הנוכחיות . הסיבות נעוצות ביסודות המתמטיים של אופן פעולתם של מודלי שפה גדולים.
פרדוקס הפריצה (Jailbreak Paradox). מאמר מ-2024 ב- arXiv (עודכן במאי 2026) הוכיח פורמלית שני פרדוקסים: ראשית, בלתי אפשרי לבנות מסווג פריצות מושלם, ושנית, מודל חלש יותר אינו יכול לזהות באופן עקבי אם מודל חזק יותר נפרץ . זהו לא באג שניתן לתקן – זוהי מגבלה מתמטית הטבועה באופן הגדרת ההתאמה (alignment).
מרוץ חימוש עוין, לא בעיה פתירה. פריצות (Jailbreaking) היא בעיה עוינת מיסודה. תוקפים מגלים ללא הרף דפוסי Prompt חדשים, טריקי קידוד ואסטרטגיות מרובות-שיחות שמתחמקות מהפילטרים הקיימים. ברגע שמתקנים סוג אחד של פריצות, צצות גרסאות חדשות .
הרחבת היקף הפריצות האוטונומית. מחקר ממרץ 2026 שפורסם ב-Nature Communications מצא שמודלי חשיבה גדולים (LRMs) יכולים כעת לפעול כסוכני פריצה אוטונומיים, תוך השגת שיעור הצלחה כולל של 97.14% בכל צירופי המודלים שנבדקו . משטח התקיפה גדל, לא קטן.
קונצנזוס מומחים. מומחי אבטחה אומרים שחסימה מוחלטת של פריצות "עלולה לעצור את כל פריסות ה-AI המתקדמות" – התקן הזה אינו יעד לתיקון באגים, אלא הוכחה לחוסר אפשרות קיומית .
דרישה זו לא צצה יש מאין. היא באה בעקבות קשת ברורה של לחץ ממשלתי גובר על Anthropic:
סכסוך קודם עם הפנטגון. Anthropic הייתה כבר מסוכסכת עם הממשל האמריקאי בנוגע לאינטראקציות שלה עם הפנטגון, שהגדיר את החברה כ"סיכון לשרשרת האספקה" והורה לסוכנויות פדרליות להגביל או להפסיק את השימוש במוצריה .
הטריגר מאמזון. מנכ"ל אמזון, אנדי ג'סי, הזעיק לכאורה את הבית הלבן בנוגע לחששות אבטחה ספציפיים עם Fable 5, מה שהאיץ את התערבות הממשל . לפחות חמש חברות נוספות גם הן הרימו דגל אדום
.
ההשבתה הפתאומית. ב-12 ביוני בשעה 17:21 שעון החוף המזרחי, קיבלה Anthropic את מכתב משרד המסחר. עד בערך 22:00, שני המודלים כובו עבור כל הלקוחות ברחבי העולם – זו הפעם הראשונה שארה"ב הפעילה פיקוח יצוא על מודל AI מסחרי שכבר היה בשימוש ציבורי .
אולטימטום אפס הפריצות. לאחר ההשבתה, הבית הלבן הסלים מאיסור יצוא להטלת תקן אבטחה בלתי אפשרי מבחינה טכנית כתנאי מוקדם לשחרור עתידי .
TechCrunch אפיין את כל הפרשה כמהלך פוליטי ש"מעולם לא היה על פריצת AI" – איתות לכך שהממשלה מוכנה לקבוע באופן חד-צדדי מתי מודל AI מסוכן מכדי לפעול .
עמדת הבית הלבן, כפי שדווחה על ידי מספר כלי תקשורת, היא שמודל Fable 5 של Anthropic יכול לחזור רק אם החברה תהפוך את הפריצות לבלתי אפשריות . זו אינה בקשה לשיפור הדרגתי או תהליך ניהול פגיעות מדורג – זוהי דרישה בינארית מוחלטת: או שאין פריצה בשום מקום, או שלא ניתן לשחרר את המודל
.
Anthropic התנגדה וקבעה כי "אף בודק עדיין לא הצליח למצוא פריצה אוניברסלית" וכי הימנעות מוחלטת מכל פריצה אינה אפשרית עבורם או עבור כל חברה אחרת . החברה גם ציינה כי היא "אפילו לא קיבלה גילוי על פריצה פוטנציאלית שאינה אוניברסלית ומטרידה שהובילה לתוצאה מזיקה"
.
בהתבסס על דיווחים ממספר כלי תקשורת, ל-Anthropic שלוש דרכים אסטרטגיות אפשריות:
1. ציות ומשא ומתן. המנכ"ל דריו אמודאי נפגש עם פקידי הבית הלבן ב-15 ביוני כדי לנהל משא ומתן על מסגרת הערכת פגיעות מקובלת הדדית – שתחליף את הדרישה המוחלטת לאפס פריצות בתקן חומרה מדורג . הבית הלבן ו-Anthropic משתפים פעולה לכאורה בבניית מסגרת להערכת חומרת פרצות האבטחה
. נראה שזהו המסלול ש-Anthropic נוקטת כעת.
2. אתגר שיפוטי או פוליטי. Anthropic יכולה לערער על פיקוח הייצוא בבית המשפט, בטענה שהממשלה חרגה מסמכותה הסטטוטורית או הפרה את ההליך החוקי ע"י החלת פיקוח יצוא רטרואקטיבית על מוצר מסחרי זמין לציבור . זהו מהלך בסיכון גבוה שיכול לקבוע תקדים היסטורי.
3. ארגון מחדש או העברת פעילות. Anthropic יכולה להגביל שחרורי מודלים לתחומי שיפוט עם סביבות רגולציה צפויות יותר, או לשנות את המבנה הארגוני שלה כדי להפריד בין מוצרים המיועדים לארה"ב למוצרים גלובליים. אנליסטים מסוימים מתארים זאת כ"אפשרות גרעינית" שתשנה מהיסוד את מודל העסקים של Anthropic.
הסכסוך הזה מגבש שלושה מתחים יסודיים שיעצבו את עתיד ה-AI המתקדם:
מציאות טכנית מול אבסולוטיזם רגולטורי. הממשלה דורשת ערובה – אפס פריצות – שמדעי המחשב טוענים שהיא בלתי אפשרית . אם הממשל יתעקש על תקן זה, יהיה לו הלכה למעשה וטו על כל שחרור של מודל AI מתקדם, מכיוון שאף מעבדה לא תוכל לעמוד בדרישה.
פיקוח יצוא על תוכנה ציבורית. לראשונה, ארה"ב החילה פיקוח יצוא על מודל AI מסחרי שהיה כבר נגיש לציבור . זה קובע תקדים לפיו ניתן להורות לכל מעבדת AI לסגור מוצר בן לילה על בסיס קביעה חד-צדדית של ביטחון לאומי.
עצמאות מול פיקוח דה-פקטו. Anthropic נוסדה מתוך דגש משימתי על בטיחות ועצמאות. פעולת הבית הלבן מדגימה שגם המעבדות ה"אחראיות" ביותר יכולות להיאלץ לעמוד בסטנדרטים ממשלתיים לא מציאותיים מבחינה טכנית – או שהמוצרים שלהן פשוט יכובו . כפי שניסח זאת בלומברג, החסימה מסמנת "היפוך עמדות אמריקאי" ו"אזהרה לעמק הסיליקון" שעידן הפריסה העצמית של AI מתקדם עשוי להסתיים
.
Comments
0 comments