ההגבלות אינן מוגבלות לאבטחת סייבר. המסננים מכוונים גם לשאילתות הקשורות לביולוגיה, כימיה, ובאופן קריטי, לזיקוק מודלי AI (AI model distillation). הנקודה האחרונה הציתה גל ביקורת נפרד, כאשר חלק מהמפתחים מאשימים את אנטרופיק בשימוש ב"בטיחות" כעילה להתנהגות אנטי-תחרותית, על ידי מניעה ממפתחי AI אחרים להשתמש בפלט של פייבל 5 לאימון המודלים שלהם .
מערכת הבטיחות של אנטרופיק בפייבל 5 אינה מנגנון סירוב פשוט. זוהי מערכת ניתוב שנועדה להיכשל בשקט . הארכיטקטורה פועלת בשלושה שלבים:
באנטרופיק מציינים שמסווגים אלו מופעלים בפחות מ-5% מכלל הסשנים בממוצע . החברה הכירה בפומבי בבעיית סימון היתר. דובר החברה אמר ל-Business Insider שאמצעי הבטיחות "עלולים לסמן בקשות בטוחות, ניטרליות או תמימות", אך הצדיק זאת כפשרה הכרחית לשחרור פומבי של מודל בעל יכולות בסיס כל כך עוצמתיות
.
עמדתה של אנטרופיק היא שמסנני הבטיחות השמרניים הם בחירה מכוונת ואחראית, ולא באג. החברה טוענת שמודל הבסיס מסדרת 'מיתוס' כל כך מיומן במשימות כמו איתור וניצול פרצות תוכנה, עד ששחרור ציבורי ללא הגבלות היה יוצר סיכון בלתי מתקבל על הדעת לשימוש לרעה קטסטרופלי .
המסננים הם, לדעתם, פשרה תכנונית – דרך לספק לציבור גישה למודל חדשני לחשיבה, קידוד וכתיבה, תוך כדי יצירת ארגז חול סביב היכולות המסוכנות ביותר שלו . הם ממסגרים את סימון היתר כ"מחיר" הזמני של שחרור מודל עוצמתי "גם בבטחה וגם במהירות", עם מחויבות לחדד את המסווגים לאורך זמן
.
לא ניתן להבין את שחרורו של קלוד פייבל 5 במנותק. זהו חצי מאסטרטגיית פריסה דו-שכבתית שהופכת לסטנדרט תעשייתי חדש עבור מודלי AI מהשורה הראשונה .
באותו יום שבו שוחרר פייבל 5, אנטרופיק הודיעה גם על קלוד מיתוס 5 (Claude Mythos 5). שני המודלים חולקים את אותה ארכיטקטורה בסיסית ואותם משקלים ('Weights') – הם אותו "מוח". ההבדל היחיד הוא תצורת הבטיחות. במיתוס 5, המסווגים הוסרו בתחומים הרגישים, מה שמעניק לו את יכולותיו המלאות והבלתי מוגבלות .
עם זאת, מיתוס 5 אינו מיועד לציבור. הוא מוגבל לקבוצה קטנה של שותפים מאומתים, כולל סוכנויות ממשלתיות ומפעילי תשתיות קריטיות, באמצעות יוזמה בשם פרויקט גלאסווינג (Project Glasswing) . תוכנית זו, המגובה על ידי ממשלת ארה"ב, הושקה בתחילה עם 12 שותפים מייסדים, כולל ענקיות טכנולוגיה כמו AWS, גוגל ומיקרוסופט, במטרה לאפשר ל"לוחמי סייבר" להשתמש ב-AI כדי למצוא ולתקן פרצות תוכנה בקנה מידה רחב
. עם שחרורו של מיתוס 5, הגישה הורחבה לכ-40 ארגונים
.
הטבלה שלהלן ממחישה את הפיצול הבסיסי:
הפיצול של אנטרופיק בין פייבל למיתוס הוא הדוגמה המפורשת ביותר למה שניתן לכנות פריסת AI מדורגת-יכולות (Capability-Tiered AI Deployment). במודל חדש זה, מודל AI בודד מהשורה הראשונה אינו מוצר בודד אחד. מלוא העוצמה שלו היא זכות יתר, לא דבר מובן מאליו, ומסנני הבטיחות הם המנגנון שיוצר בידול מוצרי .
דפוס זה אינו ייחודי לאנטרופיק. חברות AI מובילות אחרות, כולל OpenAI, אימצו גישות דומות על ידי אספקת גרסאות עם גישה מוגבלת של המודלים המתקדמים ביותר שלהן לשותפים בתחום הביטחון הלאומי והמחקר . השקת פייבל 5/מיתוס 5 מגבשת עתיד שבו יכולות ה-AI העוצמתיות ביותר אינן חסומות על ידי טכנולוגיה, אלא על ידי מעמד אימות, כאשר פרוטוקולי בטיחות משמשים גם כמנגנוני בקרת גישה – גישה שכבר מעוררת ויכוח רחב יותר על ריכוזיות, הוגנות והמשמעות האמיתית של בטיחות AI "ציבורית".
ההאשמה המרכזית היא שאנטרופיק לא סיפרה בבירור למשתמשים על קיומו של מנגנון ההחלפה. המבקרים טוענים שההתנהגות הוטמנה ב'אותיות הקטנות' של מסמך בן 319 עמודים, שאיש אינו קורא, מה שהופך את המעבר ל"חבלה סמויה" ביכולות המודל. עבור חוקרים, תחושת הבגידה אינה נובעת מעצם ההגבלה, אלא מחוסר השקיפות: לגלות שאתה עובד עם מודל נחות רק אחרי שהתשובות מתחילות להיראות מוזר זו חוויה מתסכלת ומטעה.
מנגד, באנטרופיק טוענים שהשקיפות כן קיימת, פשוט במסמכים הטכניים המתאימים, ושבהינתן הסיכונים – היכולת של המודל לכתוב קוד זדוני ולמצוא פרצות אבטחה באופן אוטומטי – העמעום הקל הזה הכרחי כדי למנוע משחקנים זדוניים ללמוד איך לעקוף את המערכת. החברה מדגישה שהמסווגים לא נועדו לבלום חוקרים, אלא למנוע שימוש לרעה המוני.
המתח הזה בין יכולת גולמית לבין שליטה משקף את הדילמה הגדולה ביותר של תעשיית הבינה המלאכותית כרגע: איך חולקים כוח עצום עם הציבור מבלי שהוא יהפוך לנשק להשמדה המונית. התשובה של אנטרופיק, לעת עתה, היא לחלק את הגישה לשתי רמות, בתקווה שהשקיפות, גם אם חלקית, תספיק כדי לשמור על האמון. האם זה יצליח? קהילת הסייבר, נכון לעכשיו, מצביעה ברגליים.
Comments
0 comments