ממשלת ארה"ב השעתה את הגישה למודלי ה-AI Fable 5 ו-Mythos 5 של אנתרופיק

ממשלת ארה"ב, תוך ציון סמכויות ביטחון לאומי, הוציאה הנחיית בקרת ייצוא המורה להשעות באופן גורף את כל הגישה למודלי ה-AI Fable 5 ו-Mythos 5 לכל אזרח זר, בין אם הוא נמצא בתוך ארצות הברית ובין אם מחוצה לה, כולל עובדי אנתרופיק שהם אזרחים זרים. המשמעות המיידית של צו זה היא שאנתרופיק נאלצת להשבית בפתאומיות את Fable 5 ו-Mythos 5 עבור כלל לקוחותיה, כדי להבטיח עמידה בהנחיה. הגישה לשאר מודלי אנתרופיק לא תיפגע.

ההנחיה התקבלה מהממשלה היום בשעה 17:21 (שעון החוף המזרחי), ומכתב הממשלה לא פירט את החשש הספציפי לביטחון לאומי. ההבנה של אנתרופיק היא שהממשלה סבורה כי התגלה בפניה שיטה לעקיפה, או "פריצת מגבלות" של Fable 5. סקרנו הדגמה של טכניקה ספציפית זו, אשר שימשה לזיהוי מספר קטן של פרצות אבטחה קלות וידועות מראש. פרצות אלו נראות פשוטות יחסית, ומצאנו כי מודלים אחרים הזמינים לציבור מסוגלים לגלות אותן גם ללא צורך בעקיפה.

אנתרופיק מצדה הדגישה כי הטמיעה במודלי Fable מנגנוני הגנה חזקים ביותר, אותם בחנה במשך אלפי שעות ב-Red Teaming עם גורמים ממשלתיים ופרטיים. החברה טוענת כי מנגנונים אלו יעילים משמעותית מכל מודל קודם שנפרס, וכי אמנם פריצות מגבלות לא-אוניברסליות עשויות להתגלות, אך עד כה לא נמצאה פריצת מגבלות אוניברסלית. לטענתה, התנגדות מושלמת לפריצות מגבלות אינה אפשרית כיום, וכי היא נוקטת ב"אסטרטגיית הגנה רב-שכבתית" הכוללת ניטור הדוק ושמירת נתונים, המצמצמת את הסיכונים לרמה דומה לזו של מודלים קיימים בתעשייה.

עד כה, הממשלה סיפקה לאנתרופיק רק עדויות בעל פה לפריצת מגבלות פוטנציאלית צרה ולא-אוניברסלית, אשר, לטענת החברה, רמת היכולת שהוצגה בה זמינה באופן נרחב במודלים אחרים (כולל GPT-5.5 של OpenAI), ומשמשת מפתחי מערכות אבטחה מדי יום. אנתרופיק מצייתת להנחיה, אך חולקת על הקביעה כי מציאת פריצת מגבלות פוטנציאלית צרה צריכה להוות עילה להורדה מפעילות של מודל מסחרי שנפרס למאות מיליוני אנשים. לטענתה, יישום סטנדרט זה יעצור את כל פריסות המודלים החדשים של ספקי מודלי חזית, ואינו עומד בעקרונות של תהליך חוקי שקוף והוגן. אנתרופיק מצרה על השיבוש ללקוחותיה, מאמינה כי מדובר באי-הבנה ופועלת להחזרת הגישה בהקדם האפשרי.

ממשלת ארה"ב השעתה את הגישה למודלי ה-AI Fable 5 ו-Mythos 5 של אנתרופיק

כתבות קשורות

TCS ואנתרופיק משלבות כוחות: קלוד מגיע לתעשיות המפוקחות

אנתרופיק חושפת: סקר ענק על עמדות הציבור בארה"ב כלפי AI

שיתוף פעולה אסטרטגי: DXC תשלב את קלוד במערכות מפתח קריטיות