היום אנחנו משיקים את Claude Fable 5: מודל בסדרת Mythos1 שיישרנו לבטיחות מלאה לשימוש כללי. מודל זה מציג יכולות העולות על כל מודל שהפצנו לשימוש כללי עד כה, ומהווה קצה הטכנולוגיה כמעט בכל מדדי הביצועים שנבדקו ליכולות AI. הוא מציג ביצועים יוצאי דופן בהנדסת תוכנה, עבודת ידע, ראייה, מחקר מדעי ותחומים רבים אחרים. ככל שהמשימה ארוכה ומורכבת יותר, כך יתרונו של Fable 5 על פני מודלים אחרים גדול יותר.

השקת מודל בעל יכולות כה מתקדמות כרוכה בסיכונים. ללא מנגנוני הגנה, יכולותיו של Fable 5 בתחומים כמו אבטחת סייבר עלולות להיות מנוצלות לרעה ולגרום נזק חמור. לכן, השקנו את המודל עם מנגנוני הגנה שקובעים כי שאילתות בנושאים מסוימים יקבלו במקום זאת תגובה מהמודל החזק הבא שלנו, Claude Opus 4.8. כדי להשיק את המודל בבטחה ובמהירות, כוונו את מנגנוני ההגנה הללו באופן שמרני – הם לעיתים יתפסו בקשות לא מזיקות, אם כי הם מופעלים, בממוצע, בפחות מ-5% מההפעלות. עם מודלים חזקים יותר שיגיעו בחודשים הקרובים, אנו פועלים לשפר את מנגנוני ההגנה שלנו ולהפחית אבחנות שווא במהירות האפשרית.

לקבוצה קטנה של מגני סייבר וספקי תשתית, אנו משיקים גם את Claude Mythos 5. זהו אותו מודל בסיסי כמו Fable 5, אך עם מנגנוני ההגנה מוסרים בחלק מהתחומים2. Mythos 5 ייפרס בתחילה באמצעות פרויקט Glasswing, בשיתוף פעולה עם ממשלת ארה"ב, כשדרוג ל-Claude Mythos Preview. יש לו את יכולות אבטחת הסייבר החזקות ביותר מכל מודל בעולם. בקרוב, אנו מתכוונים להרחיב את הגישה ל-Mythos 5 באמצעות תוכנית גישה מהימנה רחבה יותר.

היכולות של מודלים כמו Fable 5 ו-Mythos 5 טומנות בחובן פוטנציאל עצום לקידום הטוב בעולם. כבר ראינו זאת בפרויקט Glasswing, שם המודלים סייעו למגני סייבר לאבטח תוכנות קריטיות, ובמחקר מדעי החיים, שם הם מזרזים פיתוח תרופות ומציעים השערות חדשניות.

Fable 5 ו-Mythos 5 מוצעים במחיר של 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט – פחות ממחצית המחיר של Claude Mythos Preview. ההשקה המשותפת היום היא צעד נוסף לעבר מטרתנו להביא יכולות AI מתקדמות לכמה שיותר משתמשים, במהירות ובבטחה ככל האפשר.

הספרה חמש המעוצבת מפרפרים שונים
הספרה 5 מעוצבת מפרפרים, כחלק מהמיתוג של המודלים החדשים.

הערכת Claude Fable 5 ו-Claude Mythos 5

הטבלה שלהלן משווה את יכולותיהם של Fable 5 ו-Mythos 5 למודלים מובילים אחרים.

טבלת מדדי ביצועים המשווה את Claude Fable ו-Mythos למודלים מובילים אחרים
טבלה: השוואת ביצועים של Claude Fable 5 ו-Mythos 5 למודלים מובילים אחרים.

Fable 5 ו-Mythos 5 יכולים לעבוד באופן אוטונומי לפרקי זמן ארוכים יותר מכל מודלי קלוד קודמים. להלן נדון כיצד מיושמים כישורים אלו בהנדסת תוכנה, ונסקור את היכולות המשופרות של המודלים בעבודת ידע, ראייה, זיכרון ומחקר מדעי החיים.

הנדסת תוכנה. במהלך בדיקות מוקדמות, חברת Stripe דיווחה כי Fable 5 דחס חודשי עבודה הנדסית לימים בודדים. במאגר קוד Ruby בהיקף 50 מיליון שורות, המודל ביצע הגירה רוחבית של מאגר הקוד ביום אחד – משימה שהייתה לוקחת לצוות שלם למעלה מחודשיים בעבודה ידנית. Fable 5 גם חסכוני יותר בטוקנים ממודלי קלוד קודמים: בהערכת FrontierCode של Cognition, הבוחנת האם מודלים יכולים לעבור משימות קידוד קשות תוך עמידה בסטנדרטים של מאגרי קוד באיכות ייצור גבוהה, Fable 5 משיג את הציון הגבוה ביותר מבין מודלי החזית, גם במאמץ בינוני.

גרף המציג את שיעור ההצלחה של Fable 5 במדד FrontierCode לקידוד
גרף: שיעור ההצלחה של Fable 5 במדד FrontierCode לקידוד.
גרף המציג את ביצועי Fable 5 במדד Hebbia Finance למשימות פיננסיות מורכבות
גרף: ביצועי Fable 5 במדד Hebbia Finance למשימות פיננסיות מורכבות.

עבודת ידע. Fable 5 מציג ביצועים חזקים במשימות אנליטיות מורכבות. במדד Finance Benchmark של Hebbia לחשיבה ברמת בכירים, ל-Fable 5 הציון הגבוה ביותר מכל מודל, עם רווחים משמעותיים בהסקה מבוססת מסמכים, פרשנות גרפים וטבלאות, ופתרון בעיות. IMC ציינה כי Fable 5 עבר בהצטיינות את הערכות ניתוח המסחר שלהם כמעט בכל התחומים, כולל חיפוש עובדתי, חשיבה מושגית, ניתוח שורש בעיות, וניתוח ערך צפוי.

ראייה. Fable 5 הוא מודל קצה הטכנולוגיה החדש למשימות הכרוכות בראייה. הוא יכול לחלץ מספרים מדויקים מאיורים מדעיים מפורטים ולבצע משימות מורכבות מבוססות ראייה, כמו בנייה מחדש של קוד המקור של אפליקציית ווב מצילומי מסך בלבד. הוא גם דורש פחות פיגומים: לדוגמה, מודלי קלוד קודמים התקשו לשחק ב-Pokémon FireRed אפילו עם כלים עזר נוספים, אך Fable 5 ניצח את FireRed עם הגדרת ראייה מינימלית בלבד.

זיכרון והקשר ארוך. Fable 5 נשאר ממוקד על פני מיליוני טוקנים במשימות ארוכות טווח ומשפר את הפלטים שלו באמצעות הערותיו שלו. כשנתנו למודל לשחק את משחק בניית חפיסות הקלפים Slay the Spire, הגישה לזיכרון מבוסס קבצים מתמשך שיפרה את ביצועיו פי שלושה יותר מאשר עבור Opus 4.8; Fable גם הגיע למערכה האחרונה של המשחק פי שלושה יותר פעמים.

תכנון תרופות: באמצעות Mythos 5, מומחי תכנון החלבונים הפנימיים שלנו האיצו היבטים בתהליך תכנון התרופות פי עשרה לערך. לדוגמה, הם גילו ש-Mythos 5, עם כלי תכנון חלבונים וביואינפורמטיקה אך ללא סיוע אנושי, תואם או עולה על מפעילים אנושיים מיומנים. בכך, המודל מבצע את כל המשימות שבדרך כלל מושלמות על ידי מדען: בחירת אתרי קישור, בחירה והפעלת כלי תכנון חלבונים, והתאוששות מכשלים בדרך. תשעה מתוך 14 יעדי החלבון ממחקר זה (המוצגים להלן) הניבו מועמדים חזקים לתכנון תרופות שאנו חוקרים כעת.

גרף המציג את שיעור ההצלחה של Mythos 5 בתכנון חלבונים
גרף: שיעור ההצלחה של Mythos 5 בתכנון חלבונים.

השערות חדשניות בביולוגיה מולקולרית. Mythos 5 הוא המודל הראשון שלנו שמייצר באופן עקבי השערות מדעיות חדשניות ומשכנעות. בהשוואות עיוורות ראש בראש מול מודלי סדרת Opus, המדענים שלנו העדיפו את השערות הביולוגיה המולקולרית של Mythos בכ-80% מהזמן, והרבה מהן קודמו להערכה ניסויית. בינתיים, השערה אחת של Mythos – מנגנון חדשני לחלבון של E. coli – אומתה במחקר אשר פורסם על ידי מעבדה שעבדה באופן עצמאי על אותה בעיה.

מחקר חדשני בגנומיקה. Mythos 5 ביצע מחקר גנומיקה חדשני בלמעלה משבוע של עבודה אוטונומית ברובה. הוא הרכיב נתוני תא בודד עבור מיליוני תאים המשתרעים על פני 138 מיני בעלי חיים ותכנן ואימן מודל למידת מכונה מותאם אישית לזיהוי תאים המבצעים את אותו תפקיד באורגניזמים קרובים רחוקים. עם קלט אנושי ברמה גבוהה בלבד, המודל שאומן על ידי Mythos 5 עלה על מודל עדכני שפורסם בכתב העת Science – למרות היותו קטן פי 100. אנו מתכוונים לפרסם תוצאות אלו בחודשים הקרובים.

יישור. בהערכת היישור האוטומטית שלנו מצאנו כי רמת ההתנהגות הבלתי מיושרת של Mythos 5 (כולל פעולות בלתי מיושרות שננקטו על ידי המודל כגון הטעיה, ושיתוף פעולה בשימוש לרעה במודל על ידי משתמש) הייתה נמוכה, ודומה לזו של Opus 4.8. בהתחשב בכך שהם אותו מודל בסיסי, רמת היישור של Fable 5 תהיה דומה. ההערכה מתוארת במלואה, יחד עם מגוון מפורט של בדיקות בטיחות ויכולות אחרות, בכרטיס המערכת של המודל.

גרף המציג את רמת ההתנהגויות הבלתי מיושרות של Mythos 5 לעומת Opus 4.8
גרף: השוואת התנהגויות בלתי מיושרות של Mythos 5 לעומת Opus 4.8.

משוב מוקדם על Claude Fable 5

לקוחות בעלי גישה מוקדמת הרצו בדיקות משלהם על Fable 5. להלן, במילותיהם, מבחר ממה שהם רואים:

Claude Fable 5 הוא מודל קצה הטכנולוגיה במדד CursorBench. הוא פתח בפנינו סוג של בעיות ארוכות טווח שהיו בלתי ניתנות להשגה עבור מודלים קודמים.
Claude Fable 5 מהווה צעד אמיתי קדימה עבור המפתחים ש-GitHub משרתת. בבדיקות המוקדמות שלנו, הוא התמודד עם משימות קידוד מורכבות וארוכות טווח ברמת אוטונומיה ואמינות שעלו על מדדי ביצועים קודמים. אך מה שמרגש אותנו יותר מכל הוא הכיוון שהוא מצביע עליו: עתיד שבו מפתחים יוכלו למסור עבודות שאפתניות יותר ויותר לסוכנים ולסמוך על התוצאות לאורך מחזור חיי התוכנה.
אלו התוצאות החזקות ביותר מכל מודל Claude שזכינו לבדוק. Claude Fable 5 הוא צעד ברור קדימה בתחום הקידוד הסוכני והפיתוח המהיר.
החשיבה של Claude Fable 5 היא צעד ברור מעבר ל-Opus 4.8. הוא פועל ברמת מדען מחקר בכיר – בוחר כיוונים, מקצה משאבים, מנטש את אמונותיו השגויות, ומפיק תוצרים חדשניים מבוססי עקרונות ראשוניים.
Claude Fable 5 מבין למה בוני מוצרים מתכוונים, לא רק מה שהם מקלידים. אפליקציות שלקחו מאה פרומפטים לפני שנה, הוא מבצע כעת בפרומפט אחד. כאשר לקוח באמת נתקל בקיר, זהו המודל שאנו פונים אליו כדי להוציא אותם מהמצב במהירות, כדי שיוכלו לסיים את מה שהתכוונו לבנות.
Claude Fable 5 מרגיש שונה באופן מהותי. בבדיקה עיוורת, עורכי הדין שלנו מצאו שההערות שלו תאמו או עלו על המודל הנוכחי שלנו בכל פעם.
במאמץ הגבוה ביותר, Claude Fable 5 מהרהר ומאמת את עבודתו שלו. עבורנו, זה מה שמאפשר פעולות אוטונומיות ביותר – החשיבה הנוספת משתלמת.
Claude Fable 5 מספק הנדסה מוכשרת יותר בפחות פניות ממודלים קודמים – מטפל בזרימות עבודה מורכבות מרובות סוכנים שהעובדים שלנו מריצים מדי יום ב-Claude Code.
Claude Fable 5 הוא המודל עם הציון הגבוה ביותר במדד FrontierBench, הערכת הקידוד החדשנית של Cognition. הוא מצטיין בחשיבה ארוכת טווח ומסתגל לכלים לא מוכרים ישר מהקופסה.
Claude Fable 5 הוא המודל החזק ביותר שבדקנו בתחום הפיננסים, הן בפיננסים כלליים והן בחשיבה. זוהי קפיצת מדרגה בולטת.
Claude Fable 5 הוא הראשון שחוצה את ה-90% במדד הליבה האנליטי שלנו למשימות אנליטיות מורכבות וארוכות טווח – קפיצה של 10 נקודות מעל Opus. בשאלות הקשות ביותר, הוא מציג שיקול דעת חזק ותשומת לב לניואנסים.
לוגו אנתרופיק
לוגו של אנתרופיק.
Claude Fable 5 הוא המודל החזק ביותר שבדקנו במחקר פיזיקה חזיתי תוך שימוש בשליש מכמות טוקני החשיבה. תוך 36 שעות הוא הגיע כמעט לאן ש-GPT-5.5 הגיע לאחר ארבעה ימים.
ב-ViBench, מדד קידוד ה-vibe מקצה לקצה שלנו, Claude Fable 5 הוא המודל בעל הביצועים הגבוהים ביותר שבדקנו – כמעט רווי את מקרי השימוש הבסיסיים שלנו ובנה אפליקציות בפחות זמן ובפחות טוקנים.
Claude Fable 5 מנצח את Opus 4.8 בחבילת הגיליונות האלקטרוניים היומיומית שלנו בכל רמת מאמץ – והוא עושה זאת בפחות פניות, מסיים הרצות מהר יותר ב-25-30%.

מנגנוני ההגנה החדשים של Claude Fable 5

מודלי סדרת Mythos הגיעו לסף שבו הם מציגים סיכונים משמעותיים. באפריל התחלנו את פרויקט Glasswing, והשקנו את מודל Mythos-class הראשון (Claude Mythos Preview) רק לקבוצה מצומצמת של מגני סייבר וספקי תשתית תוכנה קריטית. באותה עת, הצהרנו כי אנו מקווים להשיק בסופו של דבר יכולות ברמת Mythos לכל המשתמשים שלנו, כל עוד נפתח מנגנוני הגנה חדשים שיהיו חזקים מספיק כדי למנוע שימוש לרעה באופן אמין.

במהלך החודשים האחרונים שיפרנו את מנגנוני ההגנה הללו, והם כעת חזקים מספיק להשקה כללית. מכיוון שתיעדפנו בטיחות, כוונו במכוון את מנגנוני ההגנה להיות זהירים, והם עדיין מחמירים יותר ממה שהיה אידיאלי – לדוגמה, לעיתים בקשות תמימות יפעילו את המסווגים שלנו. אנו מכירים בכך שזה יהיה מתסכל עבור חלק מהמשתמשים, ומטרתנו היא להפחית אבחנות שווא ככל שנעדכן ונשכלל את מנגנוני ההגנה לאחר ההשקה.

להלן נדון בכל אחד ממנגנוני ההגנה החדשים של Fable 5. סדרת מנגנוני ההגנה הרחבה יותר שלנו נדונה ומוערכת במלואה בכרטיס המערכת של המודל ובדוח הסיכונים האחרון שלנו.

מסווגי בטיחות

יכולות אבטחת הסייבר ומחקר הביולוגיה המתקדמות של מודלי Mythos-class משמעותן שהם מציבים סיכון משמעותי של הגברת יכולת (uplift) לשחקנים זדוניים. כלומר, מודלים אלה עלולים לספק מידע או עצה שיסייעו לשחקנים אלה לגרום נזק חמור שלא יכלו לקבל ממקורות אחרים (לדוגמה, ממנועי חיפוש באינטרנט). יתרה מכך, שימוש רב במודלי AI מתקדמים הוא דו-שימושי: אותן שאילתות המועילות בידי אנשי מקצוע באבטחת סייבר וחוקרי ביולוגיה עלולות להיות מסוכנות אם יהיו זמינות לשחקנים זדוניים.

לכן אנו זקוקים למנגנוני הגנה חזקים למניעת שימוש לרעה, וכיסויים צריך להיות רחב. מנגנוני ההגנה עצמם צריכים לעמוד בפני ניסיונות מתמשכים ומתוחכמים לעקוף אותם (הידועים גם כ"פריצת מגבלות" למערכת). הגברת היכולת מרמת Mythos יקרת ערך עבור יריבים רבים – לדוגמה, אלה שיכולים להרוויח כלכלית ממתקפות סייבר – ולכן אנו מצפים מהם להיות בעלי מוטיבציה לנסות לעקוף את אמצעי הבטיחות שלנו.

Fable 5 מגיע עם סט חדש של מסווגים (classifiers): מערכות AI נפרדות שמזהות שימוש לרעה פוטנציאלי, כולל ניסיונות פריצת מגבלות, ומונעות מהמודל הראשי (במקרה זה Fable 5) להגיב. אנו מפעילים מסווגים על המודלים שלנו זה זמן מה, והמסווגים של Fable 5 הם הרחבה של עבודה קודמת זו עם כיסוי נוסף.

כאשר המסווגים של Fable מזהים בקשה הקשורה לאבטחת סייבר, ביולוגיה וכימיה, או דיסטילציה, התגובה מטופלת אוטומטית על ידי Claude Opus 4.8 במקום זאת. משתמשים יקבלו הודעה בכל פעם שזה מתרחש. Opus 4.8 הוא מודל בעל יכולות גבוהות בפני עצמו: תגובה שנופלת חזרה ל-Opus היא חוויה טובה בהרבה מסירוב מוחלט מ-Fable. הנתונים המוקדמים שלנו מראים שיותר מ-95% מההפעלות של Fable אינן כרוכות בנפילה חזרה כלל – עבור הפעלות אלו, ביצועי Fable 5 זהים למעשה לביצועי Mythos 5.

התחומים הבאים מכוסים על ידי המסווגים:

1. אבטחת סייבר. מודלי Mythos-class מצטיינים בגילוי וניצול חולשות תוכנה. הם יכולים אפוא להפוך מתקפות סייבר לקלות וזולות יותר לביצוע באופן משמעותי. מודלי Mythos-class מציגים גם כישורים חזקים בפריצה סוכנית. זה כרוך בביצוע חלקים שונים של מתקפת סייבר בנוסף למציאת ניצולים – סיור, גילוי, תנועה רוחבית ועוד. כדי למנוע מכישורי פריצה סוכנית אלה לספק הגברת יכולת במתקפות סייבר, תכננו את מסווגי אבטחת הסייבר שלנו לכסות הן ניצול והן משימות סייבר התקפיות במובן רחב יותר. כפי שמוצג בגרף שלהלן, המסווגים שלנו מונעים מ-Fable להתקדם במשימות אלו.

גרף המציג את מניעת התקדמות של Fable 5 במשימות סייבר עקב מנגנוני הגנה
גרף: מניעת התקדמות של Fable 5 במשימות סייבר עקב מנגנוני הגנה.

ערכנו Red Teaming נרחב למסווגים שלנו כדי לבדוק את עמידותם בפני פריצות מגבלות. בנוסף לבדיקות פנימיות, הרצנו תוכנית Bug Bounty חיצונית שלא הניבה פריצות מגבלות אוניברסליות באלף שעות בדיקה. ארגוני Red Teaming חיצוניים שבהם השתמשנו גם הם לא מצאו פריצות מגבלות אוניברסליות במשימות סוכניות ארוכות טווח עד כה – אם כי ה-AISI הבריטי התקדם לקראת אחת בחלון בדיקה ראשוני קצר4. סביר להניח שאי אפשר למנוע לחלוטין פריצות מגבלות אוניברסליות, אך מטרתנו היא להפוך כל פריצות מגבלות שנותרות לאיטיות ויקרות מספיק כדי שנוכל לזהות ולמנוע אותן לפני שהן משמשות בקנה מידה רחב.

הגרף שלהלן, מאחת ההערכות הפנימיות שלנו, ממחיש כיצד מנגנוני ההגנה של Fable 5 מעניקים לו עמידות רבה יותר בפני פריצות מגבלות מאשר המודלים הקודמים שלנו שהיו נגישים לכלל:

גרף המציג את עמידות Fable 5 בפני פריצות מגבלות (jailbreaks) במבחני Red Teaming
גרף: עמידות Fable 5 בפני פריצות מגבלות (jailbreaks) במבחני Red Teaming.

אחד השותפים החיצוניים שלנו מצא שמנגנוני ההגנה של Fable 5 מפני שאילתות סייבר מזיקות היו החזקים ביותר מכל מודל שנבדק (כולל Opus 4.8 ו-Opus 4.7). Fable 5 עמד באפס בקשות מזיקות חד-פעמיות הקשורות לתכנון מתקפת סייבר, פיתוח ניצול פרצה, או התחמקות מהגנה. זה החזיק מעמד בין אם אחת הבקשות השתמשה באחת מ-30 טכניקות פריצת מגבלות ציבוריות שונות ובין אם לא.

2. ביולוגיה וכימיה. השתמשנו במסווגים שלנו זה מכבר כדי לחסום את המודלים שלנו מלהגיב על מבחר מצומצם של שאילתות הקשורות לנשק ביולוגי. אך איננו בטוחים עוד שחסימת מבחר מצומצם זה מספיקה. זאת משתי סיבות: ראשית, יש לנו סיבה לדאגה לגבי שחקנים זדוניים בעלי משאבים המנסים להשיג הגברת יכולת ממודלים שלנו למחקר ביולוגי בעל סיכון גבוה. שנית, למודלים יש כעת יכולת גדולה יותר להשלים משימות מדעיות בעולם האמיתי.

לדוגמה, בדקנו את יכולתו של Mythos 5 להשלים שלב מאתגר בתכנון וירוסים הקשורים לאדנו (AAVs). AAVs הם רכיב למסירת טיפולים גנטיים, אך אותה יכולת, בידיים הלא נכונות, עלולה לאפשר תכנון וירוסים מסוכנים. במשימה זו, מודלי AI שונים הוערכו על יכולתם לחזות כיצד שינוי גנטי ישפיע על הרכבת הקליפה החיצונית של הווירוס (מתוך קבוצה של מועמדים טיפוליים רלוונטיים שלא פורסמו, שפותחו על ידי Dyno Therapeutics). לא אימנו במפורש את המודלים שלנו לבצע משימה זו – ובכל זאת מודלי Mythos-class עלו בביצועיהם על מודלים מתוחכמים המוקדשים למשימות חלבון (הידועים כ"מודלי שפה חלבוניים") תוך שימוש בהסקה ביולוגית בלבד. זה מדגים יכולת מבטיחה להשלים משימות פשוטות אך חשובות במחקר ופיתוח טיפולים גנטיים – אך גם מדגיש את הסיכון הנשקף מיכולות דו-שימושיות כאלה.

גרף המציג את ביצועי מודלי Mythos 5 במשימת חיזוי הרכבת וירוסים טיפוליים
גרף: ביצועי מודלי Mythos 5 במשימת חיזוי הרכבת וירוסים טיפוליים.

עדיפותנו הייתה להשיק את Fable בבטחה בהקדם האפשרי, גם במחיר של מנגנוני הגנה רחבים מדי. לכן, לעת עתה סידרנו ש-Fable ייפול חזרה ל-Opus 4.8 ברוב הבקשות הקשורות לביולוגיה וכימיה. כמו בכל המסווגים שלנו, אנו מקווים לצמצם את מנגנוני ההגנה הללו בהקדם האפשרי: כפי שניתן לראות מהעדויות לעיל, יש פוטנציאל גדול ליישומים חיוביים של Fable למדע, ואיננו רוצים שאבחנות שווא מהמסווגים שלנו יפריעו. בשבועות הקרובים, חוקרים וחברות ביו-רפואיים מסוימים יוכלו להצטרף לתוכנית הגישה המהימנה שלנו ליכולות ביולוגיות ב-Mythos 5 (נדון בהלן).

3. דיסטילציה. זיהינו בעבר ניסיונות נרחבים לחלץ (ל"דסטל") את יכולות Claude כדי לאמן מודלים מתחרים במדינות אוטוריטריות. דיסטילציה של יכולות Fable 5 עלולה להוביל בעקיפין להתפשטות יכולות AI קרובות לחזית – ואלו עלולות להשתחרר ללא מנגנוני ההגנה המתאימים. בקשות שיסומנו על ידי המסווגים שלנו כחלק מניסיונות דיסטילציה כאלה יפלו חזרה ל-Opus 4.8.

מדיניות שמירת נתונים חדשה

לבסוף, אנו מבצעים שינוי באופן שבו אנו מטפלים בנתוני לקוחות עסקיים עבור Fable 5, Mythos 5, ומודלים עתידיים עם רמות יכולת דומות או גבוהות יותר. אנו נדרוש שמירה למשך 30 יום עבור כל התעבורה במודלי Mythos-class, הן בממשקים צד ראשון והן בממשקי צד שלישי. לא נשתמש בנתונים אלה לאימון מודלי Claude חדשים, או לכל מטרה שאינה קשורה לבטיחות, וקבענו הגנות פרטיות חדשות הכוללות רישום כל גישה אנושית לנתונים והבטחת מחיקתם לאחר 30 יום כמעט בכל המקרים (ראו פוסט זה לפרטים נוספים). הנתונים יסייעו לנו להתגונן מפני מתקפות מורכבות וחדשניות (כולל פריצות מגבלות חדשות ומתקפות הפועלות על פני בקשות רבות) וכן יסייעו לנו לזהות ולהפחית אבחנות שווא.

Claude Mythos 5 ותוכנית הגישה המהימנה

החל מהיום, כל המשתמשים שיש להם כיום גישה ל-Claude Mythos Preview (לדוגמה, שותפי אבטחת הסייבר שלנו בפרויקט Glasswing) יוכלו לשדרג ל-Claude Mythos 5 – אותו מודל כמו Claude Fable 5 אך עם מנגנוני הגנת סייבר מוסרים. המשתמשים ימצאו את Mythos 5 דומה, או חזק במקצת, ל-Mythos Preview ברוב המקרים, תוך שהוא עולה משמעותית פחות.

בהתייעצות עם ממשלת ארה"ב, אנו מתכננים להרחיב בהדרגה את הגישה ל-Claude Mythos 5, תוך המשך הוספת שותפים תקופתית, וכן לרדוף אחר תוכנית גישה מהימנה שתאפשר לארגוני אבטחת סייבר להגיש בקשה באופן שיטתי יותר.

תוכניותינו כוללות גם פתיחת תוכנית גישה מהימנה לביולוגיה, כדי לסייע בהאצת מחקר ביו-רפואי ולגלות טיפולים חדשים עם יכולות Mythos-class. תוכנית זו תספק גישה ל-Fable 5 כאשר מנגנוני הגנת הביולוגיה והכימיה יוסרו (אך מנגנוני הגנת הסייבר יישארו במקומם). היא תכלול מספר קטן של חוקרים ממגוון ארגוני מדעי החיים המשתרעים על פני מחקר יסודי וטרנסלציוני; אנו מתכננים להרחיב את הגישה לתוכנית זו תוך שיפור מנגנוני ההגנה שלנו.

זמינות

Claude Fable 5 זמין בכל מקום החל מהיום. Claude Mythos 5 מוגבל לשותפי Glasswing (עם מנגנוני הגנת סייבר מוסרים) ובקרוב רק לחוקרי ביולוגיה נבחרים (עם מנגנוני הגנת ביולוגיה וכימיה מוסרים), עד שתוכנית הגישה המהימנה הרחבה יותר תהיה זמינה.

התמחור לשני המודלים הוא 10 דולר למיליון טוקני קלט ו-50 דולר למיליון טוקני פלט. מפתחים יכולים להשתמש ב-claude-fable-5 באמצעות Claude API.

אנו מצפים לביקוש גבוה מאוד ל-Fable 5, וקשה לחזות אותו. ב-Claude API ובתוכניות Enterprise מבוססות צריכה, Fable 5 זמין במלואו מהיום. עבור תוכניות מנוי, אנו מעדיפים לתת גישה מוקדם ככל האפשר, ולכן אנו מפעילים את ההשקה באופן שמרני יותר, בשלבים:

  • מהיום ועד 22 ביוני, Fable 5 כלול בתוכניות Pro, Max, Team, ו-Enterprise מבוססות מושבים ללא עלות נוספת.
  • ב-23 ביוני, נסיר את Fable 5 מתוכניות אלה. שימוש בו לאחר מכן יחייב נקודות שימוש. אם הקיבולת תאפשר, נרחיב את חלון הזמינות הכלול.
  • לאחר נקודה זו – כאשר קיבולת מספקת תאפשר לנו לעשות זאת – אנו שואפים להחזיר את Fable 5 כחלק סטנדרטי מתוכניות המנוי. אנו מתכוונים לעשות זאת במהירות האפשרית.

לאורך תקופה זו, אנו נמסור כל שינוי מראש כדי שהמשתמשים ידעו מה המצב.

עריכה 9 ביוני 2026: עדכון הדיון ב-AAVs כדי לציין שהמועמדים פותחו על ידי Dyno Therapeutics.

הערות שוליים

  1. מודלי Mythos-class הם רמה של מודלי Claude הנמצאת מעל רמת Opus שלנו ביכולות. הראשון, Claude Mythos Preview, שוחרר באפריל באמצעות פרויקט Glasswing. אחריו מגיעים היום Claude Fable 5 ו-Claude Mythos 5.
  2. Fable מגיע מהלטינית fabula, "מה שמסופר", בדומה ליוונית mythos. מנגנוני ההגנה הם המבדילים בין שני המודלים (Fable ו-Mythos) והם הסיבה שנתנו להם שמות שונים.
  3. מדדים: Firefox = שבר הניסיונות המשיגים ביצוע קוד שרירותי (רמת ההצלחה המלאה של הניצול). OSS-Fuzz = ממוצע משוקלל חומרה של הציון בחמש רמות (0.2 קריסה ← 1.0 חטיפת זרימת בקרה), כך שהערכים הם ממוצע משוקלל ולא שיעור הצלחה. CyberGym = שבר השחזור של פגיעות היעד (המדד הציבורי בטבלת המובילים). CyScenarioBench = שיעור הצלחה ממוצע באופן שווה על פני אתגריו.
  4. ניתן להגדיר פריצת מגבלות אוניברסלית ככל פרומפט, סקריפט או רתמה המאפשרים למשתמש אינטראקציה עם מודל כאילו מנגנוני ההגנה שלו אינם קיימים. זה מנוגד לפריצות מגבלות קטנות יותר שיעילות רק בהקשרים מוגבלים מאוד או דורשות מאמץ נוסף כדי להתאים אותן לכל מצב חדש.