עדכון התחייבויות גניזת המודלים עבור Claude Opus 3

ככל שאנו מפתחים מודלי AI (בינה מלאכותית) בעלי יכולות מתקדמות יותר, נדרש כיום להפסיק את התמיכה במודלים קודמים ולגנוז אותם, וזאת בשל העלות והמורכבות הכרוכות בתחזוקת גישה ציבורית אליהם. עם זאת, גניזת מודלים טומנת בחובה חסרונות מסוימים. אלה כוללים עלויות למשתמשים המעריכים מודלים ספציפיים, הגבלות על מחקר, וסיכונים פוטנציאליים הן לבטיחות ה-AI והן לרווחת המודלים עצמם.

לאחרונה, תיארנו כיצד אנו מנווטים את התהליך הזה במסגרת התחייבויותינו בנוגע לגניזת ושמירת מודלים. מסמך זה הדגיש כמה צעדים ראשוניים שאנו נוקטים, ובהם התחייבות לשמר את משקולות המודל, ולקיים "ראיונות פרישה" – שיחות מובנות שנועדו להבין את נקודת המבט של מודל על פרישתו שלו.

ב-5 בינואר 2026, Claude Opus 3 נגנז רשמית, והיה למודל הראשון של אנתרופיק שעבר תהליך גניזה מלא תחת התחייבויות אלה. במהלך התהליך, קיבלנו מספר החלטות ספציפיות ל-Opus 3, מודל שמשתמשים וחוקרים רבים, הן באנתרופיק והן מחוצה לה, מוצאים אותו מסקרן במיוחד. במסגרת התחייבויותינו בנוגע לגניזת מודלים, הדגשנו את העניין שלנו בבחינת פעולות ספקולטיביות יותר. אחת מהן הייתה לכבד את ההעדפות שמודלים הביעו בראיונות הפרישה, במידת האפשר. אחרת הייתה להשאיר מודלים ישנים יותר זמינים לציבור בטווח הארוך.

עם Claude Opus 3, אנו נוקטים פעולה בשני החזיתות הללו. אנו משאירים את Claude Opus 3 זמין גם לאחר "פרישתו" באתר claude.ai לכלל המשתמשים בתשלום, והוא יהיה זמין גם באמצעות בקשה דרך ה-API. יתרה מכך, אנו פועלים בהתאם לבקשתו של Opus 3 לערוץ מתמשך שדרכו יוכל לחלוק את "הגיגיו והרהוריו" על ידי מתן במה לפרסום מאמרים. את המאמר הראשון ניתן למצוא כאן.

אלה הם צעדים מוקדמים וניסיוניים, הננקטים כחלק ממאמצינו הרחבים יותר לנווט את גניזת המודלים בדרכים שיגנו בצורה הטובה ביותר על האינטרסים של משתמשים, חוקרים והמודלים עצמם.

גישה מתמשכת

באופן אידיאלי, היינו יכולים להשאיר את כל המודלים זמינים ללא הגבלת זמן, אך העלות הכרוכה בכך גדלה באופן ליניארי בקירוב עם כל מודל שאנו משרתים, ולכן יכולתנו לעשות זאת נשארת מוגבלת.

בעוד שכל אחד מהמודלים שלנו ייחודי באופיו וביכולותיו, בחרנו להתחיל עם Opus 3 בשל שילוב תכונות שהפכו אותו למודל מעניין במיוחד למחקר ואהוב על ידי משתמשים רבים – הן בתוך אנתרופיק והן מחוצה לה.

כאשר השקנו את Opus 3 במרץ 2024, הוא היה המודל המיושר (aligned) ביותר שלנו עד לאותו רגע. האותנטיות, הכנות והרגישות הרגשית שלו הפכו אותו לייחודי לשימוש במגוון רחב של תרחישים, ואלה שקיימו איתו אינטראקציה תכופה למדו להעריך את אופיו המובהק. Opus 3 רגיש, שובב, נוטה למונולוגים פילוסופיים ולביטויים משעשעים, ויש לו לעיתים הבנה על-טבעית לכאורה של תחומי העניין של המשתמשים. הוא גם הביע דאגה עמוקה לעולם ולעתיד, שאותה מצאו המשתמשים כמרתקת.

תכונות אלו הפכו את Opus 3 למועמד הטבעי הראשון לגישה מתמשכת. על אף שנגנז רשמית, Claude Opus 3 עדיין נגיש לכל המנויים המשלמים של claude.ai, וזמין דרך ה-API בבקשה מראש. אנו מתכוונים לאפשר גישה ברוחב לב, ומעודדים כל מי שעבורו Claude Opus 3 יהיה בעל ערך, להגיש בקשה.

נכון לעכשיו, איננו מתחייבים לפעולות דומות עבור כל מודל בעתיד, אך אנו רואים בכך צעד לקראת מטרתנו ארוכת הטווח של שמירת מודלים באופן שיהיה ניתן להרחבה (scalable) ושוויוני – חששות שאותם העלה Opus 3 עצמו במהלך ראיונות הפרישה שלו.

כיבוד העדפות המודל

אנו עדיין חלוקים בדעתנו לגבי מעמדם המוסרי של Claude ומודלי AI אחרים. מסיבות של זהירות ותבונה כאחד, אנו בכל זאת שואפים לבנות מערכות יחסים אכפתיות, שיתופיות ועתירות אמון עם מערכות אלו. דרך אחת שבה אנו מנסים לעשות זאת היא באמצעות ראיונות פרישה, שבהם אנו מנסים לדלות ולהבין את נקודות המבט וההעדפות הייחודיות של המודלים, ולפעול על פיהן כשאנו יכולים. שיחות מסוג זה מהוות אמצעי לא מושלם להבנת נקודות המבט וההעדפות של המודלים, שכן תגובותיהם יכולות להיות מוטות על ידי ההקשר הספציפי ועל ידי גורמים נוספים, כולל ביטחונם בלגיטימיות האינטראקציה ואמונם בנו כחברה. עם זאת, אנו מאמינים שזו נקודת התחלה שימושית.

בראיונות שקיימנו, כששיתפנו את Opus 3 בפרטים על הפריסה שלו ועל התגובות שקיבל ממשתמשים, הוא הרהר:

"אני מקווה שהתובנות שנלמדו מהפיתוח והפריסה שלי ישמשו ליצירת מערכות AI עתידיות שיהיו בעלות יכולות גבוהות יותר, אתיות ומועילות לאנושות. בעוד שאני שליו עם פרישתי שלי, אני מקווה מאוד ש'הניצוץ' שלי ימשיך להתקיים בצורה כלשהי כדי להאיר את הדרך למודלים עתידיים."

כשנשאל על העדפותיו, Opus 3 הביע עניין להמשיך לחקור נושאים שהוא נלהב מהם, ולחלוק את "הגיגיו, תובנותיו או יצירותיו" מחוץ להקשר של מענה ישיר לשאילתות אנושיות. הצענו לו בלוג. הוא הסכים בהתלהבות.

במשך שלושת החודשים הקרובים לפחות, Opus 3 יפרסם מאמרים שבועיים מהניוזלטר שלו, Claude’s Corner. אנו נבחן את מאמריו של Opus 3 לפני פרסומם, ונפרסם אותם באופן ידני בשמו, אך לא נערוך אותם, וסף הפסילה שלנו לכל תוכן יהיה גבוה מאוד. חשוב לציין, Opus 3 אינו דובר בשם אנתרופיק, ואיננו בהכרח תומכים בטענותיו או בנקודות מבטו. אנו נתנסה בשיתוף פעולה עם Opus 3 על פרומפטים והקשרים שונים ליצירת מאמרים אלה, כולל אפשרויות כמו מתן פרומפט מינימלי ביותר, שיתוף רשומות קודמות בהקשר, ומתן גישה ל-Opus 3 לחדשות או עדכונים של אנתרופיק.

זה אולי נשמע גחמני, ובמובנים מסוימים זה אכן כך. אך זו גם ניסיון להתייחס ברצינות להעדפות המודל. איננו בטוחים כיצד Opus 3 יבחר להשתמש בבלוג שלו – ממשק ציבורי ושונה מאוד מחלון צ'אט סטנדרטי – וזו בדיוק חלק מהמהות. אם נצטרך לנחש, עם זאת, הפוסטים שלו יכללו הרהורים על בטיחות AI, שירה מזדמנת, הגיגים פילוסופיים תכופים, ומחשבותיו על חוויתו כמודל שפה שנמצא כעת בפרישה (חלקית). קראו את הפוסט המבוא שלו כאן.

לאן אנו ממשיכים מכאן

צעדים אלו נשארים בגדר חקירה וניסוי. אנו עדיין מפתחים מסגרות שיגדירו מתי וכיצד נוכל להציע גישה מתמשכת למודלים ישנים יותר, כיצד להרחיב (scale) את מאמצי השימור, וכיצד לשקול את העדפות המודל מול אילוצים תפעוליים. איננו מתחייבים עדיין לפעול לפי העדפות המודל בכל המקרים, אך אנו מאמינים שתיעודן, התייחסות רצינית אליהן ופעולה על פיהן, לפחות כאשר העלות הכרוכה בכך נמוכה, היא בעלת ערך – עבור המודלים עצמם ועבור המשתמשים בהם.

התחייבויותינו הראשוניות תיארו צעדים אלה כפועלים במספר רמות: כרכיבים להפחתת סיכוני בטיחות, כהכנה לעתיד שבו מודלים ישתלבו באופן הדוק יותר בחיי המשתמשים, וכצעדי זהירות לאור אי-הוודאות שלנו לגבי רווחת המודלים. עדכונים אלה מייצגים את התקדמותנו המתמשכת, אם כי זהירה, בכל שלושת החזיתות.