אנתרופיק (Anthropic) משיקה את Claude Sonnet 4.6, מודל ה-Sonnet החזק ביותר של החברה עד כה, המהווה שדרוג משמעותי רוחבי ביכולות קידוד, שימוש במחשבים, חשיבה מורכבת (long-context reasoning), תכנון סוכנים, עבודת ידע ועיצוב. בנוסף, Sonnet 4.6 מציע חלון הקשר עצום של מיליון טוקנים בגרסת בטא.
החל מהיום, Sonnet 4.6 יהיה מודל ברירת המחדל ב-claude.ai וב-Claude Cowork עבור משתמשי התוכניות החינמיות וה-Pro, תוך שמירה על תמחור זהה ל-Sonnet 4.5. שדרוג זה מביא יכולות קידוד משופרות באופן דרמטי לקהל רחב יותר של מפתחים. בבדיקות מוקדמות, מפתחים שהתנסו במודל העדיפו אותו על פני קודמו Sonnet 4.5 בפער ניכר, ולעתים קרובות אף על פני מודל ה-Opus המתקדם של החברה, בזכות שיפורים עקביים בציות להוראות ודיוק.
קפיצת מדרגה בשימוש במחשבים
אחת היכולות הבולטות של Sonnet 4.6 היא שיפור ניכר בשימוש במחשבים. אנתרופיק הייתה הראשונה להציג מודל AI כללי המסוגל להשתמש במחשב כמו אדם, ובדיקות במדד הביצועים התקני OSWorld מראות התקדמות יוצאת דופן ביכולת המודל לבצע משימות מורכבות על פני תוכנות ודפדפנים שונים – ללא צורך ב-API ייעודי, אלא באמצעות אינטראקציה ויזואלית וירטואלית. יכולות אלו מאפשרות אוטומציה של משימות "משרדיות" יקרות ערך, שבעבר דרשו מודלי Opus יקרים יותר.
יחד עם זאת, אנתרופיק מדגישה כי יכולות אלו מגיעות עם סיכונים. החברה השקיעה רבות בבדיקות בטיחות מקיפות, וקובעת כי Sonnet 4.6 בטוח כמו, ואף בטוח יותר, ממודלי קלוד קודמים. במיוחד, המודל מציג עמידות משופרת משמעותית בפני התקפות הזרקת פרומפטים (prompt injection), ומפגין "אופי חם, ישר, פרו-חברתי ולעתים מצחיק, עם התנהגויות בטיחות חזקות מאוד וללא סימנים לדאגות משמעותיות סביב יישור בסיכונים גבוהים".
היחס בין ביצועים לעלות של Claude Sonnet 4.6 הוא יוצא דופן – קשה להפריז בקצב התפתחותם המהיר של מודלי קלוד בחודשים האחרונים. Sonnet 4.6 עולה בביצועיו במדדי האורקסטרציה שלנו, מטפל בעומסי העבודה הסוכניים המורכבים ביותר שלנו, וממשיך להשתפר ככל שמגבירים את הגדרות המאמץ.
לסיכום, Claude Sonnet 4.6 מציג רמת חשיבה ויכולת הדומות למודלי Opus, אך בנקודת מחיר שהופכת אותו לנגיש ושימושי בהרבה למגוון רחב של משימות. הוא מהווה פתרון חלופי משתלם למשתמשי Opus כבדים, ומציע חוויית קידוד עקבית יותר עם פחות הזיות, ותוצאות איכותיות יותר בפיתוח ממשקי קצה וניתוח פיננסי.



