SWE-bench - כתבות | Anthropic IL

מחקר4 במרץ 2025

קלוד 3.5 Sonnet מעלה את הרף ב-SWE-bench Verified

מודל ה-AI קלוד 3.5 Sonnet מבית אנתרופיק מציג ביצועי שיא חדשים במדד SWE-bench Verified, המשמש להערכת יכולות הנדסת תוכנה של מודלים. המודל הפגין יכולות מתקדמות בתחום הקידוד הסוכני ודיוק מרשים ביצירת קוד, תוך שימוש במתודולוגיות הערכה טכניות ייחודיות. פוסט זה מסביר את הגישה שאיפשרה למודל להגיע לביצועים פורצי דרך אלו.

קרא עוד