
הנדסה17 בדצמבר 2024
קלוד 3.5 Sonnet קובע שיא חדש ב-SWE-bench Verified
מודל ה-AI המתקדם Claude 3.5 Sonnet של אנתרופיק מציג פריצת דרך מרשימה במדד SWE-bench Verified, המעידה על יכולות הנדסת תוכנה מתקדמות ודיוק יוצא דופן ביצירת קוד. הכתבה סוקרת את שיטות ההערכה הטכניות שאומצו ומסבירה כיצד הסוכן, שנבנה סביב המודל, מנצל את יכולותיו באופן אופטימלי כדי לפתור בעיות קידוד מורכבות. המודל קובע שיא חדש במדד, ועוקף את מודל החזית הקודם עם ציון של 49%, וממחיש את הפוטנציאל הגלום בו למפתחים.
קרא עוד