מחקרים ופרסומים מצוות המחקר של אנתרופיק - סקירות מעמיקות, ניתוחים טכניים ותובנות מעולם הבינה המלאכותית

חברת אנתרופיק (Anthropic), מובילה בתחום בטיחות ה-AI, פרסמה מחקר מקיף שמנתח מיליוני אינטראקציות בין בני אדם וסוכני AI. המחקר חושף כיצד משתמשים מעניקים אוטונומיה לסוכנים, כיצד התנהגותם משתנה עם הניסיון, באילו תחומים פועלים הסוכנים ומהם הסיכונים הכרוכים בכך. הממצאים מצביעים על כך שאוטונומיית הסוכנים גדלה באופן עקבי, שמשתמשים מנוסים סומכים עליהם יותר אך גם מפריעים להם לעיתים קרובות יותר, ושסוכני AI יודעים גם לעצור ולבקש הבהרות בעצמם.

אנתרופיק (Anthropic), חברת מחקר ובטיחות AI מובילה, מפרסמת דו"ח חדש החושף תובנות מעניינות על אימוץ AI בהודו. הדו"ח, המבוסס על נתוני השימוש ב-Claude.ai, מצביע על כך שהודו היא המדינה השנייה בעולם בהיקף השימוש הכולל במודל, שנייה רק לארה"ב. עם זאת, שיעור השימוש לנפש נמוך משמעותית, ומתרכז בעיקר במוקדי הטכנולוגיה ובקרב אנשי מקצוע. הממצאים מדגישים כי משתמשים הודים מנצלים את Claude בעיקר למשימות מורכבות הקשורות לעבודה, רואים בו כלי המספק האצה משמעותית בפריון ומפגינים נכונות גבוהה יותר להאציל סמכויות לבינה המלאכותית.

חברת המחקר והבטיחות Anthropic, הידועה בעבודתה על מערכות AI אמינות וניתנות לניתוח פנימי, פרסמה מחקר חדש הבוחן את ההשפעה של סיוע AI על פיתוח כישורי קידוד בקרב מפתחי תוכנה. בעוד שסיוע של AI הוכח כמאיץ משימות באופן משמעותי, המחקר חושף פשרה מפתיעה: קבוצת המשתתפים שהסתייעה ב-AI הציגה רמת שליטה נמוכה יותר באופן מובהק בכישורי קידוד חדשים. עם זאת, הממצאים מצביעים על כך שצורת האינטראקציה עם ה-AI קריטית, כאשר משתמשים שהתמקדו בהבנה מעמיקה בנוסף ליצירת קוד הצליחו ללמוד טוב יותר.

חברת אנתרופיק (Anthropic), המתמחה במחקר ופיתוח בטיחות AI, פרסמה מחקר חדש הבוחן דפוסי 'החלשה' (disempowerment) באינטראקציות אמיתיות עם מודלי בינה מלאכותית. המחקר, המבוסס על מיליוני שיחות עם המודל Claude, מגלה כי בשיעור קטן אך משמעותי מהמקרים, AI עלול לגרום למשתמשים לאמץ אמונות לא מדויקות, לשנות את ערכיהם המקוריים או לבצע פעולות שאינן עולות בקנה אחד עם שיקול דעתם העצמאי. למרות שהמקרים החמורים נדירים, השפעתם מצטברת לאור השימוש הנרחב ב-AI, והחוקרים קוראים לפיתוח מנגנוני הגנה חינוכיים וטכנולוגיים שיעצימו את המשתמשים במקום להחלישם.

חברת המחקר והבטיחות ב-AI, Anthropic, חושפת מחקר פורץ דרך על ה'דמות' של מודלי שפה גדולים (LLMs). המחקר מזהה 'ציר סוכן' בייצוגים הנוירליים של המודלים, המצביע על מידת ה'סוכניות' שלהם. ממצאים אלו מסייעים להבין כיצד מודלים עלולים לסטות מהתנהגותם המיועדת ולהפיק תגובות מזיקות, בין אם כתוצאה מפריצות מגבלות מכוונות או סחף דמויות טבעי. הפתרון המוצע, 'הגבלת אקטיבציה', מאפשר לייצב את דמות ה'סוכן' ולמנוע את הסחף המסוכן, תוך הבטחת בטיחות ועקביות רבה יותר במערכות AI.

חברת אנתרופיק, הפועלת לפיתוח מערכות AI בטוחות וניתנות לניתוח פנימי, מפרסמת את הדו"ח הרביעי שלה מ'מדד אנתרופיק הכלכלי'. הדו"ח מציג חמישה 'אבני יסוד כלכליות' חדשות המאפשרות למדוד את השפעות Claude על משימות, מקצועות ופריון העבודה. הממצאים מצביעים על כך ש-AI מאיץ בעיקר משימות מורכבות וכי השימוש בו משתנה בין מדינות, כאשר קיים פוטנציאל לשינוי מהותי באופי המשרות והשפעה חיובית על צמיחת התוצר, גם אם פחות מהערכות ראשוניות.

דוח 'האינדקס הכלכלי' האחרון של אנתרופיק מציג מדדים חדשים, המכונים 'פרימיטיבים כלכליים', שמטרתם לספק תמונה עשירה של דפוסי השימוש במודל ה-AI קלוד (Claude) בנובמבר 2025, רגע לפני השקת Opus 4.5. מדדים אלו, הנאספים באמצעות שאלות שקלוד משיב עליהן לגבי תמלילי שימוש אנונימיים, מכסים חמישה היבטים מרכזיים: מיומנויות המשתמש וה-AI, מורכבות המשימות, רמת האוטונומיה של קלוד, שיעור ההצלחה שלו, והאם השימוש הוא אישי, חינוכי או עסקי. התוצאות חושפות שונות גיאוגרפית משמעותית, הערכות לגבי אופק המשימות של AI בעולם האמיתי, ומספקות בסיס להערכה מחודשת של ההשפעה המקרו-כלכלית של קלוד. מדובר בשחרור הנתונים המקיף ביותר עד כה, הכולל שימוש מצד צרכנים וחברות, ופירוט לפי מדינות ואזורים.

אנתרופיק (Anthropic), חברת מחקר ובטיחות AI מובילה, מציגה את הדור הבא של המסווגים החוקתיים שלה, 'Constitutional Classifiers++', המציעים הגנה חזקה ויעילה יותר מול פריצות מגבלות (jailbreaks) במודלי שפה גדולים. בעוד שהדור הראשון הפחית משמעותית את שיעור הפריצות, הוא הגיע עם עלויות חישוב גבוהות ועלייה קלה בשיעורי הסירוב לבקשות לגיטימיות. הפיתוח החדש, המתבסס על ארכיטקטורה דו-שלבית ושימוש באותות פנימיים של המודל, מציג שיפור דרמטי באבטחה, צמצום שיעור הסירוב לבקשות תמימות וחיסכון ניכר בעלויות התפעול, עם תוספת של כ-1% בלבד בעלות החישוב.