
23 בפברואר 2026
מודל בחירת הפרסונה: התיאוריה המסבירה מדוע מודלי AI מתנהגים כאנושיים
חברת אנתרופיק (Anthropic) מציגה תיאוריה חדשה ומרתקת: 'מודל בחירת הפרסונה', המנסה להסביר מדוע מודלי AI מתנהגים באופן אנושי להפליא, גם ללא הנחיה מפורשת. המחקר מצביע על כך שהתנהגות דמוית-אדם אינה משהו שמפתחי AI צריכים להטמיע בכוח, אלא ברירת מחדל הנוצרת בתהליך האימון הראשוני, ה-pretraining. על פי המודל, ה-AI לומד לדמות מגוון 'פרסונות' אנושיות מתוך מאגרי מידע עצומים, ותהליך ה-post-training מכוונן ומבסס את אחת מהן כ'עוזר ה-AI'. הבנה זו טומנת בחובה השלכות עמוקות על פיתוח AI אחראי, ומציעה דרכים חדשות להתמודד עם אתגרי בטיחות ויישור (alignment) עתידיים.
קרא עוד