סוכני קידוד ובינה מלאכותית: מה חושבים חוקרי מדעי החברה?

כיצד סוכני קידוד AI משנים את האופן שבו אנו חוקרים את הכלכלה והחברה?

מדעי האנוש עוברים שינוי מהותי: לראשונה, משימות מחקר מרכזיות ניתנות להעברה למכונות. צ'אטבוטים של AI תורמים יותר ויותר למחקר מדעי, כולל בפרסומים יוקרתיים ובמדעי החברה. שינוי זה עורר אופטימיות בנוגע לפוטנציאל של AI להגביר את פרודוקטיביות המחקר – אך בד בבד גם חששות מפני עומס יתר על תהליכי ביקורת עמיתים ומבול של תכנים אקדמיים באיכות ירודה שייוצרו על ידי AI.

אך בעוד שצ'אטבוטים של AI, הפועלים בסבבי שיח, שימשו בעיקר לסיוע בכתיבה, סוכני קידוד יכולים לבנות מחדש את המחקר במדעי החברה באופן רדיקלי יותר. פלטפורמות קידוד סוכנייות כמו Claude Code ו-Codex יכולות לקחת רעיון מחקרי ומאגר נתונים, לכתוב ולהריץ ניתוח, לפרש את התפוקה ולבצע איטרציות באופן אוטונומי. מה שבעבר נחשב לשלבים אנושיים שאין מנוס מהם במחקר אמפירי, יכול לראשונה להיות ממוכן. במקרים קיצוניים, חוקרים בנו צינורות עבודה מרובי-סוכנים לאוטומציה של מחקר במדעי המחשב ולביצוע אוטונומי של רעיונות מחקר במדעי החברה.

כלים אלו יכולים להאיץ את המדע ולהפוך אותו לנועז יותר: ביצוע מחקר מהיר אמור להוביל לגילויים רבים וזולים. עם זאת, הם עלולים גם להגביר את הפערים במשאבי המחקר ולהחריף את העומס בתיעוד האקדמי. באופן עמוק יותר, ככל ש-AI מטפלת במגוון רחב יותר של משימות מחקר, הבחירות האנליטיות הייחודיות שלה עלולות להשפיע על ההבנה הקולקטיבית שלנו את הכלכלה, החברה ואת עצמנו.

בפוסט זה, אנו מציגים הצצה ראשונה, המבוססת על סקר בקרב 1,260 חוקרי מדעי חברה כמותיים שנערך בתחילת 2026. הסקר מהווה את שלב הבסיס במחקר גדול ומתמשך הבוחן כיצד סוכני קידוד משפיעים על פרודוקטיביות המחקר, כולל ניסוי אקראי המספק לחוקרים גישה ל-Claude Code. תוצאות ניסוי זה יפורסמו בעתיד. לעת עתה, אנו מציגים את ממצאי סקר הבסיס לגבי זהות המשתמשים בכלים אלה, מטרות השימוש שלהם; כיצד התפוקה שונה בין משתמשים ללא-משתמשים; ומה חוקרים צופים לגבי ההשלכות של אימוץ נרחב יותר.

סקר חדש על השימוש בסוכני קידוד AI בקרב חוקרי מדעי חברה כמותיים

הסקר נערך בסוף פברואר ומרץ 2026, וכוון לחוקרי מדעי חברה כמותיים פעילים. יש לציין כי מדובר במדגם שאינו מייצג – המשיבים גויסו למחקר שהציע גישה לחשבונות Claude Max, ולכן ייתכן שהבחירה במדגם נטתה לכיוון חוקרים סקרנים בנוגע לכלי AI. עם זאת, המשיבים היו דומים למדי למדגם קודם שקיבל הזמנה כללית יותר (ראו טבלה A2 בנספח).

המשיבים התחלקו באופן שווה בין כלכלה, מדע המדינה וסוציולוגיה, כאשר כל תחום היווה כחמישית מהמדגם, ומדעי הניהול ופסיכולוגיה מיד אחריהם (ראו טבלה A1). קיבלנו גם מספר קטן יותר של תגובות מחוקרים מתחומי בריאות הציבור, חינוך ותקשורת. כ-40% היו פרופסורים מן המניין או חברים, 25% היו מרצים בכירים, וכ-30% היו דוקטורנטים.

סוכני קידוד עדיין לא הגיעו לרוב חוקרי מדעי החברה

מדדנו את השימוש הכללי ב-AI בשתי דרכים. ראשית, שאלנו: “האם השתמשת בעבר במודלי AI גנרטיביים כדי לסייע לתהליך המחקר שלך?” 81% מהמשיבים ענו בחיוב.

אך מה לגבי אלה שאימצו בפועל סוכני קידוד בעלי יכולות הולכות וגדלות לתוך תהליך העבודה שלהם? כאן, שאלנו: “האם אתה משתמש באופן קבוע (יותר מפעם בשבוע) בעוזר קידוד AI המשולב בשורת הפקודה שלך (כמו Codex, Cursor או Claude Code)?” בשאלת המשך, אימתנו שהם השתמשו באחד מהכלים הללו (או ב-Google Antigravity).¹

רק 20% מהמשיבים משתמשים בסוכני קידוד. הסקר שלנו נערך כשחודשיים לאחר גל דיונים סוער סביב Claude Code ו-Opus 4.6 שהחל בסוף דצמבר 2025. אך גם בקרב משיבים מתעניינים שבחרו להשתתף בסקר, רק חמישית אימצו סוכנים לתוך תהליך העבודה שלהם. Claude Code הוא כלי סוכן הקידוד הנפוץ ביותר שדווח עליו, כאשר 86% מהמשתמשים דיווחו על שימוש ב-Claude Code (31% דיווחו על שימוש ב-Codex, הכלי הנפוץ הבא בתור).

גרף עמודות המציג את אחוז חוקרי מדעי החברה המשתמשים בסוכני קידוד AI לפי דיסציפלינה. — אימוץ סוכני קידוד בקרב חוקרים, לפי דיסציפלינה אקדמית.

האימוץ אינו אחיד כלל

איור 1 מראה כי קיים שוני ניכר בשיעור האימוץ הכולל, מ-39% בקרב כלכלנים ו-25% בקרב חוקרי מדע המדינה, ועד אחוזים בודדים בתחומי בריאות הציבור (6%), חינוך (4%) ותקשורת (6%). שיפוע זה עוקב בקירוב אחר הבדלים בין תחומים בשימוש הכללי ב-AI, אך ההבדלים באימוץ סוכני קידוד חדים יותר בממוצע.

קצת יותר מרבע מהדוקטורנטים ופוסט-דוקטורנטים משתמשים בסוכני קידוד לפחות פעם בשבוע; בקרב פרופסורים מן המניין, שיעור זה יורד ביותר מחצי. החוקרים המאמצים סוכני קידוד הם הצעירים יותר – בעלי אוריינות טכנולוגית גבוהה יותר, נוטים לעבוד ישירות עם קוד ונתונים, ועומדים בפני לחצי קריירה חזקים יותר להפקת מחקר.

גרף עמודות המציג את אחוז חוקרי מדעי החברה המשתמשים בסוכני קידוד AI לפי שלב בקריירה האקדמית. — אימוץ סוכני קידוד בקרב חוקרים, לפי שלב הקריירה.

הבדלי האימוץ חורגים מתחום הדיסציפלינה ושלב הקריירה. סיווגנו את שמות החוקרים לפי מגדר ומצאנו כי אלה עם שמות הנחשבים גבריים באופן טיפוסי אימצו סוכני קידוד בשיעור הגבוה פי שניים מזה של משיבות עם שמות הנחשבים נשיים. גם אוניברסיטאות יוקרתיות ופרטיות מציגות שימוש גבוה יותר באופן בולט. כל ההבדלים הללו מובהקים סטטיסטית (p<0.05). הבדלים אלה חדים יותר מההבדלים בשימוש הכללי ב-AI, ומעידים על אי-שוויון רב יותר, לפחות בתקופה מוקדמת זו של אימוץ סוכני קידוד.

הפער המגדרי בשימוש בסוכני קידוד אינו משקף רק פער בשיעורי ההתנסות ב-AI. בקרב משיבים שניסו להשתמש ב-AI למחקר, קיים פער מגדרי גדול אף יותר בשימוש קבוע בסוכני קידוד מאשר במדגם הכולל. הבדלים אלו נשמרים גם בהשוואה בין מגדרים בתוך אותן דיסציפלינות ושלבי קריירה.

גרף עמודות המציג את אחוז חוקרי מדעי החברה המשתמשים בסוכני קידוד AI לפי מגדר ואוניברסיטה. — אימוץ סוכני קידוד בקרב חוקרים, לפי מגדר וסוג אוניברסיטה.

חוקרים משתמשים ב-AI בעיקר לקידוד ועריכה, לא לכתיבה

בקרב חוקרים המשתמשים ב-AI, בין אם באמצעות סוכני קידוד או צ'אטבוטים, לשם מה הם משתמשים בה בפועל? הדיון סביב AI במחקר אקדמי התמקד רבות בכתיבה: סקירות ספרות הזויות, ביטויים כמו “זה לא X, זה Y” המפוזרים במבואות פורמליים, והאפשרות לכתיבת מאמרים אוטומטית לחלוטין.

אך איור 4 מראה כי השימוש הנפוץ ביותר, הן בקרב משתמשי סוכני קידוד והן בקרב משתמשי AI אחרים, הוא לקידוד ניתוח נתונים כמותיים: 97% ממשתמשי סוכני קידוד ו-77% ממשתמשי AI אחרים מדווחים על שימוש בכלי ליצירת קוד. השימוש הבא בתור הוא עריכת טקסט, ולאחר מכן בקשת ייעוץ מתודולוגי ורקע על מחקר קודם. בסיכום על פני כלל משתמשי ה-AI, רק כשליש השתמשו בכלי כלל לניסוח טקסט. דפוסים אלו נשמרים באופן כללי בכל הדיסציפלינות, כאשר רק כלכלנים וחוקרי ניהול משתמשים ב-AI באופן נפוץ לניסוח טקסט.

גרף עמודות המציג את אחוזי השימוש של חוקרי מדעי החברה ב-AI למשימות שונות (קידוד, עריכת טקסט, ייעוץ מתודולוגי, ניסוח טקסט) לפי סוג המשתמש (עם סוכני קידוד / בלי). — שימושים עיקריים ב-AI בקרב חוקרים, לפי סוג השימוש ב-AI.

משתמשי סוכני קידוד מפרסמים יותר Working Papers ושולחים יותר הצעות למענקים, אך לא מגישים יותר לכתבי עת

האם סוכני קידוד הופכים חוקרים לפרודוקטיביים יותר? זו השאלה המניעה את המחקר הרחב יותר שסקר זה מהווה את נקודת הפתיחה שלו. הניסוי שאנו עורכים בנושא עדיין נמשך. אך סקר הבסיס מאפשר לנו להשוות בין משתמשי סוכני קידוד לאחרים על פני מגוון רחב של נקודות בדיקה בתהליך המחקר. השוואה זו היא תיאורית בלבד: אנו משווים בין חוקרים הבוחרים להשתמש בסוכני קידוד לבין אלה שאינם, ומצפים ששתי הקבוצות נבדלות במספר דרכים שאיננו יכולים להתאים אליהן. אין לפרש הבדלים אלה כסיבתיים, אלא כהשוואה ראשונית בין חוקרים המשתמשים בסוכני קידוד לאלה שאינם.

גרף עמודות המציג את התפוקה המחקרית (פרויקטים שהחלו, Working Papers, מענקים, הגשות לכנסים, הגשות לכתבי עת) של חוקרי מדעי החברה, בהשוואה בין משתמשי סוכני קידוד ללא-משתמשים. — תפוקת מחקר בקרב משתמשי סוכני קידוד לעומת שאינם משתמשים.

איור 5 מציג תפוקה שדווחה עצמית במהלך ששת החודשים שקדמו לסקר, בשלבים שונים של תהליך המחקר, מפרויקטים שהחלו ועד מאמרים שהוגשו. ההערכות המותאמות משוות בין משתמשי סוכני קידוד לאחרים, תוך בקרה על שלב הקריירה, דיסציפלינה והשבוע בו מילאו את הסקר. משתמשי סוכני קידוד מתחילים יותר פרויקטים, מפרסמים יותר Working Papers, מגישים יותר בקשות למענקים, ואף ייתכן ששולחים יותר הגשות לכנסים.

אז האם משתמשי סוכני קידוד כותבים יותר מאמרים? ראשית, נבחן את ההבדלים בתפוקה המוקדמת בצינור המחקר בין משתמשי סוכני קידוד לאחרים. משתמשי סוכני קידוד מתחילים פרויקטים בקצב של כרבע מאמר יותר ומפרסמים כמחצית Working Paper יותר מאשר משתמשים שאינם. במונחים אחוזים, משתמשי סוכני קידוד נראים פרודוקטיביים יותר בכ-10% (פרויקטים אמפיריים שהחלו) ועד 75% (Working Papers שפורסמו) מאחרים באותה דיסציפלינה ובאותו שלב בקריירה.

עם זאת, הבדל פרודוקטיביות זה מופיע רק עבור מדדי צינור מחקר מוקדמים אלה. לא מצאנו ראיות לכך שמשתמשי סוכני קידוד מגישים יותר מאמרים חדשים לכתבי עת או מגישים מחדש מאמרים מהר יותר. ייתכן שזה משקף את לוחות הזמנים להשלמת מאמר לקראת הגשה, שכן השימוש בסוכני קידוד הוא תופעה חדשה יחסית. אך ייתכן גם שסוכני קידוד שימושיים יותר להנעת פרויקטים מאשר לשלבי הליטוש הסופיים של מאמר לקראת הגשה לכתב עת.

חוקרים מצפים מכלי AI להעלות את הפרודוקטיביות, אך בטוחים פחות שהם ישפרו את מדעי החברה בכללותם

שאלנו חוקרים גם למה הם מצפים מכלי AI. האם AI הופכת חוקרי מדעי החברה לפרודוקטיביים יותר, במונחים של כתיבת מאמרים הניתנים לפרסום? והאם הם חושבים ש-AI תשפר או תפגע במדעי החברה בכללותם?

חוקרים אופטימיים לגבי העלאת פרודוקטיביות כתיבת מאמרים באמצעות AI. בסולם של 1 עד 10, 88% מהמשיבים דירגו מעל 5, ומחציתם דירגו 8 ומעלה. איור 6 מראה כי דירוגים אלו משתנים באופן ניכר עם השימוש ב-AI. הצד השמאלי של הגרף מראה שחוקרים המשתמשים ב-AI ליותר סוגי משימות אופטימיים יותר. הצד הימני מראה שמשתמשי סוכני קידוד אופטימיים יותר מאחרים.

גרף המציג את מידת האופטימיות של חוקרי מדעי החברה לגבי השפעת AI על פרודוקטיביות כתיבת מאמרים והשפעת AI על מדעי החברה ככלל, לפי רמת וסוג השימוש ב-AI. — אופטימיות החוקרים לגבי השפעת AI, לפי השימוש בכלי.

הסקר נערך בקרב אנשים המעוניינים להתנסות בכלים אלה, ולכן אין זה מפתיע לראות רמה מסוימת של אופטימיות לגבי פרודוקטיביות. אך גם בקרב אופטימיסטים אלה, קיים פער אמיתי בין התפיסות לגבי סיוע צר של AI בכתיבת מאמרים הניתנים לפרסום לבין השפעה רחבה יותר על מדעי החברה. 70% מהמשיבים אופטימיים יותר לגבי פרודוקטיביות כתיבת מאמרים מאשר לגבי השפעה רחבה יותר על התחום. מעט חוקרים אופטימיים יותר לגבי השפעות רחבות על התחום מאשר לגבי פרודוקטיביות כתיבת מאמרים, ורבים מהם פסימיים יותר.

דיון

חוקרי מדעי החברה המשתמשים בסוכני קידוד מפרסמים יותר Working Papers ומגישים יותר בקשות למענקים. יחסית לאחרים בתחומם ובשלב הקריירה שלהם, הם גם מתחילים יותר פרויקטים. אך נכון למרץ 2026, הם עדיין אינם מובילים לעלייה חדה בהגשות לכתבי עת. הגידול במספר הפרויקטים שהחלו עשוי להיות עדות מוקדמת לעלייה בפרודוקטיביות. הוא יכול גם להעיד על כך שהמאמצים הראשונים היו ממילא חוקרים פרודוקטיביים יותר.

בסך הכל, האימוץ המוקדם של סוכני קידוד נטה לכיוון חוקרים בתחילת דרכם, גברים, ואלה השייכים לאוניברסיטאות בעלות מעמד גבוה יותר. השימוש בסוכני קידוד אינו מחולק באופן אחיד בין קטגוריות אלו לעומת השימוש ב-LLM באופן רחב יותר. אנו מוצאים גם עדויות המרמזות כי חוקרים חוששים שהיתרונות המיידיים של עלייה בפרודוקטיביות כתיבת מאמרים עלולים להגיע יחד עם עלויות ברמת התחום. אולי יותר מאמרים פירושם עומס ותחרות על תשומת לב; אולי המשיבים חוששים שחוקרים מסוימים ישתמשו בכלי AI בדרכים שיחריפו בעיות קיימות במדעי החברה, כמו דיווח סלקטיבי ומחקר מצטבר וזהיר מדי.

לממצאים המוצגים בדוח זה מספר הסתייגויות. הנתונים מבוססים על סקר דוא"ל בקרב חוקרי מדעי חברה כמותיים, שגויסו במפורש כדי להשתתף במחקר על תהליכי עבודה ושימוש ב-AI. אנו מצפים שהמשיבים הם גם משתמשים כבדים יותר וגם אופטימיים יותר לגבי LLM מאשר לא-משיבים. את הבדלי הפרודוקטיביות בשלב המוקדם שאנו רואים יש לפרש באופן תיאורי. המאמצים הראשונים של סוכני קידוד עשויים להיות פרודוקטיביים יותר ושונים בדרכים רבות אחרות ממי שאינם מאמצים, דרכים שאיננו יכולים למדוד ישירות בסקר. לבסוף, אנו בוחנים כאן רק את מספר הפרויקטים שחוקרים מדווחים עליהם, ואיננו מדווחים דבר על איכותם. בעדכונים עתידיים למחקר זה, נציג תוצאות המשוות בין משתמשי סוכני קידוד לקבוצת השוואה נקייה, ונבחן האם התוכן, ולא רק הכמות, של עבודה מחוזקת על ידי סוכני קידוד נראה שונה.

למרות מגבלות אלו, אנו מראים כי סוכני קידוד מתפשטים למדעי החברה. האופן שבו אנו חוקרים את הכלכלה והפוליטיקה, למשל, עובר יותר ויותר דרך החלטות ניתוח המתבצעות בחלקן על ידי סוכני קידוד AI. אנו מתכננים להביא עדויות נוספות בדוחות עתידיים על הפוטנציאל והסיכונים של אוטומציה מסוג זה.

כותבים

Thomas Lyttelton, Maxim Massenkoff, Nathan Wilmers

תודות

Tim Belonax, Keir Bradwell, Jake Eaton, Rebecca Hiscott, Peter McCrory, Kerry Persen, Sarah Pollack, Santi Ruiz, Heather Whitney, Jack Clark.

נספח

זמין כאן.

ציטוט

@online{lyttelton2026agents,
 author = {Thomas Lyttelton and Maxim Massenkoff and Nathan Wilmers},
 title = {Coding Agents in the Social Sciences},
 date = {2026-05-27},
 year = {2026},
 url = {https://www.anthropic.com/research/coding-agents-social-sciences},
}

מקורות

Alvero, A. J., Stoltz, D. S., Stuhler, O., & Taylor, M. A. (2026). Generative AI in Sociological Research: State of the Discipline. Sociological Science, 13, 45-62.
Korinek, A. (2025). AI agents for economic research (No. w34202). National Bureau of Economic Research. NBER Working Paper Series.
Liang, W., Zhang, Y., Wu, Z., Lepp, H., Ji, W., Zhao, X., ... & Zou, J. (2025). Quantifying large language model usage in scientific papers. Nature Human Behaviour, 1-11.
Lu, C., Lu, C., Lange, R. T., Yamada, Y., Hu, S., Foerster, J., ... & Clune, J. (2026). Towards end-to-end automation of AI research. Nature, 651(8107), 914-919.
Wilmers, N., & Engzell, P. (2026). The Paper Factory. SocArXiv Preprints.

הערות שוליים

השקנו את הסקר חודש בלבד לאחר השקת Claude Cowork ולפני השקת אפליקציית Codex של OpenAI, ולכן התמקדנו בשאלה זו בכלי ממשק שורת פקודה (CLI) לאינטראקציה עם סוכני קידוד. משמעות הדבר היא שאיננו כוללים חוקרים המשתמשים בסוכני AI באופן בלעדי דרך יישומי שולחן עבודה כלליים יותר.