ANTHROPIC IL
ניוזלטרמדד כלכליטיפיםהנדסה באנתרופיקמחקרמודליםחדשותראשי
ANTHROPIC IL

הקהילה הישראלית של Anthropic. חדשות, מחקרים, מדריכים ועדכונים על Claude ועל כלי ה-AI של אנתרופיק - בעברית.

RSS support@anthropic-il.co.il

הישארו מעודכנים

הצטרפו לניוזלטר השבועי וקבלו את כל העדכונים החמים מעולם ה-AI ישירות למייל.

מדורים

  • חדשות
  • מחקר
  • הנדסה
  • כלכלה
  • טיפים וטריקים
  • קהילה
  • ניוזלטר
  • חיפוש

משפחת Claude

  • Claude Code (קלוד קוד)
  • Claude - סקירה
  • Claude Sonnet
  • Claude Opus
  • Claude Haiku

נושאים חמים

  • בינה מלאכותית
  • מודלי שפה
  • LLMs
  • Anthropic API
  • סוכני AI
  • קידוד סוכני
  • מודלי חזית

מחקר ובטיחות

  • בטיחות AI
  • AI אחראי
  • מחקר AI
  • פרשנות מודלים
  • יישור (Alignment)
  • Red Teaming
  • מדיניות ורגולציה

אתרי אחות

  • קלודLEARN - לימוד
  • מבוא ל-LLMs
  • הזיות בקלוד
  • פרומפט ראשון
מדיניות פרטיות·תנאי שימוש·צור קשר
כל הזכויות שמורות Anthropic IL © 2026
אנתרופיק | אנטרופיק ישראל | אנטרופיק בעברית | Anthropic Israel

אתר קהילתי בלתי רשמי - אתר זה אינו קשור, מאושר או מופעל על ידי חברת Anthropic, PBC. התכנים מתורגמים באופן אוטומטי מ-anthropic.com ועשויים להכיל אי-דיוקים. כל הסימנים המסחריים הם רכוש בעליהם.

הנדסה

מאמרי הנדסה, תובנות טכניות ושיטות עבודה מומלצות מצוות ההנדסה של אנתרופיק

הנדסת הקשר יעילה עבור סוכני AI
הנדסה22 באפריל 2025

הנדסת הקשר יעילה עבור סוכני AI

בעוד שהנדסת פרומפטים עמדה במרכז תשומת הלב ב-AI יישומי, עולה כעת מונח חדש: הנדסת הקשר. גישה זו מתמקדת באופטימיזציה של הנתונים והטוקנים הזמינים למודל שפה גדול (LLM) בכל רגע נתון, במטרה להבטיח התנהגות עקבית ואפקטיבית של סוכני AI. הכתבה דנה בחשיבות ניהול הקשר מוגבל, תוך התייחסות למגבלות כמו 'ריקבון הקשר' (context rot), ומציגה אסטרטגיות כמו שליפה בזמן אמת (just in time retrieval) ושימוש מושכל בכלים. עוד נבחנות טכניקות מתקדמות למשימות ארוכות טווח, כולל דחיסה, רישום הערות מובנה וארכיטקטורות תת-סוכנים, במטרה לבנות סוכנים אמינים ויעילים יותר.

קרא עוד
מבחנים עמידים ל-AI: המרוץ של אנתרופיק לבחון מהנדסים במציאות משתנה
הנדסה22 באפריל 2025

מבחנים עמידים ל-AI: המרוץ של אנתרופיק לבחון מהנדסים במציאות משתנה

אנתרופיק (Anthropic), מובילה בתחום ה-AI, מתמודדת עם אתגר הולך וגובר: כיצד להעריך מהנדסי ביצועים כשלמודלי שפה גדולים כמו Claude יש יכולת לפתור מבחנים טכניים מורכבים. הכתבה מתארת את מסע החברה בשלוש גרסאות של מבחן בית (take-home) שתוכנן לאתר כישרונות הנדסיים, וכיצד כל דור של מודל Claude הצליח להתעלות עליו, מה שאילץ את הצוות לתכנן מחדש את המבחן. היא חושפת תובנות לגבי בניית הערכות עמידות ל-AI ומציגה את האתגר הפתוח של אנתרופיק לקהילה הטכנולוגית.

קרא עוד
לשחרר את כוחם של סוכני AI לקידוד יישומים מורכבים עם סקיילינג
הנדסה21 במרץ 2025

לשחרר את כוחם של סוכני AI לקידוד יישומים מורכבים עם סקיילינג

חברת אנתרופיק (Anthropic), מובילה בתחום בטיחות ומחקר ה-AI, בוחנת גישות הנדסיות חדשניות לפיתוח יישומי AI אמינים, ניתנים לפרשנות וניתנים לשליטה. מאמר זה מתאר פיתוח של ארכיטקטורת ריסון (harness) מרובת סוכנים, בהשראת GANs, המסוגלת לייצר עיצובי פרונטאנד איכותיים ויישומי Full-Stack מורכבים באופן אוטונומי. באמצעות הפרדה בין סוכני 'יוצר' ל'מעריך', התמודדו המפתחים עם בעיות נפוצות כמו 'חרדת הקשר' והערכה עצמית מוטה, והצליחו לשפר באופן ניכר את ביצועי מודלי ה-LLM במשימות קידוד ארוכות טווח וסובייקטיביות.

קרא עוד
פיתוח מערכת המחקר מרובת הסוכנים של קלוד: אתגרים ותובנות הנדסיות
הנדסה11 במרץ 2025

פיתוח מערכת המחקר מרובת הסוכנים של קלוד: אתגרים ותובנות הנדסיות

הכתבה מפרטת את המסע ההנדסי והלקחים שנלמדו מבניית מערכת המחקר מרובת הסוכנים של Anthropic עבור Claude. היא מסבירה כיצד מערכת זו, המורכבת ממספר סוכני LLM הפועלים בשיתוף פעולה, מתמודדת עם משימות מחקר מורכבות ופתוחות ביעילות רבה יותר ממערכות סוכן יחיד. הדיון כולל עקרונות ארכיטקטוניים, אסטרטגיות הנדסת פרומפטים לתיאום סוכנים, שיטות הערכה מתקדמות ופתרונות לאמינות בייצור. הכתבה מדגישה את הרווחים המשמעותיים בביצועים, לצד העלייה בצריכת הטוקנים והמורכבות בפריסה הטבועות במערכות AI מתוחכמות אלו.

קרא עוד
אנתרופיק מנגישה את קלוד Desktop: התקנת שרתי MCP מקומיים בלחיצה אחת
הנדסה11 במרץ 2025

אנתרופיק מנגישה את קלוד Desktop: התקנת שרתי MCP מקומיים בלחיצה אחת

אנתרופיק (Anthropic) משיקה את 'הרחבות שולחן העבודה' (Desktop Extensions), פורמט חדש שמטרתו לפשט באופן דרמטי את תהליך התקנת שרתי ה-MCP המקומיים עבור קלוד (Claude) Desktop. עד כה, התקנה דרשה ידע טכני וטיפול ידני בתצורות ותלויות; כעת, הרחבות אלו מאפשרות פריסה בלחיצה אחת, ובכך מנגישות יכולות מתקדמות של אינטגרציה עם מערכות קבצים ונתונים מקומיים גם למשתמשים שאינם מפתחים. המהלך נועד להרחיב את יכולותיו של קלוד, תוך הבטחת בטיחות ופרטיות, ואנתרופיק אף פותחת את מפרט הפורמט לקוד פתוח במטרה לבנות סביבה אקולוגית רחבה.

קרא עוד
איך לבנות כלים יעילים לסוכני AI – בעזרת סוכני AI
הנדסה11 במרץ 2025

איך לבנות כלים יעילים לסוכני AI – בעזרת סוכני AI

פרוטוקול ה-Model Context Protocol (MCP) מאפשר לסוכני LLM להשתמש במאות כלים לפתרון משימות מורכבות בעולם האמיתי. אבל איך נוודא שכלים אלה יהיו אפקטיביים ככל האפשר? בכתבה זו נפרט טכניקות מומלצות לבניית אבות טיפוס, ביצוע הערכות מקיפות ושיתוף פעולה עם סוכנים כמו Claude Code כדי לשפר אוטומטית את ביצועי הכלים. נסקור עקרונות מפתח לכתיבת כלים איכותיים, כולל בחירת הכלים הנכונים, תיחום פונקציונליות באמצעות Namespacing, החזרת מידע בעל משמעות מהכלים, אופטימיזציה של תגובות לחסכון בטוקנים ו-Prompt Engineering לתיאורי כלים.

קרא עוד
ביצועי מודלי AI בקידוד סוכני: כשביצועי התשתית משנים את הציון
הנדסה4 במרץ 2025

ביצועי מודלי AI בקידוד סוכני: כשביצועי התשתית משנים את הציון

מחקר חדש של אנתרופיק (Anthropic) חושף כי מדדי ביצועים לקידוד סוכני AI, המשמשים להשוואת מודלי חזית, מושפעים באופן ניכר מתצורת התשתית שעליה הם רצים. החברה גילתה כי הבדלים בהגדרות המשאבים, כמו מגבלות מעבד וזיכרון RAM, יכולים לייצר פער של עד 6 נקודות אחוז בציוני ההערכה. הממצאים מצביעים על כך שציונים צמודים בלוחות דירוג אינם משקפים בהכרח יכולות מודל טהורות, אלא גם את הגדרות החומרה והתשתית. אנתרופיק ממליצה על סטנדרטיזציה של מתודולוגיות המשאבים ופירוט מדויק של פרמטרי ההקצאה, כדי להבטיח מדידה אמינה ושקופה יותר של יכולות ה-AI.

קרא עוד
כש-16 סוכני קלוד חוברים יחד: כך בנו באנתרופיק מהדר C מאפס
הנדסה4 במרץ 2025

כש-16 סוכני קלוד חוברים יחד: כך בנו באנתרופיק מהדר C מאפס

חוקר ב-אנתרופיק (Anthropic) חשף גישה חדשנית לפיתוח תוכנה באמצעות 'צוותי סוכנים' של מודלי Claude, במסגרתה 16 מופעים של Claude פעלו במקביל ואוטונומית לבניית מהדר C מאפס. הניסוי המרשים הוליד מהדר בן 100,000 שורות קוד, המסוגל לקמפל את ליבת לינוקס, בעלות של כ-20,000 דולר וכמעט 2,000 סשנים של Claude Code. הכתבה מתארת את האתגרים והפתרונות בתכנון סביבת עבודה לסוכנים אוטונומיים ארוכי טווח, כולל טיפול במקביליות ובדיקות איכות קפדניות. למרות ההישג הטכנולוגי פורץ הדרך, המחבר מביע גם דאגה מהסיכונים הכרוכים בפריסה אוטונומית לחלוטין של קוד ללא פיקוח אנושי.

קרא עוד
כלי ה-'think': איך קלוד לומד לעצור ולחשוב במצבים מורכבים
הנדסה12 בפברואר 2025

כלי ה-'think': איך קלוד לומד לעצור ולחשוב במצבים מורכבים

אנתרופיק מציגה כלי חדש בשם 'think' עבור מודלי קלוד, שנועד לשפר משמעותית את יכולותיהם במצבי שימוש מורכבים בכלים הדורשים חשיבה מרובת שלבים וציות למדיניות. הכלי מאפשר לקלוד לעצור ולבצע הסקה מובנית בתוך תהליך יצירת התשובה, ובכך הוא נבדל מיכולת ה-'extended thinking' המתרחשת לפני התגובה. ממדדי ביצועים כמו τ-Bench ו-SWE-Bench עולה כי שילוב הכלי, במיוחד עם פרומפטים ממוטבים, מביא לשיפורים דרמטיים בעקביות ובאמינות של קלוד. המאמר מספק למפתחים הנחיות פרקטיות ליישום הכלי ותחומים בהם הוא מביא את התועלת הגדולה ביותר.

קרא עוד
מדריך: כך תבנו סוכני AI אפקטיביים ואמינים
הנדסה6 בינואר 2025

מדריך: כך תבנו סוכני AI אפקטיביים ואמינים

אנתרופיק חושפת תובנות מפיתוח סוכני AI אמינים, תוך התבססות על עבודה עם עשרות צוותים במגוון תעשיות. המאמר מספק עצות מעשיות למפתחים לבניית סוכנים אפקטיביים, החל מאבני בניין בסיסיות ועד לתבניות עבודה מורכבות. הוא מציג הבחנה חשובה בין 'תהליכי עבודה' מוגדרים מראש ל'סוכנים' אוטונומיים, ומספק המלצות מתי להשתמש בכל גישה, כולל דוגמאות מהעולם האמיתי בתחומי שירות לקוחות וקידוד. הדגש הוא על פשטות, שקיפות ועיצוב קפדני של ממשקי סוכן-מחשב.

קרא עוד
קלוד 3.5 Sonnet קובע שיא חדש ב-SWE-bench Verified
הנדסה17 בדצמבר 2024

קלוד 3.5 Sonnet קובע שיא חדש ב-SWE-bench Verified

מודל ה-AI המתקדם Claude 3.5 Sonnet של אנתרופיק מציג פריצת דרך מרשימה במדד SWE-bench Verified, המעידה על יכולות הנדסת תוכנה מתקדמות ודיוק יוצא דופן ביצירת קוד. הכתבה סוקרת את שיטות ההערכה הטכניות שאומצו ומסבירה כיצד הסוכן, שנבנה סביב המודל, מנצל את יכולותיו באופן אופטימלי כדי לפתור בעיות קידוד מורכבות. המודל קובע שיא חדש במדד, ועוקף את מודל החזית הקודם עם ציון של 49%, וממחיש את הפוטנציאל הגלום בו למפתחים.

קרא עוד
12→