ANTHROPIC IL
ניוזלטרמדד כלכליטיפיםהנדסה באנתרופיקמחקרמודליםחדשותראשי
ANTHROPIC IL

הקהילה הישראלית של Anthropic. חדשות, מחקרים, מדריכים ועדכונים על Claude ועל כלי ה-AI של אנתרופיק - בעברית.

RSS support@anthropic-il.co.il

הישארו מעודכנים

הצטרפו לניוזלטר השבועי וקבלו את כל העדכונים החמים מעולם ה-AI ישירות למייל.

מדורים

  • חדשות
  • מחקר
  • הנדסה
  • כלכלה
  • טיפים וטריקים
  • קהילה
  • ניוזלטר
  • חיפוש

משפחת Claude

  • Claude Code (קלוד קוד)
  • Claude - סקירה
  • Claude Sonnet
  • Claude Opus
  • Claude Haiku

נושאים חמים

  • בינה מלאכותית
  • מודלי שפה
  • LLMs
  • Anthropic API
  • סוכני AI
  • קידוד סוכני
  • מודלי חזית

מחקר ובטיחות

  • בטיחות AI
  • AI אחראי
  • מחקר AI
  • פרשנות מודלים
  • יישור (Alignment)
  • Red Teaming
  • מדיניות ורגולציה

אתרי אחות

  • קלודLEARN - לימוד
  • מבוא ל-LLMs
  • הזיות בקלוד
  • פרומפט ראשון
מדיניות פרטיות·תנאי שימוש·צור קשר
כל הזכויות שמורות Anthropic IL © 2026
אנתרופיק | אנטרופיק ישראל | אנטרופיק בעברית | Anthropic Israel

אתר קהילתי בלתי רשמי - אתר זה אינו קשור, מאושר או מופעל על ידי חברת Anthropic, PBC. התכנים מתורגמים באופן אוטומטי מ-anthropic.com ועשויים להכיל אי-דיוקים. כל הסימנים המסחריים הם רכוש בעליהם.

ראשי/התקפות סייבר

התקפות סייבר

1 כתבות בנושא זה

מחקר חדש של אנתרופיק: כך ניתן 'להרעיל' מודלי שפה גדולים (LLMs) עם מעט מאוד נתונים
מחקר9 באוקטובר 2025

מחקר חדש של אנתרופיק: כך ניתן 'להרעיל' מודלי שפה גדולים (LLMs) עם מעט מאוד נתונים

מחקר משותף של אנתרופיק (Anthropic), המכון לבטיחות AI בבריטניה (UK AI Security Institute) ומכון אלן טיורינג (The Alan Turing Institute) חושף פגיעות מדאיגה במודלי שפה גדולים (LLMs): נמצא כי 250 מסמכים זדוניים בלבד מספיקים ליצירת פירצה (backdoor) במודל, ללא קשר לגודלו או לכמות הנתונים שעליהם אומן. הממצאים הללו מפריכים את ההנחה המקובלת שתוקפים צריכים לשלוט באחוז מסוים מנתוני האימון, ומצביעים על כך שדי בכמות קבועה וקטנה יחסית של נתונים כדי לפגוע במודל. על אף שהמחקר התמקד בסוג ספציפי של פירצה שמוביל לפלט חסר משמעות, הוא מדגיש כי התקפות הרעלה (data poisoning) עשויות להיות קלות יותר לביצוע ממה שחשבו בעבר, ומעודד מחקר נוסף בנושא.

קרא עוד