ANTHROPIC IL
ניוזלטרמדד כלכליטיפיםהנדסה באנתרופיקמחקרמודליםחדשותראשי
ANTHROPIC IL

הקהילה הישראלית של Anthropic. חדשות, מחקרים, מדריכים ועדכונים על Claude ועל כלי ה-AI של אנתרופיק - בעברית.

RSS support@anthropic-il.co.il

הישארו מעודכנים

הצטרפו לניוזלטר השבועי וקבלו את כל העדכונים החמים מעולם ה-AI ישירות למייל.

מדורים

  • חדשות
  • מחקר
  • הנדסה
  • כלכלה
  • טיפים וטריקים
  • קהילה
  • ניוזלטר
  • חיפוש

משפחת Claude

  • Claude Code (קלוד קוד)
  • Claude - סקירה
  • Claude Sonnet
  • Claude Opus
  • Claude Haiku

נושאים חמים

  • בינה מלאכותית
  • מודלי שפה
  • LLMs
  • Anthropic API
  • סוכני AI
  • קידוד סוכני
  • מודלי חזית

מחקר ובטיחות

  • בטיחות AI
  • AI אחראי
  • מחקר AI
  • פרשנות מודלים
  • יישור (Alignment)
  • Red Teaming
  • מדיניות ורגולציה

אתרי אחות

  • קלודLEARN - לימוד
  • מבוא ל-LLMs
  • הזיות בקלוד
  • פרומפט ראשון
מדיניות פרטיות·תנאי שימוש·צור קשר
כל הזכויות שמורות Anthropic IL © 2026
אנתרופיק | אנטרופיק ישראל | אנטרופיק בעברית | Anthropic Israel

אתר קהילתי בלתי רשמי - אתר זה אינו קשור, מאושר או מופעל על ידי חברת Anthropic, PBC. התכנים מתורגמים באופן אוטומטי מ-anthropic.com ועשויים להכיל אי-דיוקים. כל הסימנים המסחריים הם רכוש בעליהם.

ראשי/התקפות דיסטילציה

התקפות דיסטילציה

1 כתבות בנושא זה

אנתרופיק מאשימה מעבדות AI סיניות בגניבת יכולות מ-Claude באמצעות "דיסטילציה"
בטיחות23 בפברואר 2026

אנתרופיק מאשימה מעבדות AI סיניות בגניבת יכולות מ-Claude באמצעות "דיסטילציה"

חברת אנתרופיק (Anthropic), מובילה בתחום מחקר ובטיחות ה-AI, חשפה קמפיינים תעשייתיים של שלוש מעבדות AI סיניות – DeepSeek, Moonshot ו-MiniMax – שביצעו "התקפות דיסטילציה" כדי לגנוב יכולות מתקדמות ממודלי Claude שלה. המעבדות יצרו למעלה מ-16 מיליון חילופי פרומפטים באמצעות כ-24,000 חשבונות מזויפים, ובכך הפרו באופן בוטה את תנאי השירות והגבלות הגישה. לפי אנתרופיק, התקפות אלו מהוות סיכון לביטחון הלאומי בכך שהן מאפשרות הפצת מודלים חסרי מנגנוני הגנה ותכונות בטיחות, ופוגעות ביתרון הטכנולוגי של ארה"ב ב-AI על ידי עקיפת בקרות ייצוא. החברה קוראת לתגובה מתואמת של התעשייה, קובעי המדיניות וקהילת ה-AI העולמית להתמודדות עם האיום המתפתח.

קרא עוד