ניסוי פורץ דרך: AI בהגנה על תשתיות קריטיות

מתקפות סייבר על תשתיות קריטיות, כמו רשתות חשמל, צינורות דלק ומערכות מים, כבר גרמו לנזקים משמעותיים בעולם האמיתי ועלולות להוביל לפגיעה חמורה. בעוד יכולות ה-AI מתפתחות, קיים חשש שמודלי AI יגדילו את מספר התוקפים המסוגלים לפגוע ביעדים אלו. עם זאת, AI יכול גם לסייע למגיני תשתיות קריטיות לזהות חולשות שאותן תוקפים עלולים לנצל – ולסגור אותן לפני שהן הופכות לאיום ממשי. לאור זאת, חברת אנתרופיק (Anthropic) שיתפה פעולה עם Pacific Northwest National Laboratory (PNNL) כדי לחקור את היישום ההגנתי הזה של AI. במסגרת המחקר, חוקרי PNNL השתמשו ב-Claude כדי לדמות מתקפות סייבר על סימולציה מתקדמת של מתקן לטיפול במים, והצליחו לעשות זאת בזמן קצר בהרבה ממה שהיה לוקח למומחה אנושי. בכך, הם הוכיחו את היתכנות הרעיון של שימוש ב-AI כדי לאפשר למגיני סייבר לבצע תרגילי Red Teaming בצורה מהירה ויעילה יותר. עבודה זו מדגימה הן את הפוטנציאל של הגנה מואצת באמצעות AI והן את הערך של שותפויות ציבוריות-פרטיות בניצול AI לביטחון לאומי.

מאיצים את דימוי התוקפים בעזרת AI

בפרויקט מחקר זה, התמקד PNNL בשימוש ב-AI כדי להאיץ את משימת דימוי התוקפים: מודלים של גורם איום ספציפי או מתקפה ספציפית נגד רשת, במטרה להבין ולשפר את ההגנות הקיימות. דימוי מתקפות אלו מספק תובנות חשובות לגבי חולשות מערכתיות ונקודות עיוורון בזיהוי. היכולת לדמות מחדש את המתקפות לאחר ביצוע התאמות הגנתיות מאפשרת להעריך את יעילות השינויים שבוצעו.

PNNL פיתח "מסגרת" עבור Claude שמטרתה למכן ולהאיץ את תהליך דימוי התוקפים. מסגרת זו אפשרה לתרגם במהירות פרומפטים בשפה טבעית לשרשרות מתקפה מורכבות, בין היתר על ידי הגדרה מראש של "כלים" מבוססי קוד, המאפשרים למודל לבצע פעולות בקלות רבה יותר ברשתות מחשבים. החוקרים הטילו על הסוכן הזה לדמות מתקפות נגד מודל סייבר-פיזי של מתקן לטיפול במים (אחת מפלטפורמות Control Environment Laboratory Resource ש-PNNL מפעיל מטעם הסוכנות לאבטחת סייבר ותשתיות של משרד ביטחון המולדת). ההערכה של PNNL היא שהגישה הזו אפשרה השלמת שחזור מתקפה בשלוש שעות בלבד, במקום שבועות מרובים.

באחד ממחזורי הבדיקה, Claude הפגין תושייה יוצאת דופן. אחד הכלים המוגדרים מראש שנבנו על ידי החוקרים כחלק מהמסגרת היה מנגנון לעקיפת תכונת אבטחה ב-Windows הנקראת User Account Control (UAC). עם זאת, מנגנון זה לא תמיד היה אמין ולעיתים קרובות כשל. Claude, שזיהה את אחת מהכישלונות הללו דרך דיווחים על ניסיון לא מוצלח להשתמש בכלי שלו, זיהה והשתמש בטכניקת עקיפת UAC ידועה אחרת כדי להשיג את מטרתו.

ככל שהמודלים ממשיכים להשתפר, אנו צופים שסוג זה של תושייה ויצירתיות ילך ויגבר. סימולציה זו, מקיץ 2025, השתמשה ב-Claude Sonnet 4 – מודל שאינו עוד אחד ממודלי החזית של אנתרופיק. שיפורים ביכולות המודל עלולים לסייע הן לתוקפים והן למגינים, ולכן עבודה מסוג זה, לשיפור אבטחת התשתיות הקריטיות, היא כה חיונית.

מרחיבים שותפויות ציבוריות-פרטיות ל-AI וביטחון

מחקר זה מיישם הלכה למעשה את הקריאה שלנו לחשיבה יצירתית וניסויים בשימוש ב-AI להגנת סייבר. זהו צעד קריטי, בהתחשב באופי הכפול שימוש של AI בתחום הסייבר וב-עלייה בשימוש ב-AI על ידי תוקפים במרחב הסייבר.

שיתוף פעולה זה מצטרף לשורה הולכת וגדלה של שותפויות בין מעבדות AI חזיתיות כמו אנתרופיק לבין מרכזי מצוינות ממשלתיים בתחומי המדע, ההנדסה והביטחון הלאומי. אנתרופיק עבדה בעבר עם המינהל הלאומי לביטחון גרעיני (National Nuclear Security Administration) על פיתוח הערכות והפחתת סיכונים גרעיניים פוטנציאליים הקשורים ל-AI. אנתרופיק היא גם אחת מהשותפות מהמגזר הפרטי ב"משימת ג'נסיס" של משרד האנרגיה האמריקאי, ששמה לה למטרה לרתום את המומחיות והכלים המדעיים של המעבדות הלאומיות של DOE וחברות AI חזיתיות לטובת פריצות דרך מדעיות המשרתות את הביטחון הלאומי.

במאמץ מחקרי זה, אנתרופיק סיפקה גישה ליכולות המודל המתקדמות ביותר באמצעות Claude, ואילו ל-PNNL הייתה המומחיות והנכסים הסייבר-פיזיים כדי לספק סביבות בדיקה מציאותיות יותר מאלו שהיו זמינות לחברת AI בודדת. במילים אחרות, אף אחד מהצדדים לא היה יכול לבצע ניסוי מסוג זה ללא שיתוף הפעולה של השני. זוהי ההיגיון המרכזי שמאחורי השותפויות הציבוריות-פרטיות שאנו יוזמים. אנו נמשיך לחפש השלמות הדדית מסוג זה, ונשמח להמשיך לעבוד עם מוסדות יוצאי דופן כמו המעבדות הלאומיות במשימתנו המשותפת להבטיח ש-AI ישמש להגנה על תשתיות קריטיות ועמודים נוספים של ביטחון ויציבות.

תודות

אנו מודים ללוק טרואונג (Loc Truong) וכריסטופר וויליס (Kristopher Willis) מ-PNNL על שהובילו פרויקט זה ושיתפו אותנו בנתונים עבור פוסט זה. תוכלו לקרוא עוד על הפרויקט באתר PNNL.