מחקר חדשות המחקר ראיון עם פרופ' עודד מימון בדו-ירחון "בטחון-ישראל"

ראיון עם פרופ' עודד מימון בדו-ירחון "בטחון-ישראל"

חדשות המחקר

Interview with Professor Oded Maimon:

 

בחדרו של פרופסור עודד מימון באוניברסיטת תל אביב תלויות תעודות הוקרה והצטיינות ממשרד ראש הממשלה ומשרד הביטחון.

ניסיון לברר פרטים על הנסיבות שבעטיין קיבל את התעודות, נתקל בחומה בצורה. מימון אינו מוכן לגלות האם היה קשור לפיתוח מערכות, שאליהן התייחס בעבר ראש השב"כ הישראלי, יובל דיסקין, כאשר אמר: "אנו זקוקים לטכנולוגיה מתקדמת בתחום איסוף ואגירה של מחסני נתונים, מימוש אלגוריתמים ייחודיים לכריית מידע והקפצת התרעות זמן אמת על פרופילים התנהגותיים חריגים. בתחומים אלה התקדמנו מאוד - גם בקנה מידה עולמי ביחס לגופים עמיתים".

המשותף לכל התחומים שאותם הזכיר יובל דיסקין הוא שהם קשורים ל"כריית מידע" ול"בינה מלאכותית" - שהיא היכולת לתת למחשבים ולרובוטים לחשוב במקום בני האדם, ולא רק בהתאם לאופן שבו תוכנתו מבעוד מועד. פרופ' מימון, איש אוניברסיטת MIT בעבר, נחשב אחד המדענים המובילים בעולם בתחומים אלה. הוא בעל תעודות הצטיינות מדעיות בתחום המתמטיקה של הבינה המלאכותית ויצירתיות. בין עשרת הספרים המדעיים שכתב גם הספר  Data mining and knowledge discovery (כריית מידע וגילוי ידע  - הוצאת ספרינגר, ארצות הברית). מימון הוא איש חקר ביצועים במקור. את הדוקטוראט שלו עשה בתחום של בקרת רובוטים.

"פעם, בעיית המודיעין הייתה להשיג אינפורמציה", אומר פרופ' מימון בהתייחסות כללית לסוגייה המודיעינית. "כיום, לכל דבר כמעט יש חתימה אלקטרונית שניתן להשיג, רק צריך להבין את משמעותה. למעשה, כמות המידע היא אינסופית והבעיה היא לנתח את הנתונים, ומתוך מה שמעניין - ליצור דפוסי התנהגות, כך שמראש נדע על ארוע חריג שעומד לקרות".

"למשל, אולי היה ניתן להשיג התרעה על פיגוע כמו זה שהיה בעיר מומביי בהודו, באמצעות  סימנים מחשידים כמו שימוש חריג שעשו הטרוריסטים בטלפונים לווייניים, העברות כספים וכן הלאה. להוציא את המידע החשוב לצורך השגת התרעה, זה כמו למצוא מחט בערימת שחת".

ש. פרופ' מימון, בוא נעשה סדר, כיצד מתחיל תהליך שבמסגרתו מתבצעת "כריית מידע"?

ת. "התהליך כולו מורכב משישה שלבים. בשלב הראשון אוספים את האינפורמציה באמצעות חיישנים שיכולים להיות מכל הסוגים, למשל,  מכ"מ, מצלמה, יומינט (מודיעין המבוסס על הפעלת סוכנים)  או סיגינט (מודיעין אותות המבוסס בדרך כלל על האזנות).

"לשלב השני קוראים 'הרכשה', ומטרתו היא  להביא את האינפורמציה אליך. מטרת השלב השלישי, היא לארגן את הנתונים (בסיסי נתונים). למשל, אם מדובר באיסוף מודיעין מהשטח אז צריך לדעת איזה מידע הגיע מאיזה מצלמה  באיזה שעה וכן הלאה, ואם מדובר בהאזנות, צריך לדעת מה המקור שלהן, ובאיזה שעות נערכו השיחות.

"השלב הבא מכונה 'פיוז'ן'- היתוך מידע. המידע מכל המקורות  אמור ליצור ביחד תמונה אחת עשירה. כמו שחוש הטעם, חוש הראיה וחוש הריח משמשים אותנו ביחד כדי לתת חוות דעת על יין מסויים, כך צריך לקחת חיישנים שונים ולחבר אותם. כשמחברים מידע שמגיע ממטוס ללא טייס, ממצלמה קרקעית ומהאזנה, צריך לדעת האם כולם מתייחסים לאותו אובייקט, או שהם מסתכלים על אובייקטים שונים בשטח.

"השלב החמישי, שלב כריית המידע, DATA MINING, נועד להשיג, בעצם, את התובנות. למשל, אם יש  פלט של מיליון שיחות טלפון, צריך להגיד ששיחה מספר 1000 ושיחה מספר 760000 הן המעניינות, ואת כל השאר אפשר לזרוק. דוגמא אחרת יכולה להיות עיר עם 20  אלף מצלמות שאוספות צילומים של  לוחיות רישוי. אוקי, אז יש מיליוני לוחיות במאגר ומסלולי תנועה, אבל צריך לדעת מה זה אומר לנו, האם זה מעניין אותנו, חוץ מאשר העובדה שבאמצעות המצלמות אפשר להסתכל רטרואקטיבית מה קרה בשעה מסוימת במקום מסויים. האדם לבדו אינו יכול להתמודד עם שפע המידע הזה, צריך מחשבים שיעזרו לו. העניין הוא לא להשיג את הנתונים אלא איך להוציא את הבר מהתבן, להגיע לתובנות הנכונות.

"כיום, אפשר לקנות חיישנים וכוננים עם כמה טרה בזיכרון בכל חנות, ולארגוני המודיעין הגדולים יש מאות טרה מידע בזיכרון, בדרך לפנטה בייט- מספר עם 15 אפסים. חייבים תובנה שתיתן דרך חכמה לחפש בתוך החומר, להביא רק את המידע החשוב, על פי משהו שאנחנו קוראים לו 'מדפסים חכמים'. אפשר לזרוק כ 90 אחוז מהאינפורמציה, ואז לעשות הקשרים שתלויים זה בזה בין הגורמים המעניינים. החוכמה הגדולה בסופו של כל התהליך היא להגיד שמשהו מעניין הולך לקרות.

"רק אז, בשלב השישי, נכנס לתמונה האדם, שצריך לקבל החלטות על סמך הידע שהובא בפניו. ההחלטה הסופית כיצד לפעול עדיין נתונה בידיו. אם הליקופטר צריך לשלוח טיל על סמך המידע שנאסף, צריך שאדם יחליט האם ללחוץ על ההדק או לא".

ש. בשורה התחתונה, הבינה בתהליך הזה היא של האדם או של המכונה?

"הבינה היא של המכונה. האדם בונה את האלגוריתם שמוצא את דפוס הפעולה, את ה"פטרן". אבל, האדם לא יכול לדעת מתוך מיליוני אפשרויות שדווקא דבר מסוים הוא שיהיה מעניין. בעבר, גם עבדו באותה שיטה, אבל מישהו היה צריך לכתוב את השלבים של הפקת המידע הרלוונטי. עכשיו קוראים לזה 'בינה מלאכותית', כי כאשר יש לך טרה-בייט של אינפורמציה, צריך שמישהו יחשוב ויעבד בשבילך כדי להוציא את האינפורמציה האמתית, כי אם רק האדם חושב הוא מפספס".

 

 

ש. צריך להגדיר למחשב מראש מה מעניין כדי שהוא יספק התרעה על ארוע חריג?

"לפעמים כן ולפעמים לא. למשל, כשמישהו נמצא במעבר גבול, המחשב יכול להגדיר באופן אוטומאטי אם צריך  לעצור אותו לבדיקה, בלי שהוגדר לגביו שום דבר מראש. המטרה היא להקנות גם לרובוטים יכולת 'לחשוב' לבד, בלי שהגדרת להם מראש את כל  המצבים שבהם יוכלו להיתקל. יכולת כזאת, תוכל אולי בעתיד לאפשר לרובוטים אפילו להשתלב בנהיגה בכבישים, שנוהגים בהם גם בני אדם, שהם יצורי ה"פיוז'ן" המשוכללים ביתר.

"הדוגמאות שאנחנו מדברים עליהן הן רק חלק קטן מהאפשרויות שטמונות ב'היתוך מידע'. היכולות הקיימות מעניינות גופים בכל העולם, בתחום הצבאי וגם בתחום האזרחי".

ש. עד כמה אפשר לסמוך על "שיקול הדעת" של המערכות הממוחשבות?

"בגלל שהכל ממוחשב, אנחנו יכולים למדוד את היעילות של האלגוריתמים ולתת לה ערכים. למשל לכל תובנה במערכת ניתנים שני מספרים:  מספר אחד מציין עד כמה מדובר בעניין מדויק, והשני- עד כמה יכול להיות שבתוך התהליך פספסנו דברים שהיו יכולים היות מעניינים.

"לא תמיד אומרים למשתמש את מידת היעילות שנקבעת על סמך שני המספרים האלה, כי לא רוצים לבלבל אותו, אבל אפשר להחליט מראש שמעל 90 אחוז דיוק תוגדר מטרה, בין 70-90 אחוז יש עניין שטעון בדיקה נוספת, ומתחת ל-70 אחוז המערכת לא תתריע בכלל, כדי לא ליצור עומס של התראות שווא. אני מזכיר, שהאדם עדיין צריך להפעיל שיקול דעת, במסגרת שלב 6 של התהליך, אבל אני מאמין שבעתיד אפילו שיקול הדעת יילקח ממנו . למעשה, כבר עכשיו שיקול הדעת נלקח במידה מסויימת, רק לא אומרים את זה".

ש.מדוע?

"כי עצם העובדה שאנחנו משתמשים בכל האלגוריתמים הרבה מעבר לידע של הבנאדם וליכולת החשיבה שלו, גורמת לכך שהאלגוריתם הוא במובן מסויים סוג של פילטר חכם. המכונה הרבה פעמים קובעת יותר מהאדם, כי אין אפשרות אחרת. אם המכונה טועה אז האדם טועה".

ש. יש מערכות של "רואה יורה" שמוסגלות לירות על מטרות חריגות בשטח, למשל לאורך הגבול,  באופן אוטומאטי. שם טעות של המכונה עלולה לעלות בחיי אנשים חפים מפשע.

"בגלל זה, כאשר מדובר במערכות יורות, צריך שהלחיצה על ההדק תתבצע על ידי אדם, גם אם הוא רחוק מהסנסורים ומאמצעי האש עצמם. בעתיד, יכול להיות שגם זה ישתנה. חשוב להבין שבהפעלה של מערכות שמבוססות על כריית מידע ועל בינה מלאכותית מצריכה תהליך של לימוד ותהליך של אימון (טרייניג). קודם מייצרים את התובנות ורק אחרי זה משתמשים בהן. האימון ממשיך כל הזמן, כי העולם משתנה".

ש. לאמריקאים יש כבר שנים רבות מערכת האזנה מודיעינית כלל עולמית ידועה המכונה "אשלון" echelon. עד כמה ישראל מתקדמת ברמה העולמית בהתייחס לתובנות שאפשר להשיג ממערכות מעין אלה?

"בתחום המודיעיני קשה לערוך השוואות בין גופים שונים ובין מדינות, אבל ככלל "אשלון" היא מערכת קליטה. השאלה היא מהן התובנות שארצות הברית מפיקה ממנה. בתחום התובנות, אני חושב שישראל נמצאת במקום מאוד מתקדם".

ש. יכולים להיות אנשים שיחמקו לחלוטין  גם ממערכות המודיעין המתוחכמות ביותר, כמו למשל אוסאמה בן לאדן, שהאמריקאים אינם מצליחים לשים את ידם עליו? אולי אי אפשר לעקוב בשום דרך אחרי אדם מבודד לגמרי בתוך מערה שאינו משתמש בטלפון.

"ככל הנראה, היו לאמריקאים כמה הזדמנויות טובות לעלות על עקבותיו של בן לאדן. אני מעריך שגם אם הוא עצמו אינו משתמש בשום מכשיר קשר או טלפון, יש אנשים שעובדים בשבילו, ומביאים לו כסף ואוכל. אותם אנשים חייבים להשאיר אחריהם איזשהי חתימה אלקטרונית. למצוא את המידע שרלוונטי לגביהם -  זה האתגר הגדול של גופי המודיעין הרלוונטיים".