חדשות היום

חישוב רב־משתתפים: פלא קריפטוגרפי בחיפוש אחרי יישום מסחרי

בעשרים השנים האחרונות, הפכו החיים האישיים והמקצועיים שלנו לדיגיטליים. המעבר לדיגיטל אמנם מאפשר לנו לתקשר, לשתף מידע ולצרוך תכנים בדרכים שבעבר נחשבו דמיוניות, אבל הוא גם חושף אותנו יותר לפגיעה בפרטיות ולגניבת מידע, ובפרט כשהמידע ומפתחות האבטחה מנוהלים על ידי ישות מרכזית. כאן טמון יתרונו הגדול של חישוב רב־משתתפים (בראשי תיבות באנגלית: MPC).

חישוב רב־משתתפים הוא ענף בקריפטוגרפיה שמאפשר לארגונים, או למחלקות שונות בארגון, לחשב תוצאה על סמך מידע פרטי באופן שלא חושף את המידע הפרטי ליתר המשתתפים או לצד־שלישי.

במאמר זה מתאר פרופ’ נייג’ל סמארט מ־COSIC (קבוצת מחקר ב־imec באוניברסיטת לוון שבבלגיה) את תרחישי השימוש שבהם גישת החישוב רב־משתתפים מוסיפה ערך, את תרחישי השימוש שלא יכולים להרוויח ממנה ומדוע הפלא הקריפטוגרפי הזה עדיין לא הגיע לבשלות מסחרית.

מעשה בארבעה בנקאים

לחישוב רב־משתתפים היסטוריה ארוכה. החל מתחילת המחקר בשנות ה־80 של המאה העשרים ועד למערכת המעשית הראשונה שהופעלה בשנת 2008 במכרז לחוזי סלק סוכר שנערך בדנמרק. במכרז שימש החישוב רב המשתתפים להערכת מחיר השוק של סלק הסוכר מבלי שיזדקקו המשתתפים לחשוף את תעריפי המכירה או הקנייה שלהם. בסיום המכרז נקבע מהן ההצעות הזוכות מבלי לפרסם פרטים כלשהם מלבד המחיר הסופי שעליו הסכימו הקונה והמוכר.

דוגמה נוספת המסבירה היטב את בעיית החישוב רב המשתתפים היא משל ארבעת הבנקאים.

ארבעה בנקאים נפגשים לארוחת צהריים ומסכמים ביניהם שמי שקיבל את הבונוס הגדול ביותר יהיה זה שישלם את החשבון. אך אליה וקוץ בה. עליהם לעשות זאת מבלי לנקוב במפורש בגובה הבונוס שקיבלו. במילים אחרות: לכל אחד מהם יש סוד (סכום הבונוס) ועליהם להשוות בין הסודות האלה כדי לקבוע מי צריך לשלם את החשבון. זהו היתרון הגדול של חישוב רב־משתתפים שמבצע את החישובים הנדרשים באופן שהקלט (כלומר הסוד) של כל אחד מהבנקאים נשאר חסוי.

מפיצול מידע רגיש ועד לעבודה משותפת בין מספר גורמים

טכנולוגיית חישוב רב־משתתפים משמשת לרוב בשני תרחישים. פיצול מידע רגיש או עבודה משותפת בין גורמים שלא בהכרח סומכים זה על זה.

דוגמה לפיצול מידע תהיה חברה המשתמשת במפתח הצפנה לניהול ארנק המטבעות הקריפטוגרפים שלה או לעדכון תוכנה. במקום לשמור את מפתח ההצפנה במקום אחד, יכולה החברה לשפר את אבטחת מערכות המידע שלה באופן משמעותי באמצעות טכנולוגיית חישוב רב־משתתפים. החישוב רב המשתתפים יפצל את מפתח ההצפנה לחלקים מספר, מבלי להידרש לחיבורם על מנת לאמת את מפתח ההצפנה.

תרחיש השימוש השני של חישוב רב־משתתפים הוא כשארגונים שונים, או גורמים שונים בתוך אותו ארגון, מעוניינים להשיג תוצאה משותפת, אך באופן שישמור על הקלט שלהם פרטי ולא יחשוף אותו לשאר המשתתפים. בדיוק כמו במשל על ארבעת הבנקאים. עוד דוגמה טובה היא סקר השכר בבוסטון, שהשווה את השכר הממוצע לגברים ונשים בבוסטון על סמך נתונים שנאספו ממחלקות משאבי האנוש של יותר מ־200 חברות. גם פה שימשה טכנולוגיית חישוב רב־משתתתפים לחילוץ הנתונים הסטטיסטיים מבלי לחשוף את הפרטים ליתר המשתתפים בסקר.

נושאי הדגל כיום: פייסבוק וגוגל

כיום השימוש הטוב ביותר לחישוב רב־משתתפים הוא לצד יישומי סטטיסטיקה תיאורית. דוגמה טובה לכך היא סקר השכר בבוסטון, שם ביקשו לדעת מהו השכר הממוצע במגזר נתון במשק. דוגמה טובה נוספת היא ניתוח נתונים שהתקבלו מחיישן. בכל המקרים האלה יעזור חישוב רב־משתתפים לבצע את החישובים בצורה מאובטחת.

חברות במשק, ובהן פייסבוק וגוגל, כבר פנו לפתרונות על בסיס חישוב רב־משתתפים, אם כי נכון להיום מדובר אך ורק על פתרונות לבעיות נקודתיות. כך לדוגמה משתמשת גוגל בחישוב רב־משתתפים לקבלת תובנות על המתאם שבין נתוני הצפייה בפרסומות (של גוגל) לנתוני רכישת הלקוחות של המפרסמים, וזאת מבלי שהצדדים יזדקקו לחשוף את הנתונים ולשתף אותם זה עם זה.

חוקרים בפייסבוק מספרים כי חישוב רב־משתתפים עוזר להם לבנות מודלים הקשריים משמרי פרטיות לפתרון בעיית המהמר (Bandit), שהם הבסיס למנועי הדירוג וההמלצות של החברה. הטכנולוגיה של פייסבוק נקראת CrypTen ונטען שהיא מודעת לכך שמשתתפים שונים מחזיקים במידע הקשרי שונה (כלומר סודות) שהם לא מוכנים לשתף עם יתר המשתתפים. על בסיס ההבנה הזאת, לטענת פייסבוק, מאפשרת טכנולוגיית CryptoTen לאמן מודלים של למידת מכונה שמכבדים את הפרטיות של המשתמשים.

במבט לעתיד ואל יישום מסחרי רחב יותר מפתרון בעיות נקודתיות

אין מחלוקת על כך שלשיטת החישוב רב המשתתפים פוטנציאל גדול ואכן, כבר היום פועלות בתחום אינספור חברות הזנק; בעיקר מאירופה. עם זאת, עד כה נבנו רק פתרונות לבעיות נקודתיות בענפי הכספים, מטבעות קריפטוגרפים וחתימת קוד. הטכנולוגיה עדיין לא הבשילה לכדי יישום מסחרי אמתי, מכיוון שחישוב רב־משתתפים הוא עניין מורכב מאוד המחייב ארגונים להשקעה כספית גדולה ולהשקעה משמעותית במידע ובתשתית טכנולוגיית המידע של הארגון.

ניקח את ענף שירותי הבריאות כדוגמה. בשעה שהעולם ממשיך להתמודד עם מגפת הקורונה, היכולת לשתף מידע רפואי בין בתי חולים מבלי לחשוף מידע אישי רגיש נראה כמו צורך השעה יותר מאי פעם. אולם, באופן מעשי אין למחלקות המחשוב של בתי החולים את היכולת לעשות זאת. לא זאת אף זאת, עושר המידע הרפואי – תוצאות מדידת לחץ דם, דימות רפואי ועד למסמכים הכתובים בכתב חרטומים של רופאים – רק מכביד והופך את המשימה למורכבת פי כמה.

לעתים קרובות אנחנו דווקא רואים עניין מצד חברות במשק בחישוב רב־משתתפים כאמצעי לשיפור אבטחת מידע רגיש. במבט ראשון זה נראה כמעט הפתרון המתבקש, אבל בחינה יסודית יותר מבהירה במהירות שעצם השימוש בפתרון כזה לא פעם מפר את עקרונות וחוקי הגנת הפרטיות.

לדוגמה: על מנת לייעל את התהליכים העסקיים, מחפשת חברה דרך לאבטח מידע רגיש שהיא מעוניינת לחלץ מהמידע שהיא אוספת על המשתמשים. כאן טמונה הבעיה: עצם עיבוד המידע – אותו תהליך לחילוץ המידע המבוקש מכלל המידע שנאסף – הוא פגיעה בפרטיות ושום פתרון טכנולוגי לא יכול למנוע או לשנות את זה.

זהו למעשה אחד האתגרים הבסיסיים בפתרון לבעיית ארבעת הבנקאים: עצם פרסום תוצאת החישוב (כולם רואים מי הבנקאי שמשלם על הארוחה) הופך את התרגיל כולו לכזה שבו לא נשמרת פרטיות המשתתפים. במילים אחרות: חישוב רב־משתתפים לא מוסיף ערך לתרחישי שימוש כאלה שבהם עצם עיבוד המידע מוביל לפגיעה בפרטיות.

נכון להיום, המורכבות של הטכנולוגיה והעדר תרחיש שימוש מסחרי ברור הם החסמים הגדולים ביותר בפני אימוץ נרחב יותר של טכנולוגיית חישוב רב־משתתפים. הפוטנציאל המסחרי של טכנולוגיית חישוב רב־משתתפים טמון בפונקציות עמוקות, דבר הפוסל את רוב האלגוריתמים המודרניים, כמו אלה המשמשים בלמידת מכונה.

SCALE-MAMBA – הזמנה פתוחה להתנסות בחישוב רב־משתתפים

COSIC, קבוצת מחקר של imec באוניברסיטת לוון (בלגיה), ידועה בזכות המחקר שלה בתחום חישוב רב־משתתפים המתמקד בשלושה היבטים מרכזיים:

1) ניתוח היתכנות: החוקרים של COSIC בודקים אפשרויות ליישומי חישוב רב־משתתפים בעלי ערך גבוה. לדוגמה: במענה לבקשה לא רשמית מהבנק המרכזי האירופי, הם חוקרים אלגוריתמים שונים להתאמת נזילות במערכות פיננסיות מבלי לחשוף מידע רגיש שבו מחזיק הבנק.

2) הם בונים פרוטוקולים משופרים לפיתוח מערכות חישוב רב־משתתפים חדשות. כאן נדרש מחקר של הפרוטוקולים הקריפטוגרפים שעליהם מבוססת המערכת, פיתוח פרוטוקולים קריפטוגרפים חדשים, מיטוב פרוטוקולים קריפטוגרפים קיימים או התאמתם לתרחישי שימוש חדשים.

3) החוקרים פיתחו שפת תכנות ומערכת פתוחה בשם SCALE-MAMBA המאפשרת לכל מי שמתעניין בחישוב רב־משתתפים להתחיל להתנסות בטכנולוגיה. את המערכת אפשר להוריד מדף הפרויקט באתר Github, והיא מאפשרת לחוקרים ולאנשי טכנולוגיות מידע להתנסות בעיבוד מידע מוצפן באופן ששומר על הסודיות של מידע רגיש. ייחודה של מערכת SCALE-MAMBA הוא בכך שהיא בנויה כמערכת מסחרית, לעומת מערכות אקדמיות דומות שבדרך כלל מתמקדות במהירות החישוב.

עם זאת, נכון לרגע זה אין כוונה או תכנית להפוך את מערכת SCALE-MAMBA למסחרית. לאמיתו של דבר, המערכת מופצת ברישיון קוד פתוח, כדי לאפשר לחברות ולחוקרים להתנסות בה בחופשיות. חברות מספר כבר משתמשות באבני הבניין של מערכת SCALE-MAMBA במוצרים שלהן. בתמורה, הן תורמות את הידע או הפיתוחים שלהן בחזרה לקהילת הקוד הפתוח. בצורה כזאת שני הצדדים מרוויחים; הרי כל המטרה כאן היא שיותר אנשים יתחילו להתנסות ולעבוד עם טכנולוגיית חישוב רב־משתתפים.

נייג’ל סמארט, IMEC
צילום: IMEC

למידע נוסף על מערכת SCALE-MAMBA:

על נייג’ל סמארט (Nigel Smart)

נייג’ל סמארט הוא פרופסור ב־COSIC, קבוצת מחקר של imec באוניברסיטת לוון (בלגיה). נייג’ל הוא קריפטוגרף המתמחה בקריפטוגרפיה תיאורטית ויישומית. בעברו כיהן כסגן נשיא IACR, הוא אחד מהמארגנים המקוריים של כינוס Real World Cryptography ומייסד שותף של חברת אבטחת המידע Unbound Security.


קרדיט תמונות: IMEC

נייג'ל סמארט, IME

תגובות סגורות