חדשות היום

פתרונות HPC חדשים מאינטל

אריק וינשטיין

מדענים, חוקרים ומהנדסים סביב העולם משתמשים באשכולות מחשוב עתירי ביצועים (High Performances Computing) כדי לדחוף קדימה את גבולות הידע והחדשנות. הם צרכים ביצועים הגבוהים מתמיד כדי להתמודד עם האתגרים המורכבים והגדלים בהתמדה של היום. הפתרונות של אינטל מספקים עוצמה וגמישות לייעול הביצועים החל באשכולות מחשוב קטנים ועד למחשבי על הגדולים.
משפחת Intel Xeon Processors E5: מספקת קפיצת מדרגה לכל דיסציפלינה שתלויה ב-HPC עם ביצועים מובילים בשוק וביצועים לוואט משופרים. המשפחה מגדילה את מספר הפעולות הצפות לשניה (FLOPS) פי שניים ביחס למעבדים מהדור הקודם ומביאה לשיפור הביצועים בעולם האמיתי בעד 70 אחוז.
Intel Xeon Phi Coprocessor: מאפשר להוסיף עד teraflop לביצועים ביישומים מקביליים, תואם לתוכנה שנכתבה למשפחת ה-Intel Xeon Processor E5 כך שניתן להאיץ ביצועים ליישומים מקביליים קיימים ללא הצורך לשכתב אותם או ללמוד כלי פיתוח תוכנה חדשים. מוצרים נוספים שאינטל מספקת שעוזרים להשגת ביצועים גבוהים יותר מה-HPC כוללים Solid State Drives, מתגי Intel True Scale Fabric וכן מתאמים התומכים בארכיטקטורת InfiniBand. בנוסף, אינטל מפתחת ותומכת במערכת לניהול קבצים מסוג Lustre וכן מציעה כלי פיתוח תוכנה העוזרים לאופטימיזציה של הקוד בכדי להשיג יותר מאשכולות מחשוב, שרתים ותחנות עבודה מבוססי ארכיטקטורת אינטל.

ביצועים מובילים לרוב עומסי העבודה
משפחת Intel Xeon Processors E5 מאיצה ביצועים למגוון רחב של עומסי עבודה
(איור-1). ביחס לדור הקודם של סדרת Intel Xeon Processors 5600, משפחת מעבדים זו הכוללת עד לשמונה ליבות ו-16 תהליכונים (threads) לכל Socket, מאיצה את הביצועים עד ל-70% בטווח רחב של יישומים חישוביים טכניים, כולל יישומים בתחום הייצור הדיגיטלי (Digital Manufacturing), אנרגיה, שירותי פיננסים ובריאות ובמחקרים בתחום האקלים ומזג אויר.

עד לשיפור של 2X
ב-FLOPS
פעולות נקודה צפה הם בליבה של יישומי HPC רבים ומשפחת Intel Xeon Processors E5 מאפשרת עד קצב כפול של פעולות נקודה צפה לשניה ביחס למעבדי הדור הקודם. המפתח להאצת הביצועים היא טכנולוגיית Intel Advanced Vector Extensions או – Intel AVX, אשר מספקת פקודות חדשות ומגדילה את הווקטור המכסימלי מ-128 ל-256 ביט. Intel AVX מאיצה באופן משמעותי גם חישובים ווקטורים וחישובי נקודה צפה ע”י היכולת להכפיל את מספר הפקודות בכל מחזור שעון.
הכפלת רוחב הפס של ה-I/O
ביצועים גבוהים ליישומי HPC דורשים לא רק ליבות יעילות – נדרשת גם העברת מידע בין הליבות כדי לשמרן ברמת יעילות גבוהה. משפחת ה-Intel Xeon Processors E5 עונה על צורך זה ע”י שילוב של מערכת I/O ישירות על ה-die של המעבד וזאת כדי להקטין השהיות בעד 30%. מעבדים אלו מספקים עד ל-80 ערוצי PCIe לכל שרת בתצורת 2-Sockets (ו-160 ערוצי לכל שרת 4-Sockets) כאשר כל ערוץ תומך בתקן PCIe 3.0.

אבטחה מתקדמת
משפחת Intel Xeon Processors E5 תומכת ביכולות אבטחה האחרונות של אינטל.
לדוגמה, Intel Advanced Encryption Standard New Instructions () משלבת האצה בחומרה להצפנה מבוססת AES, כך שניתן להצפין את המידע עם השפעה קטנה על התגובתיות של היישום.

האצת ביצועים ליישומים מקביליים
Intel Xeon Phi™ Coprocessor 5110P
בעוד משפחת Intel Xeon Processors E5 היא הבחירה המועדפת לרוב היישומים, Intel Xeon Phi coprocessors מספקים ביצועים יעילים יותר ליישומים מקביליים. ניתן לשלב אחד ממעבדי עזר אלו לחריץ PCIe בשרת מבוסס Intel Xeon בכדי להאיץ ביצועים לקטעי קוד מסוימים או ליישום כולו. Intel Xeon Phi™ Coprocessor 5110P יחיד מספק עד
ל-60 ליבות ו-240 תהליכונים ויכול לבצע עד לשיא של teraflop-double precision בקוד מקבילי. ניתן לשלב עד 8 כרטיסים בשרת 2-Sockets יחיד ובכך לאפשר גידול דרמטי ביכולת העיבוד המקבילי. Intel Xeon Phi coprocessor מתוכנן לספק גמישות מרבית בשימוש משולב במערכות ואשכולות (Clusters) מבוססות מעבדי Intel Xeon (איור-2). הוא יכול לפעול תחת מערכת ההפעלה של השרת המארח כדי להאיץ ביצוע קטעי קוד מקבילים. שלא כמו מאיצים אחרים, מעבד העזר יכול לתפקד כצומת – שרת בלתי תלויה עם מערכת הפעלה Linux וכתובת IP משלו. בצורת עבודה זו הוא יכול להריץ יישומים בצורה בלתי תלויה ויכול להוריד עומס בבצוע קטעי קוד טוריים או מקביליים חלקית מהמערכת המארחת כך שהיישומים מבוצעים בקלות ויעילות. יחדיו, משפחת Intel Xeon Processors E5 ו-Intel Xeon Phi™ Coprocessor 5110P מציעים גמישות ופשטות בשילוב השרת ומשאבי אשכול החישוב כדי לספק ביצועים גבוהים כמעט בכל עומסי העבודה. מכיוון שהם יכולים להריץ את אותה תוכנה, אין צורך בחשיבה מחדש או כתיבה חדשה של הקוד. ניתן לבצע אופטימיזציה פעם אחת לקוד עבור 2 משפחות המעבדים. אותן אסטרטגיות ליישום המקביליות שמספקות ביצועים אופטימליים במשפחת Intel Xeon Processors E5 יספקו ביצועים אופטימליים ב-Intel Xeon Phi coprocessors.

מניעת צווארי בקבוק בעזרת מערכת אחסון מהירה
Intel Solid State Drives
הביצועים הגבוהים של – Intel Solid State Drives שומרים על מהירות גבוהה של זרימת המידע בכדי להגדיל את נצילות המעבדים ולשפר את הזמן-לתוצאה בעומסי עבודה אינטנסיביים ב-HPC. בעזרת השהיות נמוכות ויעילות בפעולות I/O לשנייה (IOPS), כונני SSD אלו עוזרים להימנע מצווארי בקבוק באחסון בצמתי שרתים מסוימים, צווארי בקבוק שבד”כ פוגעים בזמני התגובה של ה-HPC. בנוסף, כונני ה-SSD עוזרים לשמור על המידע בעזרת נקודות בדיקת אבטחה (Secure checkpoints) כדי למנוע איבוד מידע או פגיעה בו.
הגדלת אשכול המחשוב בעזרת רשת (Fabric) בעלת השהיה נמוכה ויכולת הרחבה

Intel True Scale Fabric (*)
Intel True Scale Fabric תוכנן מהיסוד כ-Interconnect למערכות HPC, כלומר יישומי HPC רצים מהר יותר וניתנים להגדלה בצורה טובה יותר מאשר הם משתמשות ביישומי InfiniBand מסורתיים. ככל שמוסיפים משאבי מחשוב לאשכול, ההשהיה (latency) נשארת נמוכה וקצב ההודעות גדל ביחד עם הגדלת הרשת ת ובכך מביא לניצול מרבי של משאבי המחשוב ולגידול כמעט לינארי של הביצועים.
הגדלת ביצועי מערכת האחסון בעזרת מערכת ניהול קבצים מהירה

Lustre Parallel File System
Lustre היא מערכת ניהול קבצים מבוססת קוד פתוח שתוכננה לביצועים גבוהים וכמויות מידע גדולות. היא נמצאת בשימוש ביותר מ-60% מ-100 מחשבי העל הגדולים בעולם. בעזרת Lustre, מקבלים בדרך כלל תפוקת מידע של 110MB/s על רשתות Gb-Eth, רוחב פס המגיע עד ל-1.5GB/s בערוצי InfiniBand Double Data Rate
(), עד ל-2.5GB/s בערוצי InfiniBand Quad Data Rate () וכן מעל 1GB/s ברשתות מבוססות 10 .Lustre יכולה לגדול עד לעשרות אלפי צרכנים ועשרות או אפילו מאות petabytes של אחסון. אינטל מספקת תמיכה ב-Lustre ומתחזקת distribution של הקוד הפתוח.

פיתוח יישומים בעלי ביצועים גבוהים בפחות מאמץ
Intel Parallel Development Studio
אינטל מספקת כלי תוכנה שתוכננו לעזור למפתחים להוציא את הביצועים והמקביליות המכסימליים מהקוד במאמץ קטן יותר. Intel Parallel Studio מאפשר למפתחים לתכנן, לבנות, לנפות, לאמת ולכוונן גם יישומים טוריים וגם מקביליים וזאת בכדי לספק ביצועים טובים יותר על ארכיטקטורת מרובות ליבות של אינטל. הפתרון כולל כלים חזקים לתכנות מקבילי הניתנים לשימוש ביחד או לחוד כדי לספק ביצועים אופטימליים ולקדם את כל שלבי מחזור הפיתוח.

עיבוד מתקדם כדי לעמוד באתגרים של היום – וגם מחר
בעולם ה-HPC, כל שיפור או גידול בביצועי המעבד מייצר הזדמנות להאיץ את קצב המחקר והפיתוח. Intel Xeon Processors E5 ו-Intel Xeon Phi™ Coprocessor 5110P מספקים גמישות מוחלטת להפקת הביצועים הגבוהים ביותר מיישומים דורשי משאבים בסביבות HPC. משפחת Intel Xeon Processors E5 מציעה הכפלה בביצועי ה-FLOPS ביחס למשפחה מהדור הקודם. ה-Intel Xeon Phi™ Coprocessors מאפשרים להוסיף עד ל-teraflops של פקודות נקודה צפה בדיוק כפול לכל מעבד. ניתן גם ליהנות מהיתרון בשימוש בכונני Intel Solid State (SSD) ,Intel True Scale Fabric וכן מגרסת Lustre לניהול קבצים בצורה מקבילית שעברה אופטימיזציה וזאת כדי להפיק את הביצועים הגבוהים ביותר מסביבת המחשוב שלך.

תגובות סגורות