חדשות היום

חשיפת יכולות מחשוב עתירות-ביצועים אספקת מתח מודולרית וארכיטקטורות חדשניות להפקת ביצועי-על

המורכבות ההולכת וגדלה ומגוון עומסי העבודה החישובית דורשים יכולות עיבוד נתונים עצומות זן המעבדים החדש מסוגל להגדיל את קצב העברת הנתונים ולקצר את זמן האחזור – בין אם מדובר במרכז נתונים בענן או במתקני הארגון. עם זאת, ההתפתחויות בתחום המעבדים דוחפות עוד ועוד את גבולות אספקת המתח הנדרשת להפעלתם. עקב כך, אספקת המתח היא לעיתים קרובות הגורם המגביל את היכולת לקצור ביצועי שיא של המעבדים.

על פי Mordor Intelligence, חברה לחקר שוק, שוק מרכזי הנתונים העצומים (hyperscale) יגדל בשיעור צמיחה שנתי מורכב (CAGR) של 4.85% בין 2021 ל-2026.

מרכזי הנתונים סובלים מהתחממות-יתר עקב הביקושים

המגיפה האחרונה העניקה דחיפה רצינית לתחומי הקניות המקוונות, הסטרימינג של המדיה והעבודה מהבית, מה שגרם לספקי ולמוכרי שירותי מרכזי נתונים עצומים להרחיב את הקיבולת שלהם. עם זאת, כדי לקבל תמונה מלאה יותר של צמיחת מרכזי הנתונים, יש לבחון זאת על רקע מספר מנועי צמיחה נוספים. בין המגמות העיקריות שהניעה הטכנולוגיה בעשור האחרון ניתן למנות את האינטרנט של הדברים (IoT), בינה מלאכותית (AI), למידת מכונה (ML), וכן צמיחה מעריכית של עומסי העבודה של טכנולוגיה תפעולית (OT). יוזמות לשיפור ביצועים תפעוליים תעשייתיים כגון Industry 4.0 גרמו לגידול דרמטי בפריסתם של יישומי OT. גורמים אלה דורשים קיבולת חישובית נוספת, אך הם גם הביאו לעומסי עבודה מגוונים ותובעניים יותר.

יש דרישה הולכת וגדלה ממרכזי נתונים שיציעו תשתית חישובית גמישה וניתנת-לשדרוג המסוגלת לתמוך בעומסי עבודה דינמיים ביותר כדי לספק שירותי ענן או שירות במתקני הארגון. תכונותיהן של חלק מהמשימות החישוביות האלו שדורשות המגמות הקיימות כוללות זמן אחזור קצר, אלגוריתמים מקביליים (spiking) של רשתות עצביות, והאצה של החיפוש. שירותי עיבוד מתמחים וממוטבים-היטב כגון רשתות שערים לתכנות-בשטח (FPGA), יחידות עיבוד גרפיות (GPU) ויחידות עיבוד עצביות (NPU), שבעבר לא נעשה בהם שימוש רב במרכזי נתונים, הפכו כיום לנפוצים. כמו כן יש זן חדש של  מעגלים משולבים ספציפיים-ליישום (ASIC), כגון מנועים לרשתות עצביות של AI, שנהנה מביקוש גבוה למשימות חישוביות עתירות-ביצועים.

היתרונות של טכנולוגיות המעבדים מאפשרים לחישוביות עתירת-ביצועים למתוח את גבולות תפוקת המשימה וליהנות מהגמישות של גיוון רב יותר בעומסי העבודה. עם זאת, הישגים טכנולוגיים מסתמכים לרוב על היבטים אחרים של המערכת לצורך התקדמות משותפת.

המגמות הטכנולוגיות שמגדילות את הביצועים החישוביים גם מדגישות את האתגרים התרמיים

השינוי בתעשיית המוליכים למחצה הוא בלתי-נמנע. כל אימת שצומת סיליקון חדשה וזעירה יותר עוזבת את פס הייצור, הגרסה הבאה שלה כבר בתכנון. גאומטריות קטנות יותר מאפשרות אריזה של יותר שערי מוליכים למחצה אינדיווידואליים בתוך נפח נתון. למרות שצומתי 65nm ו-55nm עדיין נמצאים בשימוש נפוץ במעגלים משולבים רבים (ICs), התקני חישוב עתירי-ביצועים כגון ASICs, ‏FPGAs, ‏GPUs ו-NPUs משמשים בדרך כלל לצומתי עיבוד של 12nm ומטה, וגם צומתי 7nm ו-5nm הופכים ליותר ויותר פופולריים. כיום כבר יש לקוחות שעומדים בתור למעבדים עתירי-ביצועים מתוחכמים ביותר העושים שימוש בצומתי עיבוד של 3nm.

הגדלת צפיפות השערים האינדיווידואליים על ידי הפחתת ממדיהם מדגישה את המגבלות של ניהול המאפיינים התרמיים של המעבדים החדשים. הפחתת מתח העבודה של השער, תהליך הקרוי התאמת מתח (voltage scaling), מפחיתה את פליטת החום של כל טרנזיסטור, אך הניהול התרמי של החבילה כולה הוא עדיין העניין החשוב ביותר.

בדרך כלל, מעבד עתיר-ביצועים יפעל בקצב השעון המרבי שלו עד שהמגבלות התרמיות ידרשו את הפחתת הקצב הזה. התאמת מתח הביאה לכך שמתחי הליבה ירדו לכדי 0.75V עבור רוב התקני צומתי העיבוד של 5nm, וימשיכו לרדת לערך החזוי של 0.23V עבור צומתי עיבוד של 3nm. כדי לסבך אף עוד יותר את אתגר אספקת המתח, התקנים רבים דורשים כיום מספר מסילות עם רמות מתח שונות, המסודרות זו אחר זו באופן מוקפד למניעת נזק קבוע.

תמונה 1: זרם.

כאשר בכל GPU חדיש ניתן בדרך כלל למצוא מאות מיליארדי טרנזיסטורים, דרישות הזרם הופכות לעצומות, עד לכדי רמה מרבית של מאות אמפרים. דרישת זרם של 1,000A כבר אינה כה יוצאת דופן עבור מעבד AI הבנוי באשכולות. על פי המגמה הנוכחית, צריכת ההספק של המעבד מכפילה את עצמה אחת לשנתיים (איור 1).

אספקת המתח ויעילותה הפכו להיות כאב הראש הגדול ביותר עבור מערכות מחשוב בקנה מידה גדול. התעשייה חווה כעת גידול דרמטי בהספק שצורכים מעבדים, זאת לאור התקדמותן של ASICs ושל GPUs לעיבוד פונקציות AI מורכבות. גם אספקת המתח למדפי ציוד (racks) מטפסת מעלה בהדרגה ככל שיכולות ה-AI מגויסות לטובת יישומי למידה והסקת מסקנות בקנה מידה גדול יותר. ברוב המקרים, אספקת המתח היא כיום הגורם המגביל בביצועי המחשוב, כל עוד ה-CPUs החדשים צורכים יותר ויותר זרם. אספקת המתח כרוכה לא רק בפיזור ההספק אלא גם ביעילות, בגודל, בעלויות ובביצועים התרמיים שלה.

היבט נוסף של אספקת מתח להתקנים צמאי-הספק כאלה הוא העובדה שעומסי העבודה שלהם יכולים להשתנות תוך מיקרו-שניות, דבר שעלול לגרום לקפיצות זרם זמניות על פני רשת אספקת המתח (PDN).

תמונה 2: מעבד.

אתגרים של אספקת מתח

כפי שהודגש לעיל, ההתקדמות בטכנולוגיות העיבוד של מוליכים למחצה הציבו מספר תנאים מאתגרים בפני רשת אספקת המתח. לא כל האתגרים האלה הם בתחום הטכני. לדוגמה, הגודל הפיזי של התקני העיבוד החדישים והמתקדמים האלה תופס אחוז נכבד מהשטח הזמין של הלוח המודפס. הבעיה כאן היא ששטח הלוח מוגבל בדרך כלל לגודל (form factor) המקובל בתעשייה.

מה שמחמיר את בעיית גודל הלוח עוד יותר הוא שאופיים של התקני חישוב עתירי-ביצועים דורש שהמעגלים המשולבים התומכים בהם, כגון זיכרון ומקלטים-משדרים אופטיים, ימוקמו קרוב למעבד. גישה זו חלה גם על מייצבי מתח מסוג נקודת עומס (Port of Load, או PoL) עקב הגידול הדרמטי בצריכת הזרם והפחתת מתחי הליבה. השפעת ההתנגדות השיורית של ה-PCB בתנאים של זרם גבוה יוצרת הפסדי I2R עם ירידת מתח ניכרת לעין שמספיקה כדי להשפיע על ביצועי המעבד, וגרוע מכך, לגרום להתנהגות לא-יציבה שלו. מייצבי PoL חייבים גם להיות יעילים מאוד בהספק שלהם, זאת כדי למנוע סיבוכים בניהול התרמי שלהם. (איור 2).

אספקת מתח אנכית (VPD) מפחיתה עוד יותר את הפסדי פיזור המתח ואת צריכת VR של אזור לוחות ה-PCB. ה-VPD דומה בעיצוב לפתרון ה-LPD (אספקת מתח צידית) של Vicor, עם השילוב הנוסף של קיבוליות עוקפת למודול מכפיל הזרם (ה-GCM).

השילוב של לוחות מוגבלים בגודלם ושל הצורך למקם מייצבים בסמיכות למעבד, מאלץ את המהנדסים לאמץ גישה חדשה וחדשנית לתכנון הארכיטקטורה של רשת אספקת המתח (PDN).

אספקת המתח למעבד: רשת אספקת המתח הופכת לגורם מגביל

ככל שטכנולוגיות המעבדים ממשיכות להתפתח, תכנון ארכיטקטורלי יעיל של רשתות אספקת מתח מציב בפני מהנדסי מערכות אספקת מתח שלושה אתגרים משמעותיים הקשורים זה לזה.

הגדלת צפיפות הזרם: מעבדים עתירי-ביצועים בחזית הפיתוח יכולים לצרוך מאות אמפרים. הבאת אספקת מתח מספיקה למעבד קשורה לא רק למגבלות הפיזיות של מיקום ממירי ה-PoL, אלא גם להחלטות מורכבות בנוגע לניתוב אספקת המתח ממחברי הקצה אל הממיר על גבי עקבות (tracks) ה-PCB. קפיצות זרם זמניות בתנאי מתח גבוה כתוצאה מעומסי העבודה האולטרה-דינמיים עלולים לפגוע ברכיבים אחרים במערכת.

שיפור יעילות אספקת המתח: יש שני גורמים המשפיעים על יעילות אספקת המתח: הפסדי I2R ויעילות ההמרה. העקבות שעל ה-PCB הן אידיאליות לניתוב אותות במתח נמוך ורכיבים לוגיים דיגיטליים, אך כשמדובר בזרם גבוה, לא משנה עד כמה הוא קצר, עלולים להיגרם בגללו הפסדי התנגדות משמעותיים. הפסדי I2R אלה מפחיתים את המתח המסופק למעבד, ועלולים לגרום להתחממות מקומית. כאשר יש מאות רכיבים אחרים על גבי כרטיס המעבד, יש הגבלה על גודל עקבות אספקת המתח על הכרטיס, ולכן החלופה בת-הקיימא היחידה היא למקם את הממירים קרוב כמה שניתן למעבד.

יעילות אספקת המתח של הממיר היא אחת מתכונות התכן שלו. פיתוח ממירי PoL עתירי-יעילות דורש כישורים מיוחדים, הקשורים לגישה של בדיקות חוזרות-ונשנות להבנת ההפסדים של כל רכיב, מהרכיבים הפסיביים ועד לרכיבי המוליכים למחצה. כפי שכבר הודגש, ההפסדים האלה מתבטאים בצורת חום שיש לפזר אותו. מתכנני המודולים של ממירי PoL מיישמים את מומחיותם הייחודית כדי למטב את התכן הפנימי של המודול כך שמה שיתקבל בסופו של דבר היא חבילה איזותרמית.

שמירה על פשטות רשת אספקת המתח: לאור האתגרים ברשת אספקת המתח, יש ארכיטקטים של מעגלי הספק שמעדיפים ליצור ממיר PoL דיסקרטי עבור המעבד על פני יצירת התאמה אישית פרטנית של רשת אספקת המתח כולה. אך למרות האטרקטיביות של גישה כזו כפתרון בר-קיימא, היא יוצרת למעשה מורכבות נוספת. תכן דיסקרטי מגדיל את עלות החומרים (BOM), מוסיף את הצורך להזמין רכיבים נוספים ומגדיל את עלויות הלוגיסטיקה ושרשרת האספקה הנוספות שנגרמות עקב כך. גישה זו גם דורשת יותר מאמץ הנדסי, מגדילה את ההוצאות הבלתי ניתנות להחזרה (NRE), ומאריכה את משך הפיתוח והבדיקות. עקב כך, פיתחנו גישה מודולרית שנועדה למטב את תהליך אספקת המתח למעבדים עתירי-ביצועים. מודולי אספקת מתח מותאמים-תרמית משולבים מפשטים במידה ניכרת את תכנון אספקת המתח, מפחיתים את עלות החומרים, מוסיפים גמישות לשינויים אפשריים, ומזרזים את הפיתוח. מודולי אספקת המתח הם קומפקטיים, צפופי הספק וקלים לצמצום/הרחבה (scaling).

חיבור מערכות 12V למערכות 48V. עבור מערכות מיושנות יותר שבהן יש צורך ביותר יעילות והספק, Vicor מציעה פתרון פשוט העושה שימוש בממיר אפיק ™NBM דו-כיווני לא-מבודד (bidirectional NBM™ non-isolated bus converter). ה-NBM מאפשר המרה יעילה מ-48V ל-12V ולהיפך, תוך שילוב של לוח מיושן עם תשתיות של 48V, או של ה-GPU העדכני ביותר עם מדף ציוד מיושן הפועל במתח 12V

גישה מובנית לפתרון אתגרים באספקת מתח עבור מעבדים עתירי-ביצועים

כדי לפתור את אתגרי רשת אספקת המתח הנפוצים כיום, Vicor מציעה שתי גישות שנותנות מענה לרוב הנסיבות השכיחות.

גישור למערכות מיושנות יותר (legacy): חיבור מערכות 12V למערכות 48V. עבור מערכות מיושנות יותר שבהן יש צורך ביותר יעילות והספק, Vicor מציעה פתרון פשוט העושה שימוש בממיר אפיק ™NBM דו-כיווני לא-מבודד (bidirectional NBM™ non-isolated bus converter). ה-NBM מאפשר המרה יעילה מ-48V ל-12V ולהיפך, תוך שילוב של לוח מיושן עם תשתיות של 48V, או של ה-GPU העדכני ביותר עם מדף ציוד מיושן הפועל במתח 12V. (איור 3).

אספקת מתח של 48V לנקודת העומס (PoL): 48V לנקודת העומס. פתרון חבילת ההספק (Power-on-package, או PoP) של Vicor מסוגל להפחית את ההתנגדויות בלוח האם עד פי 50 ואת מספר הפינים של עוצמת עיבוד ליותר מפי 10. תוך מינוף של גישת Factorized Power Architecture (FPA™), הצליחה Vicor למזער את ההתנגדויות של “האינץ’ האחרון” הודות לשני פתרונות המוגנים ע”י פטנט – אספקת מתח צידית (LPD) ואספקת מתח אנכית (VPD). שני הפתרונות מאפשרים למעבדים להשיג רמות ביצועים שלא היו אפשריות עד כה, זאת כדי לתמוך בדרישות העיבוד של מערכות עתירות-עיבוד (HPC) שצמיחתן כיום היא מעריכית.

הדרישות מצד מרכזי נתונים, מחשוב קצה (edge compute) והאינטרנט של הדברים (IoT) רק הולכות וגדלות. עבור ה-Big data נדרש עיבוד מהיר מתמיד. מהירויות העיבוד המרביות של היום כבר יהיו איטיות מדי בעוד תשעה חודשים, ואספקת המתח שוב תעמוד במרכז הבעיה. מציאת דרכים חדשות להגדלת התפוקה ולקיצור זמן האחזור היא אתגר שחוזר שוב ושוב. זיהוי פתרונות שיהיו גמישים וגם ניתנים לצמצום או להרחבה הוא הפיסה החסרה בפאזל. כך יהיה פחות צורך בתכנון-מחדש ויהיה קל יותר לבצע שינויים בעתיד. הגישה המודולרית משלבת את כל היבטי המחשוב עתיר-הביצועים הן כיום והן בעתיד.


דאג פינג (Doug Ping), מהנדס יישומים בכיר ב-Vicor

תגובות סגורות