כשהזרם עולה: אתגרי Power Delivery במערכות AI מתקדמות

ככל שמערכות AI מתקדמות ממשיכות להתרחב, תשומת הלב ההנדסית עוברת בהדרגה משכבת החישוב לשכבת התשתית. אחד התחומים שבהם השינוי בולט במיוחד הוא אספקת הכוח: זרמים גבוהים, דרישות תגובה מהירה וצפיפות הולכת וגדלה מציבים אתגר חדש למהנדסי מערכות, ומובילים לאימוץ ארכיטקטורות הספק מתקדמות.

במשך שנים, תכנון מערכות הספק נתפס כשכבה תשתיתית יחסית, כזו שניתן לייעל אך אינה מגבילה את ביצועי המערכת. אלא שבעידן ה-AI, ההנחה הזו כבר אינה תקפה. מאיצים מודרניים פועלים בזרמים של מאות אמפר – ולעיתים אף מתקרבים ל־500A ויותר לכל שבב – ודורשים יציבות מתח גבוהה במיוחד גם תחת עומסים דינמיים. במצבים כאלה, כל סטייה קטנה יכולה להשפיע על ביצועים ואף על יציבות המערכת.

האתגר המרכזי אינו רק בהספק הכולל, אלא בהתנהגות הדינמית של המערכת. עומסי AI מאופיינים בקפיצות מהירות בצריכת הזרם – transient events – שמתרחשים בפרקי זמן קצרים מאוד. מערכת אספקת הכוח נדרשת להגיב כמעט מיידית, תוך שמירה על מתח יציב. כאן בדיוק מתחילות להופיע מגבלות של ארכיטקטורות Voltage Regulation קלאסיות, שאינן מצליחות לספק תגובת transient מספקת מבלי להוסיף קיבולים גדולים או להגדיל את המורכבות.

במקביל, ככל שהזרמים עולים, כך הופכים גם הפסדי ההולכה (conduction losses) לגורם משמעותי. ברשתות אספקת כוח (PDN – Power Delivery Network), ההפסדים גדלים לפי I²R, ולכן מעבר מ־200A ל־600A אינו רק פי שלושה בזרם – אלא פי תשעה בהפסדים. בתצורות מסורתיות, שבהן הזרם נע אופקית על גבי שכבות PCB, המשמעות היא חום, ירידת מתח ואובדן יעילות.

על רקע זה, מתפתחת גישת Vertical Power Delivery. במקום להזין את המעבד דרך מסלולים אופקיים ארוכים, הכוח מועבר קרוב יותר לליבת המעבד, לעיתים דרך מבנים אנכיים או אינטגרציה מתקדמת במארז. קיצור המסלול מפחית התנגדות, מצמצם הפסדים ומשפר את תגובת המערכת – אך מציב דרישות חדשות לרכיבי ההספק עצמם: הם חייבים להיות קומפקטיים יותר, צפופים יותר ומהירים יותר.

בתוך התמונה הזו, נכנסת ארכיטקטורת TLVR – Trans-Inductor Voltage Regulator – שמסמנת שינוי משמעותי בגישה לתכנון ממירי מתח מרובי פאזות. בניגוד לממירים קלאסיים, TLVR מוסיף אינדוקטור עזר (tuning inductor) היוצר צימוד מגנטי בין הפאזות. המשמעות היא שהפאזות אינן פועלות עוד כיחידות נפרדות, אלא מגיבות יחד לשינויים בעומס. הצימוד המגנטי מאפשר גם ביטול יעיל יותר של רכיבי האדווה (ripple cancellation), ובכך מאפשר להקטין את האינדוקטנס של כל פאזה מבלי לפגוע ביציבות או להגדיל רעש. התוצאה היא תגובת transient מהירה יותר, הפחתת תנודות מתח (ripple) ושיפור כולל ביעילות.

יתרון נוסף של TLVR הוא היכולת להפחית משמעותית את קיבולי היציאה – לעיתים עד כ־50%. במערכות AI, שבהן שטח ה-PCB הוא משאב קריטי, מדובר בשיפור שאינו רק חשמלי אלא גם ארכיטקטוני: פחות קבלים, פחות מקום, יותר שטח לחישוב.

שתי המגמות – TLVR ו-VPD – אינן מתחרות אלא משלימות. בעוד VPD מטפל בבעיה הפיזית של הולכת הזרם, TLVR מטפל בהתנהגות הדינמית של המערכת. יחד, הן מאפשרות להתמודד עם דרישות הזרם והתגובה של הדור הבא של מאיצי AI.

על רקע זה, הכריזה Infineon Technologies על מודול הספק חדש מסוג quad-phase עם אינדוקטור TLVR, ה-TDM24745T, המיועד לשרתים מבוססי AI. המודול משלב ארבע דרגות הספק, אינדוקטור TLVR וקבלי decoupling במארז קומפקטי של 9×10×5 מ"מ, ומציע צפיפות זרם העולה על 2 A/mm² – נתון הגבוה משמעותית מהמקובל בדורות קודמים של מודולים דומים.

בנוסף, המודול מספק זרם שיא של עד 320 אמפר, ומיועד לתמוך במסילות הליבה של מעבדי GPU ומאיצי AI בתצורות הספק אופקיות ואנכיות כאחד. השילוב בין צפיפות גבוהה לביצועי transient משופרים ממקם אותו כפתרון ישים לארכיטקטורות החדשות של שרתי AI.

לדברי Athar Zaidi, סגן נשיא בכיר ומנהל תחום Power ICs and Connectivity בחברה, הדרישות ההולכות וגדלות של עומסי AI מחייבות פתרונות הספק קומפקטיים ויעילים יותר, המסוגלים לשפר ביצועים תוך הפחתת צריכת האנרגיה והאצת פריסת מערכות.

המודול מבוסס על טכנולוגיית OptiMOS-6 MOSFET ומשלב אינטגרציה ברמת השבב יחד עם מגנטיקה ייעודית. שילוב זה מאפשר לשפר את היעילות והביצועים התרמיים גם בתצורות צפופות במיוחד, שבהן כל שיפור קטן מתורגם ישירות להפחתת עומס על מערכות הקירור.

ואכן, ההיבט התרמי הופך לאחד הגורמים המכריעים. בצפיפויות זרם גבוהות, גם הפסדים של אחוזים בודדים מתורגמים לעשרות וואטים של חום. במרכזי נתונים מודרניים, המשמעות היא מעבר הולך וגובר לפתרונות קירור מתקדמים – כולל קירור נוזלי ישיר לשבב (direct-to-chip liquid cooling) – כחלק בלתי נפרד מתכנון המערכת.

נקודה נוספת היא האינטגרציה המערכתית. מודולים מסוג זה אינם פועלים לבדם, אלא כחלק מארכיטקטורת הספק רחבה הכוללת בקרי multiphase דיגיטליים, ניהול עומסים חכם ולעיתים גם אופטימיזציה ברמת ה-rack או הדאטה סנטר. היכולת לשלב מודול קומפקטי בתוך מערכת כזו, עם ממשקים סטנדרטיים ובקרה מדויקת, הופכת לגורם קריטי בקיצור זמני פיתוח ובהטמעה מהירה.

המשמעות של פתרונות מסוג זה חורגת מהרכיב הבודד. כאשר ניתן להקטין את שטח ה-PCB המוקדש לאספקת כוח, להפחית קיבולים ולשפר את תגובת המערכת, מתאפשר להקצות יותר משאבים לחישוב עצמו. במערכות AI, שבהן כל יחידת נפח מתורגמת לביצועים, מדובר ביתרון ישיר.

עם זאת, המעבר לארכיטקטורות חדשות אינו טריוויאלי. שילוב TLVR דורש תכנון מדויק של המגנטיקה והבקרה, התאמה לבקרים מתקדמים והתמודדות עם מורכבות תכנונית גבוהה יותר. גם המעבר ל-VPD מציב אתגרים של אינטגרציה מכנית, אמינות וניהול חום לאורך זמן – במיוחד במערכות הפועלות בעומסים משתנים ובסביבות צפופות.

בסופו של דבר, ככל שמערכות AI ממשיכות לגדול ולהתעצם, כך מתחדדת ההבנה כי ביצועים אינם נמדדים רק בכוח חישוב, אלא גם ביכולת לספק אותו. הגבול הבא של התעשייה לא ייקבע רק לפי FLOPS, אלא לפי היכולת לנהל זרמים, חום וצפיפות – שלושה פרמטרים שהופכים במהירות למרכזיים לא פחות מהמעבד עצמו.

איור 1: מודול ההספק TDM24745T של Infineon Technologies , הראשון בתעשייה בתצורת TLVR ארבע־פאזית במארז קומפקטי, מספק זרם שיא של עד 320 אמפר. קרדיט: Infineon Technologie


מערכת ניו-טק מגזינים גרופ

תגובות סגורות