אינטל ישראל

ביצוע גרפי משופר משנה את משוואת המחיר בשילוט דיגיטאלי

אינטל ישראל

מעבדי  3rd Generation Intel® CoreTM מספקים ביצועים המשתווים ל-GPU חיצוני מאת: אריק וינשטיין. האיכות והגמישות של שילוט אלקטרוני הוא פונקציה של יכולת העיבוד הגרפי של נגני המדיה הדוחפים את התצוגות. כדי לספק ביצועים גרפיים ברמה גבוהה, נוטים לשלב בנגני המדיה יחידות עיבוד גרפי (GPU) נפרדות, למרות שחלק מהנגנים משתמשים במנועי הגרפיקה המשולבים במעבדים עצמם. יותר יצרנים צפויים לעבור לגרפיקה משולבת ככל שהביצועים גדלים ומותאמים יותר לביצועי המעבד (CPU).
זה צפוי שביצועי המעבדים יגדלו שנה אחרי שנה וזה אכן המקרה למעבדי Intel® Architecture שמתעדכנים באופן שנתי. הפעם ®Intel מגבירה את הביצועים הגרפיים בעד 60% במעבר מהדור השני לדור השלישי של מעבדי ™Intel® Core. צעד משמעותי זה בשיפור מהירות הגרפיקה שינה את משוואת העלות לנגני מדיה. בחלק גדול של שוק נגני המדיה, מפתחים יכולים להימנע משימוש ב-GPUs, חוסכים לערך $350 ומקטינים את צריכת ההספק בכמה מאות וואט מבלי להקריב בביצועים. יצרני נגני מדיה המשתמשים בגרפיקה הנמצאת במעבדי הדור השני של ™Intel® Core (שם קוד: Sandy Bridge) ירוויחו משמעותית ממעבר למעבדי הדור האחרון של ®Intel.

איור-1 דוגמא למידע דמוגרפי על לקוח שנאסף בעזרת תוכנת AVA

הקטנת גודל ה-DIE
מעבדי ™3rd Generation Intel® Core (שם קוד: Ivy Bridge) מיוצרים בתהליך חדש של 22 ננומטר , המאפשר את הקטנת שטח הסיליקון ביותר מ-50% ביחס לתהליך הקודם של 32 ננומטר. למעבדים החדשים יש ליבת GPU שתוכננה מחדש ומשולבת בשבב עצמו. מספר היחידות המבצעות (execution units) הוגדל, הוסף זיכרון מטמון – L3 ועוד הרבה תוספות חדשות. השיפור בביצועים הגרפיים הם תוצאה של שיפורים בארכיטקטורה וגיאומטריית סיליקון קטנה יותר.

בדיקת ביצועי הגרפיקה
®Intel שכרה חברה תוכנה בלתי תלויה להשתמש ביישום לשילוט דיגיטלי כדי להשוות בין ביצועי הגרפיקה של מעבדי הדור השני והשלישי של ™Intel® Core מול המעבד הגרפי NVIDIA* GeForce* GTX570. החברה ביצעה בוחן ביצועים (benchmark) המבוסס על יישום לניתוח וידאו הקרוי Audience Impression Metrics Suite , המפעיל עומס באספקטים רבים של ה-GPU. היישום פותח בשפת OpenCL, המאפשר למהנדסים להחליט איך האלגוריתם צריך להיות מבוזר בין המעבד ליחידת ה-GPU כדי להגיע לביצועים הטובים ביותר. יותר פרטים על המימוש ניתן למצוא בהמשך.
Intel AIM Suite, תחת קטגוריית Anonymous Viewer Analytics , הוא יישום שתוכנן להציג תוכן אישי לצרכן, ולספק לקמעוניים ומפרסמים תוצאות מדידות לשילוט דיגיטלי. התוכנה מנטרת בעילום שם מדדים של הצופה, כמו מין, קבוצת גיל ומשך תשומת הלב שלו (איור 1), ומנתחת את המידע בזמן אמת תוך כיבוד פרטיות הצופה (עפ”י 7 עקרונות היסוד של Privacy by Design). עם תוכנת Intel AIM, מוכרים ומפרסמים יכולים לתפור בצורה מיידית את התוכן המוצג בשילוט הדיגיטלי המותאם לקבוצה הדמוגרפית של הצופה, בכך מספקת פרסום הרלוונטי לו ובו בזמן מאפשרת למפרסמים לאסוף יותר מידע מדויק למעקב יותר טוב.
תהליך התוכנה: הצעד הראשון הוא לאחזר כל מסגרת (frame) מהווידאו. המסגרת המאוחזרת עוברת התמרה לפורמט grayscale. הורדת קצב דגימה גאוסי (Gaussian Down Sampling) יוצר אפקטי החלקה. המסגרת נדגמת חלקית כדי להבטיח ביצועים. התנועה במסגרת מנותחת על ידי שימוש בתמונה הקודמת. פנים חדשות מתגלות עי שימוש ב-Haar Classifier, והמעקב אחר פנים שהתגלו קודם לכן נעשה בעזרת חלון חיפוש על מרחב חזוי (predicted space) והתאמת היסטוגרמה.

איור-2: השוואת ביצועי גרפיקה של ה-GPU בין מעבדי Intel Core דור שני ושלישי.

מאפייני עומס העבודה של ה-GPU:
א. פיזור מקבילי גבוה של המידע
ב. ניצול חוזר נמוך של המידע הנכנס (input data reutilization)
ג. אלגוריתמים עם זרם נתונים (data stream) גדול
ד. סיבוכיות אריתמטית גבוהה ליחידת זרם נתונים.
OpenCL הוא התקן הראשון הפתוח וללא תמלוגים לתכנות מקבילי במערכות הטרוגניות. OpenCL מספק למפתחי תוכנה סביבת פיתוח אחידה כדי לפתח קוד יעיל ושניתן להמרה (portable) עבור client computer systems, שרתים במרכזי מידע (HPC), והתקנים נישאים (handheld) המשתמשים במגוון מעבדים מרובי ליבות ובכלל במעבדים מקבילים.

השוואת ביצועי גרפיקה: שני דורות של מעבדי Intel® CoreTM
השיפור בביצועי הגרפיקה במעבדי ®Intel מהדור השלישי נבדק בהתאמה עם הדור הקודם של מעבדי ®Intel. בדיקות בוחן הביצועים מדדו את הזמן הממוצע למסגרת (frame) הדרוש לביצוע מדידת קהל הצופה ב-3 ערוצי ווידאו שונים תוך שימוש בתוכנת Intel AIM המבצעת ניתוח וידאו:
ערוצי ווידאו (Video Streams):
1. חישוב גבוה ביותר: ווידאו 1024X1280 עם תנועה רבה ליד המצלמה
2. חישוב בינוני: ווידאו 480X640 עם תנועה בינונית ליד המצלמה
3. חישוב נמוך: ווידאו 480X640 תנועה קלה של מגוון עוברי אורח במרחק 2-7 מטר

איור-3: השוואת ביצועים גרפיים בין NVIDIA GeForce GTX 570 למעבד הגרפי של 3rd Generation Intel® CoreTM

תוצאות:
מעבד Intel Core מהדור השלישי הציג ביצועים הטובים מקודמו ב-47 עד 60 אחוז לתרחישים עם שלשה ערוצי ווידאו כפי שמודגם באיור-2. זה מתאים להאצת חישוב של פי 1.9 עד 2.5. הקונפיגורציה של פלטפורמות המחשוב מסופקת בטבלה-2.
השוואת ארכיטקטורת ה-GPU :Intel ו-*NVIDIA* GeForce
נקודת מפתח בתכנון GPU הוא ניצול ההקבלה הפנימית של עיבוד הגרפי. עומס העבודה מחולק לקבוצות עבודה (work groups) ונשלח ליחידות ביצוע (Execution units), (המכונות streaming multiprocessors ע”י NVIDIA) המכילות את היחידות האריתמטיות (ALU) ויחידות ה-fetch. הביצוע הוא פרופורציונאלי באופן ישיר למספר יחידות הביצוע שהתפוקה שלהם היא איזון (trade-off) בין תהליכון (thread) יחיד ומהיר לבין מהירות השעון (כלומר צריכת הספק).
ל-GPU יש גם את יחידות ה-shader-cores שהם מודולים של חומרה שעברו כיוון עדין כדי ליעל את הביצוע של מבחר קטן של משימות (tasks), כמו המרה (transcoding) ו-texture sampling. מודולים כאלו מאפשרים ל-GPUs לתמוך בפקודות scatter/gather מהזיכרון, דבר שלא מיושם ביעילות במעבדים רגילים. פקודות scatter/gather הם חשובות כדי להגדיל את הביצוע של יישומים מקביליים הפועלים על קטעים לא רציפים של הזיכרון במעבדי (single instruction multiple data). הגודל של מערכי הזיכרון גם משפיע מאוד על ביצועי ה-GPU. הזיכרון מחולק בדרכים שונות, גלובלי, לוקלי, חוצצים (buffers) וזיכרון מטמון. טבלה-1 מספקת השוואה בין שתי ארכיטקטורות GPU תוך התייחסות ליחידות הביצוע, shader-cores, הזיכרון ומהירות השעון.

טבלה-1: השוואה בין תכונות ה-GPU

 

השוואת ביצועים גרפיים: On-Processor מול *NVIDIA* GeForce GTX 570
ה-NVIDIA GeForce GTX 570 נבדק בעזרת אותו בוחן ביצועים שתואר קודם.
תוצאות:
ל-NVIDIA GeForce GTX 570 ומעבד הדור השלישי של Intel Core היו ביצועים דומים כאשר עיבדו את שלושת ערוצי הווידאו כפי שסימנו כחישוב גבוה בינוני ונמוך. עבור ערוץ הווידאו שדרש חישוב אינטנסיבי ביותר (הגבוה) מעבד הדור השלישי של Intel® Core היה מהיר ב-3.2% ואלו ה-NVIDIA GeForce GTX 570 היה מהיר יותר עבור הווידאו האחרים ב-3.7 ו-7.2 אחוז בהתאמה. באופן כללי, הביצועים הגרפיים של מעבד הדור השלישי של Intel® Core ושל – NVIDIA GeForce GTX 570 היו שווים כפי שמודגם באיור-3.

טבלה 2: הקונפיגורציה של פלטפורמות המחשוב

מחיר וצריכת הספק
החלטה חשובה למפתחי נגני מדיה היא באיזה GPU להשתמש, בדרך כלל יש לאזן בין מחיר, ביצועים וצריכת הספק. קיים מגוון רחב של GPU בשוק חלקם לקצה הגבוה של כרטיסי ווידאו במיוחד בתחום המשחקים ומחירם מתחיל ב-700 דולר. סביר יותר שנגני מדיה ישלבו רכיבי -GPU מתחום הביניים של הביצועים ,כמו ה-NVIDIA GeForce GTX 570 שמחירו הוא בסביבות 350 דולר ונבחר לניתוח הביצועים. בעזרת ה-GPU המשופר של מעבדי Intel Core – דור שלישי, פרויקטים רבים לא יצטרכו GPU נפרד, דבר המאפשר הורדת מחיר וחוסך הספק של למעלה מ-200 וואט תוך שמירת ואפילו הגדלת רמת וביצועים.

יתרונות הפיתוח של הגרפיקה המשולבת של Intel
שילוט דיגיטלי מגיע בכל הצורות והגדלים ומספר משתנה של צפיפות פיקסלים, מספר אזורים (Zones) ויכולות Rendering נוספות. לכן זה חשוב ליצרני נגני מדיה להבין את דרישות השוק אותו הם משרתים ולאפשר את איכות הווידאו הנדרש במחיר מתאים. בוחן הביצועים המוצג במאמר זה מציע בעצם שהמנוע הגרפי המשולב במעבדי 3rd Generation Intel® CoreTM מתאים לתחום ביצועי הביניים והגבוה. ברגע שהיצרן בוחר כיוון זה ראוי שנזכיר את יתרונות הפיתוח, כולל:
יותר כוח חישוב
האצת ביצועי החישוב על ידי מעבר למעבדי הדור השלישי של Intel Core.
מאמץ פיתוח קטן יותר
חוסך זמן ומאמץ על ידי ביטול הצורך בתכנון תת-מערכת עבור GPU חיצוני
חתימה פיזית (footprint) קטנה יותר למערכת
שטח הכרטיס עבור מעבדGPU חיצוני נחסך
תכנון תרמי פשוט יותר
סיבוכיות הפתרון התרמי קטנה יותר על ידי המנעות מרכיבי גרפיקה דיסקרטיים המייצרים חום
כלים סטנדרטיים
השימוש ב-OpenCL 1.1, DirectX 11 ו-OpenGL 3.1
שרשרת כלים אחת
מפשט את פיתוח הקוד, שילובו ובדיקות.
חידושי גרסאות קבועים של GPU/CPU
הסתמך על מפת הדרכים של ®Intel לספק ביצועים טובים יותר באופן קבוע.
תמיכה ארוכת טווח
מגן על ההשקעה בפיתוח מבוסס מעבדי ®Intel, הנתמכים למחזור חיים ארוך של לפחות 7 שנים.
פיתוח נגני מדיה יכול להתחיל באופן מיידי כיוון שמערכות עם מעבדי הדור השלישי של Intel Core זמינים כבר בכל גורמי הצורה. מידע נוסף בנושא ספקי פתרונות חומרה ניתן למצוא באתר החברה.

תגובות סגורות