האצת ייצור שבבים באמצעות מטרולוגיה משולבת AI וביג-דאטה

מטרולוגיה אופטית היא קריטית לבקרה ושליטה על תהליכי ייצור של שבבים, ומבוססת על הקרנת אור על פרוסות הסיליקון בשלבי הייצור השונים, חישת הקרינה המוחזרת, ופיענוחה באמצעות שיטות חישוב מתקדמות. שילוב בינה מלאכותית ולמידת מכונה עם מערכות ביג דאטה מאפשר בין היתר לחזות את הביצועיים החשמליים של שבבים, לייצב את המדידה ולהאיץ את זמני המדידה, ובכך לייעל את תהליך ייצור השבבים.

תקני הזיכרון ומעבדי חישוב וגרפיקה, המצויים בכל מחשב, שרת מחשבים, וטלפון נייד, מכילים שבבים מתקדמים, המיוצרים בתהליכי ייצור תעשייתיים מהמורכבים שקיימים כיום. תהליכים אלה מכילים מאות של שלבים, המאפשרים ייצור של רכיבים אלקטרוניים בגדלים של כ-10 ננומטר ופחות ורמת המומחיות הטכנולוגית לה נדרשים יצרני השבבים היא כמעט דמיונית. לדוגמא, בשלבי הייצור הראשונים של התהליך, מדפיסים באמצעים אופטיים (בליתוגרפיה) תבניות ננומטריות על מצע של סיליקון, ואלו מוכנסות למכונות ייצור בהן סביבת פלזמה מאכלת את מצע הסיליקון ומעבירה אליו את התבניות. בנוסף, במסגרת תהליך זה, שכבות ננומטריות מוערמות על גבי מצע הסיליקון ומתחיל מעין ‘פוליש’ כימי ומכני מהן על מנת להגיע לעובי שכבות בעובי ננומטרי מוגדר.

העברת תבניות זו היא השלד של ייצור השבבים. כל ממד פיסיקלי המעורב בו מחושב ומתוכנן בקפידה, ולכן יש צורך קריטי בבקרת תהליך מתקדמת

(APC – Advanced Process Control) שהבסיס להצלחתה הוא מדידה מדויקת, יציבה ומהירה של הגאומטריה של התבנית המועברת. רמת הדיוק חייבת להיות גבוהה ביותר, ועל המדידה להיות יציבה תחת תנאי שינוי תהליך בלתי צפויים, ומהירה כך שתאפשר בקרת היזון חוזר בזמן אמת. לדוגמא, מרחב הטעות האופייני של מדידת הרוחב המינימלי של קו בתבניות הליתוגרפיה, לפני ואחרי העברת התבנית, הוא מספר אנגסטרומים בלבד (להשוואה, קוטר אטום הסיליקון הוא כ-1.46 אנגסטרום). מעבר לכך, רעשי מדידה נדרשים לשנות את המדידה בפחות מאנגסטרום, כך שמדידת רוחב תבנית ו/או עובי שכבה, אסור שתשתנה ממכשיר מדידה אחד לשני, ו/או כתוצאה מרעשים סטטיסטיים באותות המדידה, ביותר מעשירית האנגסטרום.

אלגוריתמיקה במטרולוגיה אופטית של ממדים קריטיים

בשנים האחרונות פותחו מכשירי מדידה ואלגוריתמים מתקדמים, חלקם משולבי למידת-מכונה, העומדים בדרישות מאתגרות אלו. שיטות אלו מבוססות על מכשירי מדידה אופטיים, המאירים בתחומי אור, בזויות, ובקיטובים שונים, קולטים את הקרינה החוזרת ומפענחים אותה על מנת לספק לייצרן השבבים מדידות של עובי תבניות, שכבות, ובאופן כללי יותר, מידע מלא על המבנה התלת ממדי שיצר התהליך. מכשירי מדידה אלה, ביחד עם אלגוריתמי מדידה מספקים פתרונות של מטרולוגיה אופטית של ממדים קריטיים (OCD – Optical Critical Dimension).

חלק בלתי נפרד מפתרון ה-OCD הוא אלגוריתם הפיענוח של הקרינה המוחזרת מהמבנה שנמדד. סוג אחד ומרכזי של אלגוריתמי פענוח כאלה מבוסס פתרון נומרי של משוואות מקסוול שמתארות את השדות האלקטרומגנטיים המעורבים בקרינה המוקרנת על השבב וזו המוחזרת ממנו. בקצרה, אלגוריתמים אלה מחשבים את תכונות ההחזרה של המבנה התלת ממדי של השבב ואת תלותן בגאומטריה. אז, האות האופטי המדוד מושווה למחושב ואלגוריתמי אופטימיזציה מוצאים את הגדלים הגאומטריים עבורם ההשוואה היא מיטבית.

היסוד הפיסיקלי והגאומטרי של שיטה זו הוא מרכזה כך שעל מפתח האלגוריתם תחילה לפתח מודל תלת ממדי של השבב וסביבתו, זאת מתוך הכרת התהליך הפיסיקלי, אז לקבוע את ערוצי המדידה המיטביים עבור מדידה של הגודל הגאומטרי הרצוי ואז לקבוע את הפרמטרים הנומריים הכרוכים בפתרון משוואות מקסוול. זהו תהליך מורכב הדורש מומחיות אלגוריתמית ואפליקטיבית, אולם בסופו מקבל המפתח מודל פיסיקלי מלא את השבב ותגובתו האופטית לקרינה.

למידת מכונה, בינה מלאכותית וביג דאטה

בלמידת מכונה מפותחים אלגוריתמי חיזוי המבוססים נתונים בלבד, וזאת כתת-תחום של בינה מלאכותית. כל אלגוריתם של למידת מכונה נתון באחד משני שלבים של הפעלה: שלב ‘אימון המודל’ בו פרמטרי האלגוריתם נקבעים על פי התוצאה שאותה נרצה לקבל, ושלב ההפעלה או ה’חיזוי’ בו האלגוריתם מופעל בזמן אמת. תכונה חשובה של כל אלגוריתם מסוג זה היא רמת הקיבולת שלו, תכונה המתארת את יכולתו לתפקד נכונה עבור מסדי נתונים המתארים תופעות פשוטות (קיבולת נמוכה) או מסובכות (קיבולת גבוהה). ככל שקיבולת האלגוריתם גבוהה יותר, כך אימון האלגוריתם כרוך בקביעת פרמטרים רבים יותר. לדוגמא עבור תיאור בעיית תגובה לינארית נידרש לאלגוריתמי רגרסיה לינארית, אולם לתרגום שפה ו/או זיהוי סוגי עצמים בתמונות טבעיות נידרש לאלגוריתמים מסוג רשתות נוירונים עמוקות.

אימון אלגוריתם עם קיבולת גבוהה דורש הרבה נתונים ולכן גם יכולת חישובית גבוהה. זוהי הסיבה לכך שאלגוריתמים אלה מיושמים לרוב במערכות מחשב המכונות ‘ביג דאטה’. אלו מסוגלות לשמור כמויות דאטה בהיקפי פטה-בייטים ואקסה-בייטים, וניחנות ביכולות חישוב וניהול מבוזרות (כלומר אימון האלגוריתם יכול להתבצע במקביל על תת קבוצות שונות של נתונים וכך להפחית את זמן החישוב). הזמינות היחסית גבוהה של נתונים, של מערכות השמירה והניהול שלהם, ושל יכולות חישוב, הובילו בעשור האחרון למספר פריצות דרך בתחומים שונים כגון אלה של ראייה ממוחשבת ועיבוד שפה טבעית, המבוססות על שימוש באלגוריתמים אלה ובמערכות ביג-דאטה.

למידת מכונה במטרולוגיה אופטית של ממדים קריטיים

אלגוריתמי למידת מכונה מסוג supervised מאומנים לחזות נכונה את ערכי הפרמטרים הפיסיקליים של השבב בהינתן אותות אופטיים המוחזרים ממנו. זאת ללא צורך במודל פיסיקלי וגיאומטרי תלת ממדי של השבב ובכך ייחודם המאפשר להשתמש בהם גם במקרים בהם השימוש במשוואות מקסוול הוא קשה במיוחד בשל מבנים תלת ממדים בעלי יחס עומק-רוחב גדול או כשהמבנה הנבחן איננו מחזורי.

בנוסף, היעדר המודל התלת ממדי מחליש את השפעתם של אילוצים פיסיקליים בין חתימות ספקטרליות באותות האופטיים, שבתורם עלולים להקשות על בניית פתרון אלגוריתמי. לדוגמא, השילוב בין מכשיר מטרולוגיה משולב-תהליך (Integrated Metrology: IM) עם אלגוריתם מבוסס פתרון משוואות מקסוול, עלול להתקשות בחיזוי של עומק של תהליך איכול מצע הסיליקון. זאת כיוון שבסביבה תלת מימדית מסובכת המכילה הרבה דרגות חופש גאומטריות, יש צורך בשילוב של הרבה עבודת מומחה ובהרבה סוגים של אותות אופטיים שונים כדי לפתור קורלציות ספקטרליות. לעומתו, במקרה כזה, אלגוריתם למידת מכונה יתאמן למצוא קשרים סטטיסטיים (לדוגמא בין עומק איכול ה’חור’ בסיליקון לרוחבו), וינצלם על מנת לחזות נכונה את עומק האיכול; זאת אפילו עם עושר האותות האופטיים המוגבל של מכשיר ה-IM. בנוסף לכך, היעדר התערבות מומחה הופכת את האלגוריתמים לכאלו היכולים להפוך לאוטומטיים.

השימוש באלגוריתמי למידת מכונה ומערכות ביג-דאטה מאפשר לחזות פרמטרים פיסיקליים קשים למדידה באמצעים אופטיים, ומספק את היכולת לייצר פתרון שלם באמצעות אלגוריתמי אוטומציה ובנוכחות מערכת ביג-דאטה.

בעשור האחרון נכחנו לראות עושר רב של פתרונות מסוג למידת מכונה בתחום ה-OCD ובתחום ה-APC. בגרף (1) ניתן לראות את הדיוק של אלגוריתם למידת מכונה המאומן על אותות אופטיים של מכשיר מסוג i500 של חברת נובה (מכונה לה ערוץ מדידה אחד המאיר ואוסף את האור בניצב לדגימה בשני קיטובים מאונכים זה לזה) כדי לחזות את עוביו של מבנה תלת ממדי שנמדד על ידי מיקרוסקופ אלקטרוני (SEM). ניתן לראות את יכולת האלגוריתם לשחזר באמצעים אופטיים את רזולוציית ה-SEM, שהיא בסדר גודל של ננומטר בודד ופחות. השחזור הוא מצוין ושגיאתו כחצי ננומטר.

גרף 1. החיזוי )ציר Y( לעומת נתוני האמת )ציר
X( של עובי קו. כשם שהגרף מראה, הדיוק הוא של
כ- 6A , שהם 4% מטווח נתוני העובי

גרף 2. החיזוי של מדידות חשמליות על ידי למידת מכונה. שוב,
בציר ) Y (X מוצג החיזוי )נתוני אמת( וההתאמה הליניארית היא מצוינת.
הצבעים השונים בגרף הימני והשמאלי מייצגים מוצרים שונים.

בגרף (2) מוצג הדיוק של אלגוריתם שמשתמש באותות ממכשיר מדידה T600 של חברת נובה (זהו מכשיר מטרולוגיה מסוג Standalone בעל עושר רב של ערוצי מדידה) וחוזה מדידות חשמליות של שבבים. מדידות חשמליות נעשות בשלב שיחסית לשלב המדידה האופטית הוא מאוחר בתהליך הייצור. כך, למידת מכונה מייצרת ערך רב ליצרן שבבים שיכול לדעת את ביצועיהם החשמליים של השבבים בשלב מוקדם. הגרפים  ממאמר משותף של חברת GLOBALFOUNDRIES ושל חברת נובה (מאמר105850X  מאת Timoney et al. מכנס SPIE-AL-2018 שזכה בפרס המאמר הטוב ביותר בכנס).

בגרף (3) ניתן לראות כיצד דיוק אלגוריתם מסוג למידת מכונה משתנה עם גודלו של מסד נתוני האימון, כאשר ככל שמסד הנתונים גדל, כך משתפר הדיוק. כאן ניתן לשפר את דיוק האלגוריתם בכ-15% על ידי הגדלת מסד נתוני האימון מ-10 פרוסות סיליקון (wafers) ל-50. מכיוון שבזמן אימון האלגוריתם הראשוני מצויים ביד המשתמש רק מספר פרוסות, ברור כי יש ערך רב למערכת ביג-דאטה ‘נושמת’ שאוגרת את נתונים בזמן אמת ככל שהם מצטברים, מסננת ומאמתת את איכותם של הנתונים הרלוונטיים, ומעדכנת את האלגוריתם.

גרף 3. תלות דיוק האלגוריתם במספר פרוסות הסיליקון שמצויות בנתוני האימון עבור חיזוי של רוחב קו. החיזוי משתמש באותות אופטיים ממכונת i500 ונתוני האמת הם ממודל פיסיקלי מבוסס פתרון של משוואות מקסוול שנבנה עבור מכונת .T600 הדיוק מנורמל ל 1- עבור 10 פרוסות סיליקון.

גרף 4. תלות דיוק האלגוריתם במספר פרוסות הסיליקון ובסוג
נתוני האימון עבור שני מקרים )סט אימון השונה איכותית מסט
החיזוי באדום ולהיפך בכחול(. כמו בגרף ) 3(, כאן החיזוי הוא של
תוצאות מודל פיסיקלי שנבנה עבור T600 תוך שימוש באותות
של .i500

לא רק גודל הדאטה חשוב עבור דיוק האלגוריתם אלא גם סוג הדאטה. בגרף (4) מתואר סכמטית אופן ההתכנסות של דיוק האלגוריתם עם גודל הדאטה עבור שני מקרים: באדום רואים את ההתכנסות האיטית יחסית עבור מקרה בו סט האימון שונה באופיו מסט ה’מבחן’, ובכחול את ההתכנסות המהירה יותר במקרה ששני הסטים דומים באופיים. בניסוי זה, על מנת לשלוט בסוג הדאטה הסטים רחוקים בזמן מסט המבחן או קרובים בזמן. ההתנהגות המוצגת בגרף 4 מדגימה ערך נוסף של מערכת ביג-דאטה, המאפשרת הכנסת שיקולי רלוונטיות לבחירת סוג הדאטה לאימון האלגוריתם ולעדכונו בזמן אמת. כך, השילוב בין למידת מכונה לביג-דאטה מייצבת את תהליך המטרולוגיה האופטית.

אחת מהחוזקות של מטרולוגיה אופטית הוא מהירות המדידה ויעילותה שיכולות להגיע למדידה של עשרות רבות ומאות פרוסות סיליקון בשעה. תפוקת מערכת המדידה (Throughput) תלויה במספר הערוצים המדודים וגם כאן השימוש באלגוריתמי למידת מכונה בא לידי ביטוי. הם מסוגלים למצוא קשרים סטטיסטיים בין נתוני האותות האופטיים לנתוני החיזוי הרצוי, ולהקטין את תלות דיוק האלגוריתם במספר הערוצים, כך שנוכל להשיג באמצעות מספר ערוצים קטן יחסית דיוק דומה לזה של מספר ערוצים גדול. כך ניתן לשפר את תפוקת המדידה באופן משמעותי: עד פי 4-5. בגרף (5) מוצגת מידת הדיוק ש’נפסיד’ אם נבחר לאמן אלגוריתם למידת מכונה תוך שימוש בערוץ אחד בלבד לעומת 15 ערוצים, ועבור מגוון של סוגי מדידות. גרף מסוג זה מאפשר ללקוח לשקלל את דיוק המדידה הרצוי לעומת מהירותה. כשם שהגרף מראה, הפסד זה הוא קטן ולא משמעותי (פחות מאנגסטרום) במספר רב של מקרים.

גרף 5. הדיוק אותו ‘נאבד’ אם נאמן אלגוריתמי למידת מכונה תלות דיוק האלגוריתם
לבצע חיזוי תוך שימוש בערוץ מדידה אחד לעומת 15.

אתגרים בהסתכלות קדימה

אימוץ אלגוריתמי למידת מכונה בתחום ייצור השבבים ומדידתם מדגים את יעילותם של אלגוריתמים אלה. עם זאת, קיימים אתגרים ביישומם ושניים מהמשמעותיים שבהם קשורים בסיכון להיחלשות הקשר עם המבנה הגאומטרי התלת ממדי על השבב. אחד מהאתגרים הוא הבנת ביצועי האלגוריתם באופן אינטואיטיבי/גיאומטרי והשני קשור לזמינות נתוני האימון. כיון שמדובר באלגוריתם מסוג supervised, הנתונים צריכים להכיל אותות אופטיים מחד, ומאידך תוצאות חיזוי רצויות כאשר אלו האחרונות לקוחות ממטרולוגיה חיצונית. הנתונים האחרונים הם לעיתים קשים ויקרים להשגה שכן הם כרוכים במדידות חיצוניות.

נושא זה הוא מאד פעיל מחקרית וקיימות כיום שיטות מתקדמות לייצר נתונים סינתטיים תוך שימוש באלגוריתמים מסוג Generative models שלומדים את ההתפלגות הסטטיסטית של נתוני האמת על מנת לחקות אותם ולייצר התגשמויות של אותה התפלגות, כלומר דאטה שונה אך כזה שמייצג אותה התופעתיות.

שני נושאים מאתגרים אלו נבחנים בראי שיפור הדיוק, היציבות והיעילות של אלגוריתמי למידת מכונה, ומייצרים כיווני פיתוח חדשניים של שילוב שיטות המבוססות גאומטריה ופתרון משוואות מקסוול עם שיטות של למידת מכונה. נושאים אלו וכן נושאים חדשניים נוספים של למידת מכונה, מובילים היום לפתרונות מדידה ובקרה במסגרת תהליכי הפיתוח בהם מפתחת חברת נובה את הדור הבה של מכשירי המדידה ואלגוריתמי הפענוח. זאת בשיתוף פעולה עם חברות ייצור השבבים והתקני הזכרון המובילות, ולטובת הדורות הבאים של מוצריהן.

ד"ר ברק ברינגולץ, דירקטור טכנולוגיה בקבוצת המידול והאלגוריתמיקה, נובה מכשירי מדידה

תגובות סגורות