במהלך כנס GTC 2020 חשפה NVIDIA את A100 – שבב עיבוד חדש המבוסס על ארכיטקטורת Ampere החדשה והעוצמתית שגם היא הושקה במהלך GTC 2020. בעוד ש-A100 מביא שיפור של עשרות מונים ביחס לקודמו, ה-V100, מסתמן כי A100 הוא לא שבב העיבוד החזק ביותר שיכלה NVIDIA לייצר בארכיטקטורת Ampere.
כאשר מסתכלים על הדיאגרמה של NVIDIA ניתן לראות כי ארכיטקטורת Ampere מסוגלת לכלול עד ל-128 יחידות SM ושישה בקרי זיכרונות התומכים עד ל-48GB. לעומת זאת, אם נסתכל על המפרט של ה-A100 נגלה כי הוא כולל 40GB של זיכרון HBM2 ולא 48GB ובנוסף נגלה גם כי ה-A100 כולל 108 יחידות SM במקום 128 יחידות כאלו. הדבר מתורגם גם ל-6,912 ליבות CUDA במקום מקסימום של 8,192 ליבות CUDA. על פי ההערכות ברשת מדובר בחיתוך של בין 15% ל-20% בביצועי כרטיס המסך.

ממבט ראשון הדבר נראה מוזר אך כאשר בוחנים את הנושא לעומק, צריך לזכור כי גודל השבב של ה-A100 עומד על 826mm2 והדבר קרוב מאוד למגבלת הגודל האפשרית לייצור שבבי סיליקון. במילים אחרות, מדובר בגודל שבב עצום כאשר אם להגדילו עוד יותר לא בטוח שיתאפשר הייצור שלו. גם כאשר לא מגיעים למגבלת הגודל המירבית, ככל שגודל השבב גודל כך גם קושי הייצור שלו עולה.
על פי ההערכות, NVIDIA בחרה להקטין את ה-A100 ולבטל כמה בקרי זיכרון ויחידות SM במטרה להגדיל את כמות השבבים אותה היא יכולה לייצר בפרק זמן נתון. החלטה זו הגיעה ככל הנראה במטרה לאפשר לייצר כמויות גדולות יותר של כרטיסי מסך בפרק זמן קצר יחסית, זאת לאור הביקוש הרב לארכיטקטורת Ampere שהתחיל עוד לפני ההשקה, בין היתר לאור משבר הקורונה.
בנוסף, אנחנו לא שוללים את האפשרות כי NVIDIA מתכננת להשיק כרטיס מסך עוצמתי יותר מאשר ה-A100 בהמשך השנה או אפילו בשנה הבאה אך מדובר בדבר חריג במיוחד שלא קרה בשנים האחרונות וספק אם קרה אי פעם. השקה של שבב עוצמתי יותר בעתיד תדרוש מספקיות שירותי ענן להשקיע פעם נוספת כספים רבים בשדרוג השרתים שלהן ומדובר כמובן, במצב לא אידיאלי שעלול לעלות כספים רבים לשוק ולעולם ההיי-טק.