شرکت انویدیا با مشکلاتی در زنجیره تأمین سرورهای هوش مصنوعی Blackwell خود روبرو شده، چراکه هنوز نتوانسته مشکلات داغ شدن بیش از حد و نقصهای معماری آنها را برطرف کند.
این آغاز کار ناامیدکنندهای برای سری Blackwell AI انویدیا به حساب میآید. سرورهای Blackwell که قرار بود تولید انبوهشان در سهماهه چهارم سال 2024 آغاز شود، با مشکل افزایش دمای بیش از حد روبرو شدند. اگرچه انویدیا قبلاً اعلام کرده بود که این مشکل را حل کرده، اما گزارشی جدید از The Information این ادعا را رد کرد و عنوان کرد که سرورهای Blackwell دچار نقص عملکرد یا گلیچ شدهاند.
بر اساس این گزارش، اولین محموله عمده سرورهای GB200 انویدیا با مشکلات گرمای بیش از حد و نقص عملکرد مواجه شدهاند که دلیل آن به نحوه اتصال تراشهها برمیگردد. این مشکل مشتریان بزرگی مانند مایکروسافت، آمازون، گوگل و متا را تحتتأثیر قرار داده است. به همین دلیل، این شرکتها سفارشهای خود را برای سرورهای Blackwell کاهش دادهاند، در حالی که قبلاً سفارشهایی به ارزش بیش از 10 میلیارد دلار ثبت کرده بودند.
این وضعیت برای انویدیا و تجارت هوش مصنوعیاش نگرانکننده به نظر میرسد، چراکه مشکلات زنجیره تأمین میتواند تاثیرات مالی سنگینی به همراه داشته باشد. اگرچه هنوز اطلاعات دقیقی از این مشکل در دست نیست، اما قبلاً گفته شده بود که این نقص مربوط به فناوری بستهبندی پیشرفته شرکت TSMC، موسوم به CoWoS است که به همان مشکل اتصال تراشهها اشاره دارد. انویدیا قبلاً اعلام کرده بود که قطعه ماسک پردازندههای گرافیکی Blackwell را که در TSMC ساخته شده بود تغییر داده، اما این هم نتوانست مشکل را حل کند.
در حال حاضر، شرکتها به جای سرورهای Blackwell، به محصولات جایگزین و معتبر انویدیا، مانند نسل Hopper، روی آوردهاند. هنوز مشخص نیست این نقص طراحی چه تأثیری بر درآمد انویدیا خواهد گذاشت، اما اگر این مشکلات حل نشوند، موفقیت Blackwell با خطر جدی مواجه خواهد شد که میتواند دردسر بزرگی برای انویدیا ایجاد کند. ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش میدهیم، پس حتماً با ما همراه باشید. شما در مورد این مشکل چه دیدگاهی دارید؟ نظراتتان را با ما به اشتراک بگذارید.