به نظر میرسد کارتگرافیکهای پرچمدار انویدیا، یعنی GeForce RTX 5090 و RTX PRO 6000، با یک باگ جدید روبهرو شدهاند که باعث قفل شدن و بیپاسخ ماندن آنها در محیطهای مجازیسازی (virtualization) میشود. شرکت CloudRift که خدمات پردازش ابری مبتنی پردازشگرهای گرافیکی را برای توسعهدهندگان ارائه میدهد، درگیر این مشکل شده است.
طبق گفته این شرکت، پس از چند روز استفاده از کارتهای GeForce RTX 5090 و RTX PRO 6000 در ماشینهای مجازی، کارتها کاملاً از کار میافتند و تنها راه دسترسی دوباره به آنها، ریاستارت کامل سیستم میزبان است. جالب اینجاست که این مشکل فقط در مدلهای RTX 5090 و RTX PRO 6000 دیده شده و کارتهایی مثل RTX 4090 ،Hopper H100 و Blackwell B200 فعلاً تحت تأثیر قرار نگرفتهاند.
این اختلال به طور مشخص زمانی رخ میدهد که پردازشگر گرافیکی با استفاده از درایور VFIO به یک ماشین مجازی اختصاص داده میشود. پس از انجام عملیات FLR، کارت گرافیک دیگر هیچ واکنشی نشان نمیدهد. این وضعیت منجر به یک «قفل نرم» در کرنل میشود که هم محیط میزبان و هم ماشین مهمان را درگیر میکند و تنها راهحل، ریاستارت کامل سرور است؛ موضوعی که برای CloudRift با توجه به تعداد بالای کاربرانشان، بسیار مشکلساز است.
این مشکل تنها محدود به CloudRift نیست. یک کاربر Proxmox هم گزارش داد که پس از خاموش کردن یک کلاینت ویندوزی، کل سیستم میزبانش کرش کرد. وی همچنین اشاره کرد که انویدیا این مشکل را تأیید کرده، توانسته آن را بازتولید کند و در حال کار روی راهحل است. هنوز تأییدیه رسمی منتشر نشده، اما به نظر میرسد این مشکل مخصوص کارتهای گرافیک مبتنی بر معماری Blackwell باشد.
نکته جالب اینجاست که CloudRift برای پیدا کردن راهحل یا کاهش اثر این باگ، یک جایزه 1000 دلاری تعیین کرده. انتظار میرود انویدیا بهزودی اصلاحیهای منتشر کند، چراکه این باگ در حال حاضر وظایف حیاتی مربوط به هوش مصنوعی را تحت تأثیر قرار داده است.
ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش میدهیم، پس حتماً با ما همراه باشید. شما در مورد مشکل مجازیسازی کارت گرافیکهای GeForce RTX 5090 و RTX PRO 6000 چه نظری دارید؟ با ما به اشتراک بگذارید.




