مایکروسافت در حال بررسی راههایی هست تا بتواند از کارتگرافیکهای AMD برای اجرای بارهای کاری مربوط به استنتاج (Inference) در هوش مصنوعی استفاده کند. این شرکت در حال توسعه ابزارهایی هست که مدلهای نوشتهشده بر پایه CUDA شرکت انویدیا را به کدهای سازگار با ROCm تبدیل میکنند.
یکی از دلایل اصلی تسلط طولانیمدت انویدیا در حوزه هوش مصنوعی، وجود مکانیزمی به نام قفل نرمافزاری CUDA هست. این سازوکار باعث میشود شرکتهای بزرگ ابری و فعال در حوزه AI مجبور شوند از تراشههای انویدیا استفاده کنند تا بتوانند از حداکثر توان نرمافزاری اکوسیستم CUDA بهره ببرند. در سالهای گذشته تلاشهای مختلفی برای شکستن این انحصار و ایجاد سازگاری میان پلتفرمها انجام شده، اما هیچکدام به راهحلی عمومی و همهگیر تبدیل نشدهاند.
با این حال، طبق گفته یکی از کارکنان ارشد مایکروسافت، این شرکت موفق شده ابزارهایی بسازد که میتوانند کدهای CUDA را به نسخهای سازگار با ROCm تبدیل کنند تا بتوان همان کدها را روی کارتگرافیکهای AMD اجرا کرد.
او در مصاحبهای اشاره کرد که:
ما مجموعهای از ابزارها را ساختهایم تا بتوانیم مدلهای CUDA را به ROCm تبدیل کنیم و از آنها روی کارتهای AMD مانند سری 300X استفاده کنیم. همچنین در حال همکاری با AMD هستیم تا این قابلیت را برای نسلهای جدیدتر مانند 400X و 450X هم بهینه کنیم.
شکستن سلطه CUDA کار سادهای نیست، چراکه این اکوسیستم نرمافزاری چنان در صنعت هوش مصنوعی ریشه دوانده که تقریباً در همهجا حتی در کشورهایی مانند چین بهطور گسترده مورد استفاده قرار میگیرد.
یکی از این روشها برای شکستن این سلطه استفاده از یک لایه سازگاری در زمان اجرا (runtime compatibility layer) هست که در آن پاسخهای CUDA بهطور خودکار به ROCm ترجمه میشوند، بدون آنکه نیازی به بازنویسی کامل سورس کد باشد. ابزار ZLUDA نمونهای از چنین فناوری هست که پاسخ CUDA را رهگیری کرده و به ROCm تبدیل میکند، بدون اینکه نیازی به کامپایل مجدد کل پروژه باشد.
با این حال، به دلیل آنکه ROCm هنوز یک پلتفرم نرمافزاری نسبتاً «نارس» محسوب میشود، برخی از پاسخها یا بخشهایی از کد CUDA هنوز معادل مستقیمی در نرمافزار AMD ندارند و همین موضوع گاهی باعث افت شدید عملکرد میشود که مسئلهای پرریسک برای مراکز داده بزرگ محسوب میشود.
احتمال دیگر این است که مایکروسافت در حال توسعه نوعی ابزار انتقال ابری (Cloud Migration) باشد که در سرویس Azure ادغام میشود و هم کارتهای NVIDIA و هم AMD را هدف قرار میدهد. البته این نوع تبدیلها در مقیاس بزرگ میتواند مشکلاتی به همراه داشته باشد، اما شواهد نشان میدهد که مایکروسافت فعلاً این ابزارها را در مقیاس محدود آزمایش میکند.
دلیل اصلی این تلاشها آن است که مایکروسافت شاهد رشد سریع بارهای کاری استنتاجی هست و به دنبال راهحلی مقرونبهصرفهتر میگردد. از آنجا که تراشههای هوش مصنوعی AMD گزینهای اقتصادیتر نسبت به کارتگرافیکهای گرانقیمت انویدیا هستند، این مسیر منطقی به نظر میرسد و از آنجا که بسیاری از مدلهای AI بر پایه CUDA نوشته شدهاند، تبدیل آنها به ROCm گام طبیعی بعدی برای مایکروسافت به شمار میآید.
ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش میدهیم، پس حتماً با ما همراه باشید. شما در مورد شکستن سلطه CUDA توسط مایکروسافت چه نظری دارید؟ با ما به اشتراک بگذارید.




