الگوریتم جدید، قدرت پردازش هوش مصنوعی با CPU را 15 برابر GPU می کند

در بحث هوش مصنوعی و یادگیری های عمیق، شتاب دهنده های گرافیکی به دلیل تعداد زیاد هسته های جریانی و قدرت بالا در پردازش محاسبات هوش مصنوعی، از محبوبیت بیشتری نسبت به پردازنده ها برخوردار هستند. اما دانشمندان دانشگاه رایس با الگوریتم جدیدی، قدرت پردازش پردازنده های جدید را 15 برابر شتاب دهنده گرافیکی ساخته اند.

با همکاری دانشمندان دانشگاه رایس و اینتل، الگوریتم جدیدی پیاده سازی شده است که قدرت پردازش پردازنده ها را 15 برابر شتاب دهنده های گرافیکی می کند. بیشترین بار محاسباتی در شبکه های یادگیری عمیق مربوط به الگوریتم DNN است. در واقع DNN نوعی قدرتمند از هوش مصنوعی است که می تواند در برخی از کارها از انسان پیشی بگیرد. آموزش DNN به طور معمول مجموعه ای از عملیات ضرب ماتریس است، که یک بار کاری بسیار سنگین و پیچیده و البته ایده آل برای شتاب دهنده های گرافیک (GPU) است. شتاب دهنده های گرافیکی در کنار قدرت بیشتر در پردازش محاسبات هوش مصنوعی، قیمت بسیار بالایی دارند. تفاوت در قیمت یک شتاب دهنده گرافیکی حرفه ای نسبت به یک پردازنده حرفه ای، ممکن است به سه برابر هم برسد. همین موضوع دانشمندان را به سمت استفاده از الگوریتم جدید برای پردازنده ها کشاند.

شریواستاوا استاد علوم کامپیوتر در دانشگاه فنی مهندسی رایس و همکارانش الگوریتمی ارائه داده اند که می تواند آموزش DNN را یروی پردازنده های مدرن AVX512 و AVX512_BF16 اینتل تسریع کند. شریواستاوا می گوید: “شرکت ها هفته ای میلیون ها دلار صرفاً برای آموزش و تنظیم دقیق هوش مصنوعی هزینه می کنند.” “کل صنعت بر یک نوع پیشرفته ضرب سریع ماتریس متمرکز شده است. همه به دنبال سخت افزارها و معماری های تخصصی هستند تا ضرب ماتریس را با سرعت بیشتر انجام دهند. حتی مردم در مورد سخت افزارها و نرم افزارهای ویژه برای انواع خاص یادگیری عمیق صحبت می کنند. به جای استفاده از الگوریتم های گران قیمت می گویم، بیایید الگوریتم ها را دوباره مرور کنیم. “

با بهینه سازی های صورت گرفته بروی این پردازنده ها و الگوریتم جدید، پردازش ها 200 میلیون پارمتر سریع تر از TensorFlow در GPU Nvidia V100 انجام شدند.

شبنم دقاقی یکی از نویسنده های این مقاله و دانشجو دانشگاه رایس گفت: “شتاب مبتنی بر جدول Hash در حال حاضر در GPU بهتر از CPU است اما پردازنده ها در حال پیشرفت هستند.” “در بعضی از محاسبات می توانید از توان پردازنده های مدرن استفاده کنید و مدل های AI را چهار تا 15 برابر سریع تر از بهترین سخت افزارهای تخصصی پیش ببرید.”

پست های مرتبط

تامین قسمت مودم 5G در کنار تراشه 3 نانومتری شیائومی با موانع زیادی روبه‌رو خواهد شد

مک مینی M4 اپل را می‌توان با استفاده از یک پاوربانک با خروجی AC تبدیل به یک دستگاه قابل حمل کرد

شوهی یوشیدا در پانزدهم ماه ژانویه سال 2025 شرکت سونی را ترک خواهد کرد