امروز: ۱۴۰۵/۰۴/۰۵ ساعت : ۱۹:۵۸

فناوری AutoRound اینتل : سرعت و بهره‌وری بالاتر برای اجرای مدل‌های زبانی بزرگ

فناوری AutoRound شرکت اینتل امکان اجرای سریع‌تر و بهینه‌تر مدل‌های زبانی بزرگ (LLM) را روی پردازنده‌های مرکزی و گرافیکی اینتل فراهم می‌کند. همچنین پلتفرم Crescent Island از فرمت‌های MXFP8 و MXFP4 پشتیبانی می‌کند.

فناوری AutoRound اینتل یک الگوریتم پیشرفته در نظر گرفته می‌شود که توسط اینتل توسعه داده شده و اکنون در ابزار LLM Compressor ادغام شده است. این همکاری مزایای زیر را ارائه می‌دهد:

دقت بالاتر در کمّی‌سازی با بیت‌های کم

تنظیم سبک و سریع (در حد صدها مرحله، نه هزاران مرحله)

بدون سربار اضافی در زمان اجرای مدل (Inference)

سازگاری کامل با compressed-tensors و اجرای مستقیم در vLLM

روند کاری ساده: کمّی‌سازی و اجرای مدل تنها با چند خط کدنویسی

پشتیبانی از روش‌های بیشتر کمی‌سازی و مدل‌های گسترده‌تر به‌زودی اضافه خواهد شد

AutoRound چیست؟

فناوری AutoRound یک الگوریتم پیشرفته کمّی‌سازی پس از آموزش (PTQ) است که برای مدل‌های زبانی بزرگ (LLM) و مدل‌های بینایی–زبانی (VLM) طراحی شده. این روش برای هر «تنسورِ کمی‌سازی‌شده» سه پارامتر قابل‌آموزش معرفی می‌کند:

v: تنظیم‌کننده گرد کردن مقادیر (rounding offset)

α و β: کنترل‌کننده بازه برش (clipping range) به‌صورت یادگرفتنی

فناوری AutoRound اینتل لایه‌های «دیکودر» را به‌صورت مرحله‌ای پردازش می‌کند و با استفاده از گرادیان نزولی علامت‌دار (signed gradient descent)، فرآیند گرد کردن و برش را به‌صورت هم‌زمان بهینه می‌سازد تا خطای بازسازی خروجی در سطح بلوکی به حداقل برسد.

Arc Battlemageنقاط قوت کلیدی

دقت بسیار بالا، به‌ویژه در bit‑widthsهای بسیار پایین

پشتیبانی از انواع داده متنوع:
W4A16 ،MXFP8 ،MXFP4 ،FP8 ،NVFP4 (و موارد بیشتر در راه‌اند)

پشتیبانی از «دقت ترکیبی» و جستجوی هوشمند دقت به‌صورت لایه‌به‌لایه برای ایجاد تعادل میان دقت و کارایی

قابل‌استفاده برای هر دو نوع مدل LLM و VLM

فناوری AutoRound اینتل امکان تولید مدل‌های کمّی‌سازی‌شده در فرمت‌های کم‌بیت را فراهم می‌کند که برای افزایش سرعت اجرای مدل‌ها روی سخت‌افزارهای زیر طراحی شده‌اند:

پردازنده‌های Intel Xeon

شتاب‌دهنده‌های هوش مصنوعی Intel Gaudi

پردازنده‌های گرافیکی مراکز داده اینتل

گرافیک‌های Intel Arc B-Series

و همچنین سایر پردازشگرهای گرافیکی (مانند دستگاه‌های مبتنی بر CUDA)

آینده چه خواهد بود؟

اینتل در حال افزودن پشتیبانی بومی از فرمت‌های FP8 ،MXFP8 و MXFP4 به نسل بعدی پردازشگرهای گرافیکی دیتاسنتری خود با نام رمزی Crescent Island است. مدل‌هایی که با AutoRound کمّی‌سازی شوند، به‌طور طبیعی می‌توانند از این فرمت‌ها در سراسر مجموعه سخت‌افزارهای هوش مصنوعی اینتل بهره‌مند شوند.

این روند، یک مسیر یکپارچه از نوآوری الگوریتمی تا پیاده‌سازی عملی در دنیای واقعی ایجاد می‌کند. ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش می‌دهیم، پس حتماً با ما همراه باشید. شما در مورد فناوری AutoRound اینتل چه نظری دارید؟ با ما به اشتراک بگذارید.

احسان نیک پویا

ثبت دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *