فناوری DLSS یا Deep learning super sampling از زمان کارت گرافیک های سری RTX 20 توسط انویدیا توسعه پیدا کرد. این فناوری سوپر سمپلینگ تنها نمونه در صنعت نیست زیرا AMD و Intel هم نمونه های توسعه یافته خود را دارند. پس از توسعه DLSS و معرفی نسخه های مختلف، اکنون به نسخه چهار این فناوری یا DLSS 4 رسیده ایم که سیر سعودی تکامل را به خوبی طی کرده تا تنها دلیلی باشد برای انتخاب کارت گرافیک های سری RTX 50 انویدیا از خانواده Blackwell. در این مقاله نگاهی داریم به تاریخچه DLSS و نحوه کار DLSS 4 در کارت گرافیک های جدید انویدیا.
تاریخچه DLSS
فناوری DLSS یا یادگیری عمیق نمونه گیری فوق العاده، از فناوریهای بهبود و ارتقاء تصویر یادگیری عمیق در زمان واقعی است که توسط Nvidia توسعه یافته و در بازیها مورد استفاده قرار می گیرد تا گیمرها حتی بدون داشتن یک کارت گرافیک پرچمدار، نرخ فریم بیشتر را تجربه کنند. هدف این فناوریها این است که به اکثر خطوط گرافیکی اجازه دهند با وضوح پایینتری برای افزایش کارایی اجرا شوند و سپس سعی می شود تصویری که کاهش رزولوشن پیدا کرده کمی در بخش جزئیات بهبود پیدا کرده تا کیفیت کمتر تصویر چندان ملموس نباشد.
این فناوری بر خلاف تمام مواردی که با نام هوش مصنوعی شناخته می شود، هیچ ارتباطی به هوش ندارد. در واقع واژه هوش مصنوعی واژه ای بسیار اشتباه است که باید به یادگیری تغییر پیدا کند. فناوری DLSS هم بر اساس یادگیری بنا نهاده شده به این معنی که تا الگوهای از پیش تعیین شده در بخش یادگیری نباشند، فناوری های ارتقاء مقیاس کاری برای انجام ندارند.
انویدیا DLSS را به عنوان یکی از ویژگیهای کلیدی کارت گرافیک های سری RTX 20 در سپتامبر 2018 تبلیغ کرد. در آن زمان، نتایج به چند بازی ویدئویی محدود میشد، بازی هایی مانند Battlefield V و Metro Exodus در دسته اولین بازی هایی بودند که از این قابلیت پشتیبانی کردند. در سال 2019، بازی Control با ردیابی پرتو و نسخه بهبودیافتهای از DLSS، که از هستههای Tensor استفاده نمیکرد، عرضه شد.
در سال 2020، انویدیا یک نسخه بهبود یافته از DLSS به نام DLSS 2.0 با نسخه درایور 445.75 را معرفی کرد. فناوری DLSS 2.0 برای چند بازی موجود از جمله Control و Wolfenstein: Youngblood در دسترس بود و بعداً به بسیاری از بازیها و موتورهای بازی جدید اضافه شده. موتورهایی مانند Unreal Engine و Unity به سرعت این فناوری را به ویژگی های خود اضافه کردند. این بار انویدیا اعلام کرد که بررای ارتقاء مقایس یا DLSS از هستههای Tensor استفاده کرده است (بر خلاف DLSS 1.9 که از هسته های CUDA استفاده می کرد) و نیازی به آموزش اختصاصی هوش مصنوعی در هر بازی نیست. این تغییر مهمترین دلیل محبوبیت DLSS شد به طوری که نمونه های اولیه کمترین شباهت عملکردی را با نسخه های تکامل یافته داشتند.
در سال 2022 فناوری DLSS 3.0 معرفی شد. هر آنچه در فناوری DLSS 2.0 بود در نسخه سوم بهبود پیدا کرد اما مهمترین جذابیت این نسخه، گزینه Frame Generation یا تولید فریم بود. DLSS 3.0 از نسل جدید شتاب دهنده جریان نوری (OFA) موجود در تراشه گرافیکی سری RTX 40 استفاده می کرد. شتاب دهنده جریان نوری جدید، سریعتر و دقیقتر از OFA است که قبلاً در تراشه های گرافیکی Turing و Ampere یا RTX 20 و RTX 30 استفاده می شد. به همین دلیل DLSS 3.0 برای RTX 40 انحصاری شد. در این نسل فناوری Frame Generation قادر بود تا بین فریم A و B یک فریم اضافه را تولید کند. فریم جنریشین بر خلاف سوپر سمپلینگ ها، با کاهش جزئیات تصویر همراه نبود اما ارتقاء فریم با آن چندان لذت بخش نبود. به طور مثال در بازی هایی که از این قابلیت پشتیبانی می کردند، با فعال کردن Frame Generation اگر نرخ فریم از 60 فریم به 80 فریم می رسید و کیفیت تصویر هم تغییر پیدا نمی کرد، با فعال کردن Frame Generation و DLSS با حالت Performance فریم به بیش از 200 فریم می رسید اما کاهش کیفیت تصویر را مشاهده می کردیم.
فناوری DLSS 3.5 در سال 2023 معرفی شد. در این نسل هر آنچه در DLSS 3.0 بود، بهبود پیدا کرد. DLSS 3.5 بازسازی اشعه را اضافه می کرد و الگوریتم های حذف نویز چندگانه را با یک مدل هوش مصنوعی آموزش داده شده با داده های پنج برابر بیشتر از DLSS 3 جایگزین می کرد. در واقع با DLSS 3.5 نه تنها فریم افزایش پیدا می کرد و قابلیت فریم جنریشین را داشتم، بلکه ردیابی پرتو یا Raytracing هم با این فناوری بهبود عملکرد را تجربه می کرد.
به زبان ساده فناوری DLSS ابعاد رندر بازی را کمتر می کند. به طور مثال بازی اگر در رزولوشن 2160 پیکسل اجرا شود، با فعال کردن DLSS ابعاد رندر بازی به کمتر از 1800 پیکسل کاهش یافته تا نرخ فریم افزایش یابد. البته این تمام ماجرا نیست. فناوری DLSS حالت های مختلفی همچون کیفیت (Quality)، متعادل (Balanced)، عملکرد (Performance) و عملکرد بالا (Ultra Performance) دارد. اگر کیفیت را انتخاب کنید، سایز رندر بازی نزدیک به حالت Native یا اصلی است به همین دلیل نرخ فریم افزایش چشمگیری ندارد. هر چه کیفیت تصویر را کمتر کنیم یا سایز رندر بازی را کمتر کنیم، نرخ فریم هم افزایش می یابد. به طور مثال اگر بازی در 4K اجرا کنیم و DLSS را روی حالت Ultra Performance قرار دهیم، سایز رندر بازی ممکن است به زیر 1000 پیکسل کاهش یابد. به همین دلیل است که نرخ فریم در این حالت بسیار افزایش می یابد اما کیفیت تصویر بازی به طور چشمگیری بد و خارج از تصور است.
فناوری DLSS 4
با معرفی کارت گرافیک های سری RTX 50 در نمایشگاه CES 2025، انویدیا از فناوری DLSS 4 رونمایی کرد. هدف اصلی DLSS 4 تغییر پیدا نکرده. این فناوری هم مانند اجداد خود، افزایش نرخ فریم بدون استفاده از کارت گرافیک پرچمدار را هدف قرار داده، اما اینبار کمی داستان متفاوت است.
در فناوری DLSS 4 قابلیت هایی مانند DLSS Ray Reconstruction و DLSS Super Resolution و حتی DLAA اکنون توسط یک شبکه عصبی تازه آموزش دیده محاسبه میشوند که یک مدل ترانسفورماتور است. بنابراین معماری اولیهای مانند ChatGPT را دارد. پیش از این، DLSS از Convolutional Neural Network (CNN) برای تولید پیکسلهای جدید با تجزیه و تحلیل بافت محلی و ردیابی تغییرات در آن مناطق در فریمهای متوالی استفاده میکرد.
مدل جدید ترانسفورماتور DLSS از یک ترانسفورماتور بینایی استفاده می کند، که قادر می سازد اهمیت نسبی هر پیکسل را در کل فریم و در فریم های متعدد ارزیابی کند. مدل جدید با استفاده از پارامترهای دو برابر مدل CNN برای دستیابی به درک عمیقتر از صحنهها، پیکسلهایی تولید میکند که پایداری بیشتر، ghosting کمتر، جزئیات بالاتر در حرکت و لبههای صافتر را در صحنه ارائه میدهند.
در حالی که CNN یا Convolutional Neural Network اساساً حرکات پیکسل ها را در یک منطقه تعریف شده در چندین فریم نظارت می کند، اگر پیکسل از این منطقه ناپدید شود، اطلاعات قبلی به دست آمده نیز از بین می رفت. از سوی دیگر، شبکه عصبی جدید مبتنی بر “Vision Transformer” می تواند پیکسل ها را در کل فریم و چندین فریم مشاهده کند و به طور مستقل اهمیت آنها را ارزیابی کند. البته دو برابر پارامترهای شبکه قدیمی باید توان استفاده شود تا شبکه جدید بتواند تصویر رندر شده را بهتر درک کند.
مدل ترانسفورماتور برای Super Resolution نیز نتایج امیدوارکنندهای را نشان میدهد که در ابتدا به صورت بتا منتشر میشود تا کاربران را قادر سازد، پیشرفتها را بررسی کنند و قبل از انتشار رسمی بازخورد خود را ارائه کنند.
تصاویر بهتر، فریم بیشتر و مصرف کمتر
در نسل جدید فناوری DLSS انویدیا ثبات تصویر بهتر، جزئیات بیشتر در حرکت و شبح کمتر را به عنوان پیشرفت های مورد انتظار برای الگوریتم DLSS 4 ذکر می کند. حتی DLSS Ray Reconstruction به ثبات تصویر بهتر و مدیریت بهتر در محیطهایی با نور پیچیده کمک میکند. به زبان ساده انویدیا تلاش کرده تا حتی با کاهش سایز رندر هم تصاویر بهتر، با کیفیت تر و واقعی تر تولید کند.
مهمترین تغییر این نسل وجود فناوری مولتی فریم جنریشین DLSS 4 است که عملکرد بهتری نسبت به فریم جنریشین DLSS 3 دارد.در نسل جدید شبکه عصبی بهینه شده می تواند تولید فریم را 40 درصد سریعتر انجام دهد. این می تواند یک نقطه ضعف اصلی فریم جنریشین را که هر از چند گاهی در بازی ها با آن مواجه می شدیم را از بین ببرد، آن هم مشکلی نیست جز افزایش بسیار کم فریم.
این تغییر با عدم استفاده از سخت افزار جریان نوری در هسته های Tensor به دست آمده. در عوض، محاسبات جریان نوری توسط شبکه عصبی انجام می شود. نکته مهم این تغییرات این است که مصرف حافظه تصویری کاهش می یابد. گفته می شود که شبکه عصبی برای تولید فریم به 30 درصد VRAM کمتر نیاز دارد. انویدیا Warhammer 40,000: Darktide را به عنوان مثال ذکر می کند، جایی که گفته می شود شبکه جدید 10 درصد فریم بیشتر ارائه می دهد در حالی که به 400 مگابایت VRAM کمتر نیاز دارد.
در حالی که DLSS 4 MFG یا مولتی فریم جنریشن در حال حاضر نهایی است، DLSS 4 SR و DLSS 4 RR در ابتدا به عنوان یک نسخه بتا منتشر خواهند شد. بازخورد به دست آمده از این پس از آن در نسخه نهایی، هر زمان که آماده شد، گنجانده می شود. نسخه های بتا را می توان به صورت اختیاری با استفاده از برنامه Nvidia و گزینه “DLSS Override” برای هر بازی نصب کرد.
مولتی فریم جنریشن فقط با RTX 50
ویژگی جدید DLSS 4 Multi Frame Generation تنها بر روی کارتهای گرافیک جدید GeForce RTX 5000 انویدیا اجرا میشود. فناوری DLSS MFG ایده فریم جنریشن قبلی را می گیرد و آن را بهینه سازی می کند. در نسل قبل فریم جنریشن که مربوط به RTX 40 بود، بین فریم A و B یک فریم تولید میشد، یعنی برای هر سه فریم، دو فریم رندر واقعی و یک فریم مصنوعی بود اما در نسل جدید اوضاع فرق کرده است.
در نسل جدید فریم جنریشن یا مولتی فریم جنریشن بین فریم A و B سه فریم تولید می شود، به این معنی که از پنج فریم خروجی، دو فریم رندر واقعی و سه فریم مصنوعی است. پنج شبکه عصبی که به طور همزمان در هر فریم اجرا می شوند توسط شبکه عصبی جدید DLSS 4 و هسته های Tensor جدید در معماری بلک ول امکان پذیر شده اند. بدون این موارد، محاسبه تصاویر اضافی باعث افزایش نرخ فریم نمی شود، بلکه باعث افت آن می شود. به گفته انویدیا، با DLSS 4 SR + MFG، اکنون می توان تا 93 درصد از پیکسل های روی صفحه نمایش را به صورت مصنوعی ایجاد کرد.
با این وجود مولتی فریم جنریشن با RTX 40 هم کار می کند اما مانند قبل تنها یک فریم تولید می شود اما با RTX 50 سه فریم اضافه تولید شده تا مشکل همیشگی فریم جنریشن یعنی تولید فریم کم، در این نسل برطرف شود.
سرعت فریم بیشتر
فناوری DLSS 4 MFG قرار است سرعت فریم بهتری نسبت به DLSS 3 FG داشته باشد، زیرا برای ساخت فریم های مصنوعی نیازی به همکاری CPU یا پردازنده نیست و اکنون خروجی فریم توسط موتور نمایشگر GPU انجام شود که به اصطلاح به آن hardware flip metering می گویند. این امر به انویدیا کنترل قابل توجهی روی سرعت فریم می دهد، که اکنون قرار است در DLSS 4 Multi Frame Generation آن را تجربه کنیم.
حدود 70 درصد فریم بیشتر
انویدیا می گوید که DLSS 4 MFG دارای مزیت عملکردی 70 درصدی نسبت به تولید فریم جنریشن قبلی است. انویدیا بنچمارک 6 بازی مختلف را نشان می دهد که البته نوساناتی در استفاده از MFG وجود دارد. افزایش عملکرد بین 39 تا 133 درصد است. همانند فریم جنریشن قبلی، افزایش فریم در نسل جدید نیز می تواند از عنوانی به عنوان دیگر متفاوت باشد.
علاوه بر این امکان ساخت بازی های سازگار با مولتی فریم جنریشن با استفاده از برنامه انویدیا وجود دارد اما بازی هایی نیز وجود خواهند داشت که به صورت بومی از DLSS MFG پشتیبانی می کنند. این فناوری هم مانند قبل در منوی گرافیک بازی ها نمایش داده می شود. بازی هایی مانند Alan Wake 2 / Cyberpunk 2077 / Indiana Jones and the Great Circle / Star Wars Outlaws به صورت بومی از مولتی فریم جنریشن پشتیبانی خواهند کرد و یک سری از بازی ها بعداً به این لیست اضافه می شوند. پس در ابتدا تعداد بازی هایی که از این فناوری پشتیبانی می کنند حدود 75 عنوان است و قرار است در آینده بیشتر شود.