دیگر چندان فاصله زیادی با معرفی رسمی کارت گرافیک های جدید انویدیا نداریم. در چشم بر هم زدنی این سری از کارت گرافیک ها معرفی می شوند اما در این مطلب سعی داریم تا قبل از معرفی نگاهی به پرچمداران نسل آینده کارت گرافیک های انویدیا از خانواده Ada Lovelace با نام RTX 4090 و RTX 4090 Ti و قدرت گرفته از تراشه AD102 داشته باشیم.
بیایید با عینک واقع بینی به موضوع نگاه کنیم. نسل کنونی کارت گرافیک های انویدیا و AMD عملکرد درخشانی از خود نشان دادند و البته بسیار بهتر از نسل قبلی خود ظاهر شدند. کارت گرافیک های RTX 30 فوق العاده هستند و سری RX 6000 هم رقیبی قدرتمند با ساختاری قابل ستایش است. اما در شرایط کنونی عملکرد یک کارت گرافیک تنها به نرخ فریم در ثانیه نیست و دیگری مواردی مانند بهینه سازی تصاویر و ویژگی های پرتو بر مبنی بهبود و واقع گرایی سایه زنی، نوردهی و بازتاب در این روزها بسیار مورد توجه قرار گرفته است. با این وجود انویدیا خصوصاً در کارت محبوب RTX 3080 Ti، کارت رده بالای RTX 3090 و کارت پرچمدار RTX 3090 Ti ثابت کرد که نسل دوم هسته های RT و نسل سوم هسته های تنسور می توانند Ampere ها را در جایگاه بالاتری نسبت به RX 6000 ها قرار دهد. هرچند اگر به دنبال نرخ فریم هستید و می خواهید کارتی خنک تر با مصرف انرژی کمتر داشته باشید، حتما باید به سمت خرید کارت های سری RX 6000 بروید اما اگر قرار است بازی ها را با Raytracing روشن اجرا کنید RTX 30 گزینه بهتری است.
تراشه AD102 کارت های RTX 4090 و RTX 4090 Ti
در واقع انویدیا با معرفی RTX 3090 Ti گریزی به نسل آینده زد اما نکته ای مهم در خصوص نسل آینده کارت گرافیک های تیم سبز با نام Ada Lovelace این است که RTX 40 هم مصرف انرژی بیشتری طلب می کند و به طبع کارت هایی داغ تر هستند. اگر بخواهیم نگاهی دقیق تر به تراشه پرچمدار نسل آینده داشته باشیم باید بگوییم که AD102 پتانسیل بسیار بیشتری حتی نسبت به RTX 3090 Ti در اجرای بازی ها و حتی موارد نیاز به پردازش گرافیکی دارد. تراشه AD102 با ابعادی در حدود 600 میلی متر از ساخته هاس TSMC است تا برترین کارتهای انویدیا را به میدان رقابت وارد کند.
- تراشه AD102 با 12 خوشه، افزایش 70 درصدی نسبت به تراشه GA102 با 7 خوشه را نشان می دهد. این خوشه ها در کنار نسل سوم هسته های RT و نسل چهارم هسته های TENSOR باعث می شود تا برترین کارت در تراشه AD102 با 18432 هسته، افزایش 50 درصدی هسته ها نسبت به GA102 و افزایش 33 درصدی در Wraps/Threads نسبت به GA102 را به وجود آورد.
- یکی دیگر از تغییرات صورت گرفته در تراشه AD102، حافظه نهان مورد استفاده است. این تراشه ها دارای 192 کیلوبایت حافظه نهان در سطح L1 و مجموع 4.5 مگابایت کش هستند که 50 درصد بهتر از RTX 30 است. اما بیشترین تغییرات در بخش حافظه نهان سطح L2 قابل مشاهده است که با 16 برابر افزایش نسبت به برترین های RTX 30 اکنون به 96 مگابایت رسیده است. جالب است بدانید که تراشه GA102 نسل کنونی تنها 6 مگابایت کش یا حافظه نهان در سطح L2 دارد.
- از دیگر تغییرات شناخته شده در تراشه AD102 کارت گرافیک های پرچمدار RTX 40 افزایش ROP هایی است که با 32 واحد در هر GPC اکنون به نهایت 384 واحد ROP رسیده است. این در حالی است که کارت گرافیک های پرچمدار RTX 30 تنها دارای 112 واحد ROP هستند.
- همانطور که در بالا اشاره کردم، نسل سوم هسته های RT و نسل چهارم هسته های TENSOR هم در نسل آینده کارت گرافیک ها به کار گرفته می شوند. این موضوع عملکرد DLSS و Raytracing را در سطح جدیدی قرار می دهد.
مشخصات دقیق تراشه AD102 با 18432 هسته
12 واحد GPC در هر تراشه گرافیگی
6 واحد TPC در هر GPC
2 واحد SM در هر TPC
4 واحد هسته مرکزی در هر SM
128 واحد FP32 در هر SM
192 واحد FP32+INT32 در هر SM
64 واحد Warps در هر SM
2048 رشته در هر SM
192 کیلوبایت کش L1 در هر SM
96 مگابایت کش L2 در تراشه گرافیکی
32 واحد ROP در هر GPC و مجموع 384 واحد ROP در تراشه گرافیکی
نگاهی کوتاه به پیشرفت های تراشه AD102 کارت های RTX 40
- دو برابر شدن GPC نسبت به RTX 30
- حدود 50 درصد هسته بیشتر نسبت به RTX 30
- حدود 50 درصد کش یا حافظه نهان بیشتر L1 نسبت به RTX 30
- نزدیک 16 برابر کش یا حافظه نهان بیشتر L2 نسبت به RTX 30
- دو برابر کردن ROP نسبت به RTX 30
- نسل چهارم هسته های TENSOR
- نسل سوم هسته های RT
- مصرف انرژی بیشتر
- فرکانس کاری بیشتر