با افزایش موجودی نسل کنونی کارت گرافیک ها یعنی سری RTX 30 و RX 6000 می توان انتظار داشت که نسل آینده کارت گرافیک های انویدیا و AMD به راحتی در اختیار خریداران قرار گیرد. موجودی گسترده در بازارهای جهانی، بسیاری را برای خرید نسل آینده کارت گرافیک ها مشتاق کرده است و البته بسیاری به این فکر هستند که آیا اکنون اقدام به خرید کارتهای RTX 30 کنند یا خود را برای RTX 40 آماده کنند. با این وجود در این مطلب نگاهی داریم به تمام مشخصاتی که تا کنون از کارت گرافیک های RTX 4090 و RTX 4090 Ti در رسانه های خبری دنیا یا توسط رومرها منتشر شده است.
انویدیا در کارت گرافیک های سری RTX 30 از خانواده Ampere تراشه های GA سامسونگ با فرایند 8 نانومتری استفاده کرد. قطعاً سامسونگ در این تراشه ها سنگ تمام گذاشت تا نشان دهد جدا از گسترش محصولات، تراشه ساز فوق العاده ای است اما داستان اصلی این است که در این زمینه TSMC چیز دیگری است.
تولید تراشه نسل آینده کارت گرافیک های انویدیا از خانواده Ada Lovelace با گره 4 نانومتری و خوشه های 5 نانومتری به دست TSMC افتاده است تا بار دیگر قدرت خود را در ساخت تراشه های اختصاصی به رخ رقبا بکشد. البته همانطور که می دانید صف شرکتهای خواستار تراشه های TSMC چنان شلوغ است که برای تحویل تراشه سفارشی از یک خط تولید باید چند سال به TSMC وقت داد.
نگاهی به تراشه AD102 کارت های RTX 4090 و RTX 4090 Ti خانواده Ada Lovelace
همچون نسل قبل و البته نسل های قبل عدد 102 در تراشه های گرافیکی انویدیا نشانه برترین تراشه گیمینگ است. در نسل آینده هم تراشه AD102 برای پرچمداران این سری مانند RTX 4090 , RTX 4090 Ti در نظر گرفته شده است. در مطلبی نگاهی به این تراشه داشتیم پس بهتر است نگاهی به مشخصات سه کارت گرافیک برتر نسل RTX 40 انویدیا داشته باشیم.
مشخصات کارت گرافیک RTX 4090 Ti
کارت گرافیک RTX 4090 Ti به عنوان پرچمدار سری Ada Lovelace از تراشه AD102 قدرت می گیرد که تمام پتانسیل کاری در آن فعال است. این تراشه در پرچمدار آینده انویدیا از تمام 144 واحد SM تراشه استفاده می کند تا در نهایت با بیشترین هسته های فعال CUDA با مقدار 18432 هسته، سطح جدیدی از تجربه بصری در بازی ها و رندرها را به کاربر هدیه دهد.
تراشه AD102 در کارت RTX 4090 Ti حافظه نهان بسیار بیشتری را نسبت به RTX 3090 Ti تجربه می کند. این تراشه قادر است در مجموع با 96 مگابایت حافظه نهان یا کش در سطح L2 را ارائه دهد که 16 برابر تراشه GA102 پرچمداران کنونی است. یکی دیگر از تغییرات خیره کننده، وجود 384 واحد ROP در تراشه AD102 کارت RTX 4090 Ti است که به سادگی بیش از دو برابر RTX 3090 Ti است. با وجود این تغییرات و البته فرآیند ساخت تراشه گرافیکی، انتظار داریم فرکانس کاری تراشه چیزی در محدوده 2 تا 3 گیگاهرتز باشد که حتی همین مورد هم می تواند به عملکرد بسیار بهتر RTX 40 نسبت به RTX 30 کمک کند.
در مورد مشخصات حافظه تصویری، انتظار می رود RTX 4090 Ti با 24 گیگابایت حافظه از نوع GDDR6X و سرعت 24 گیگابیت در ثانیه، رابط 384 بیتی و البته پهنای باند فوق العاده 1.152 ترابایت در ثانیه را ممکن سازد. اگر چنین مشخصاتی برای حافظه تصویری درست باشد، باید در انتظار یک راهکار خنک سازی ویژه تنها برای حافظه باشیم، زیرا تجربه ثابت کرده است راهکارهای حرارتی حافظه در کارت های مرجع و سفارشی های نچندان مطلوب، عملکرد درخشانی ندارند. تصویر فاش شده مربوط به خنک کننده کارت RTX 4090 Ti مرجع هم نشان از آن دارد که با یک خنک کننده بسیار بزرگ روبرو هستیم که احتمالا نزدیک به چهار اسلات کیس را اشغال می کند.
بر اساس مشخصات فاش شده این کارت گرافیک دارای توان حرارتی 600 وات است که لزوماً با یک کانکتور برق 16 پین Gen 5 برق آن تامین می شود، اما این توان مربوط به کارت مرجع است. در کارت های سفارشی با کوچکترین اورکلاکی توان حرارتی بیش از 600 وات و حتی تا 900 وات هم می رسد که در چنین کارت هایی دیگر نمی توان از یک کانکتور 16 پین Gen 5 استفاده کرد و نیاز به دو کانکتور برای تامین جریان برق کارت گرافیک است.
RTX 3090 Ti | RTX 4090 Ti |
تراشه GA102 | تراشه AD102 |
8 نانومتری سامسونگ | 4 نانومتری TSMC |
10752 هسته CUDA | 18432 هسته CUDA |
112 واحد ROP | 384 واحد ROP |
فرکانس بوست 1860 مگاهرتز | فرکانس بوست 2800 مگاهرتز |
40 ترافلاپس | 103 ترافلاپس |
24 گیگابایت حافظه تصویری GDDR6X سرعت 21 گیگابیت در ثانیه | 24 گیگابایت حافظه تصویری GDDR6X سرعت 24 گیگابیت در ثانیه |
پهنای باند 1008 گیگابایت در ثانیه رابط 384 بیتی | پهنای باند 1152 گیگابایت در ثانیه رابط 384 بیتی |
450 وات توان مصرفی | 600 وات توان مصرفی |
مشخصات کارت گرافیک RTX 4090
در کارت گرافیک هایی که تنها یک پله پایین تر از پرچمداران قرار دارند، معمولا بعضی از مشخصات سخت افزاری غیر فعال یا محدود می شوند. کارت گرافیک RTX 4090 بر خلاف RTX 4090 Ti که از تمام 144 واحد SM تراشه استفاده می کند، تنها به 126 واحد SM مجهز می باشد. با وجود محدود شدن بعضی از هسته ها باید انتظار داشته باشیم که ROP ها و حافظه نهان یا کش کل مجموعه هم کمتر از GA102 کارت RTX 4090 Ti باشد. این تغییرات ساختاری در نهایت باعث می شود تا RTX 4090 دارای 16128 هسته CUDA باشد.
معمولا نسخه های غیر Ti فرکانس بوست کمتری دارند که احتمالا این مورد در خصوص RTX 4090 غیر Ti هم صادق است. اگر چنین باشد می توان احتمال فرکانس بوست 2600 مگاهرتز را برای این کارت داشت که البته در چنین شرایطی قدرت پردازش این کارت با 90 ترافلاپس، باز هم بسیار بهتر از RTX 3090 / RTX 3090 Ti است.
در بخش مشخصات حافظه تصویری، اشتراک بسیاری می توان بین RTX 4090 و RTX 3090 Ti پیدا کرد. کارت RTX 4090 به 24 گیگابایت حافظه از نوع GDDR6X مجهز می شود که سرعت 21 گیگابیت در ثانیه، رابط 384 بیتی و پهنای باند 1008 گیگابیت در ثانیه آن کاملاً مشابه RTX 3090 Ti است. در واقع احتمالات قبلی مبنی بر تشابه ساختاری RTX 3090 Ti با نسل RTX 40 برای دست گرمی تولیدکنندگان و آشنایی با ساختار نسل آینده درست بود.
از آنجا که تراشه های سری RTX 40 با گره نوآورانه ای ساخته می شوند، تشابه توان مصرفی RTX 4090 با RTX 3090 Ti دور از ذهن نیست زیرا تراشه های جدید در صورت قدرت یکسان می تواند انرژی کمتری مصرف کنند (البته قدرت بسیار بیشتر از نسل قبل است) اما باز هم هر دو کارت با 450 وات در نسخه مرجع همچنان پر مصرف و داغ هستند.
RTX 3090 | RTX 4090 |
تراشه GA102 | تراشه AD102 |
8 نانومتری سامسونگ | 4 نانومتری TSMC |
10496 هسته CUDA | 16128 هسته CUDA |
112 واحد ROP | 384 واحد ROP |
فرکانس بوست 1700 مگاهرتز | فرکانس بوست 2600 مگاهرتز |
36 ترافلاپس | 90 ترافلاپس |
24 گیگابایت حافظه تصویری GDDR6X سرعت 19.5 گیگابیت در ثانیه | 24 گیگابایت حافظه تصویری GDDR6X سرعت 21 گیگابیت در ثانیه |
پهنای باند 936 گیگابایت در ثانیه رابط 384 بیتی | پهنای باند 1008 گیگابایت در ثانیه رابط 384 بیتی |
350 وات توان مصرفی | 450 وات توان مصرفی |
تفاوت عملکرد بین RTX 4090 و RTX 4090 Ti
هر دو کارت گرافیک RTX 4090 و RTX 4090 Ti دارای توان پردازشی بسیار بالایی هستند. هر چند قدرت پردازشی در محدوده بین 90 تا 100 ترافلاپس برای این کارت ها بسیار زیاد است اما در واقعیت این نشان دهنده برتری چند برابری در مقابل نسل کنونی نیست. ساختار جدید تراشه گرافیکی، نسل سوم هسته های RT و نسل چهار هسته های Tensor عملکرد نسل RTX 40 را در بازی ها و خصوصاً قابلیت های DLSS و Raytracing بسیار دیدنی می کند. با این وجود می توان انتظار داشت که کاربران به راحتی بازی ها را در رزولوشن 8K و با Raytracing روشن نزدیک به 60 فریم اجرا کنند که می تواند بسیار عالی باشد.
اما مسئله مهمی که در خصوص RTX 4090 و RTX 4090 Ti وجود دارد، اختلاف عملکردی زیاد بین این دو پرچمدار است. این موضوعی است که در RTX 3090 و RTX 3090 Ti دیده نمی شود. در واقع کارت گرافیک RTX 3090 Ti آنقدر متفاوت ظاهر نشد که دارندگان RTX 3090 و RTX 3080 Ti را برای خرید آن مجاب کند. حتی کاربرانی که به دنبال کارتی با عملکرد عالی و قیمت مناسب بودند ترجیح می دادند RTX 3080 Ti را با آن عملکرد خیره کننده خریداری کنند.
عملکرد کارت گرافیک RTX 3090 Ti در بارهای کاری مبتنی بر GPU
تفاوت عملکرد RTX 3090 و RTX 3090 Ti به طور میانگین چیزی در حدود 4 تا 7 درصد بود که باعث بی ارزش شدن خرید RTX 3090 Ti با قیمت بسیار بیشتر می شد. اما تفاوت عملکرد در RTX 4090 و RTX 4090 Ti در محدوده 15 تا 20 درصد است. همین موضوع می تواند کسانی که به دنبال برترین ها هستند را مجبور به خرید نسخه Ti کند.