نگاهی به معماری AMD RDNA 3 – قدرت بیشتر در کنار انرژی بهینه

پس از معرفی کارت گرافیک های Radeon RX 7900 XTX و Radeon RX 7900 XT بهتر است نگاهی داشته باشیم به معماری جدید AMD RDNA 3 و طیف وسیعی از فناوری های جدید اسن نسل تازه از راه رسیده.

ابتدا باید بگویم تا حد زیادی بسیاری از مشخصات رسمی AMD RDNA 3 و پردازنده‌های گرافیکی سری RX 7000 با اخبار فاش شده روزهای قبل از رونمایی مطابقت دارد. AMD در معماری RDNA 3 از چیپ‌لت‌ها با یک GCD اصلی یا Graphics Compute Die و حداکثر شش MCD یا Memory Cache Dies استفاده می کند. بجز این موارد، تغییرات زیادی در معماری از جمله واحدهای محاسباتی بیشتر و شیدرهای گرافیکی بسیار بیشتر در مقایسه با نسل قبلی وجود دارد.

اساسا، AMD به تمرکز بر روی بهره وری انرژی ادامه می دهد که این موضوع بهبود بیش از 50 درصدی عملکرد در هر وات RDNA 3 در مقایسه با RDNA 2 را هدف قرار داده است. در نهایت بهتر است برای درک بهتر مشخصات جدیدترین کارت های AMD را با نسل قبلی RDNA 2 و Nvidia RTX 4090 مقایسه کنیم.

AMD دارای دو نوع پردازنده گرافیکی Navi 31 است. کارت RX 7900 XTX با مشخصات بالاتر از GCD کاملا فعال و شش MCD استفاده می کند، در حالی که RX 7900 XT دارای 84 واحد از 96 واحد محاسباتی فعال است و فقط از پنج MCD استفاده می کند. ششمین MCD از نظر فنی هنوز روی کارت‌ها وجود دارد، اما یا غیر فعال است یا یک بلوک خاموش بروی آن قرار گرفته است تا به 4 گیگابایت حافظه GDDR6 اضافی متصل نباشد (البته ماژولی هم در کار نیست که متصل باشد یا نباشد)، بنابراین راهی برای فعال کردن مجدد MCD اضافی وجود نخواهد داشت.

در مقایسه با رقبا، RX 7900 XTX همچنان از نظر فنی در محاسبات خام پشت سر RTX 4090 قرار می گیرد و انویدیا با هسته های Tensor خود قدرت پردازش هوش مصنوعی بسیار بیشتری دارد. اما همچنین باید به یاد داشته باشیم که RX 6950 XT توانسته با RTX 3090 Ti در رزولوشن 1080p و 1440p همگام شود و تنها حدود 5 درصد در کیفیت 4K عقب مانده است. این در حالی است که از نظر تئوری 40 درصد محاسبات خام کمتری را ارائه می کرد. بنابراین، زمانی که RX 7900 XTX روی کاغذ 32 درصد کمتر از RTX 4090 محاسبه می‌شود، می توان حدس زد که یا عملکردی مشابه با RTX 4090 دارد یا بسیار اندک از آن ضعیف تر است (پیشبینی من عملکردی مشابه و حتی بهتر در رزولوشن های زیر 4K است).

کارت های جدید AMD همچون تمام کارت ها، دارای فرکانس بوست بالاتری نسبت به فرکانس گیمینگ است که در گیمینگ فرکانس 2.3 و در بوست فرکانس 2.5 گیگاهرتز را ارائه می کند. حال به این نتیجه می رسیم که عدد اعلامی AMD مبنی بر 61 ترافلاپس بودن، می تواند کمی دور از ذهن باشد، زیرا فرکانس گیمینگ بروی 2.3 گیگاهرتز است در حالی که 61 ترافلاپس با 2.5 گیگاهرتز محاسبه شده است. ترافلاپس بر اساس شیدرها محاسبه می شود، اما از آنجا که تمام کارت ها در زمان اجرای بازی، به فرکانس های بیشتر از فرکانس اعلامی دست پیدا می کنند، می توان ترافلاپس پرچمدار این سری را چیزی در محدوده 56 تا 61 ترافلاپس سنجید.

جدا از اینکه RX 7900 XTX رقیب RTX 4090 است اما در کارت RX 7900 XT مهم این نیست که این کارت چطور با RTX 4090 مقایسه می شود، بلکه باید این کارت را با RTX 4080 مقایسه کرد. در واقع مشخصات اعلامی و قیمت کمتر RX 7900 XT نسبت به RTX 4080 این جنگ را جذاب تر می کند.

AMD ادعا می کند تا 54% عملکرد در هر وات در مقایسه با RDNA 2 بهبود یافته است و البته باید به این نکته اشاره کنیم که این بهره وری در کنار عملکرد به مراتب بهتر نسبت به نسل قبل، یک شعار تبلیغاتی نیست و واقعاً می توان این موضوع را در محصولات اخیر این شرکت مشاهده کرد. به عنوان مثال RX 6900 XT عملکرد دو برابر نسبت به پرچمدار نسل قبلی یعنی RX 5700 XT در 1440p ultra داشت. حال سوال اصلی این است که چگونه AMD به بهبود کارایی نسل به نسل ادامه می دهد؟ جواب ساده است. گره پردازشی از 7 نانومتری به 5 نانومتری و معماری جدید در این بهبود تاثیر مستقیم دارند.

واحد محاسباتی یکپارچه جدید RDNA 3 دارای 64 پردازنده جریانی دوگانه (شیدرهای GPU) است. این دو برابر مقدار RDNA 2 در هر واحد محاسباتی است که دست AMD را برای اجرای بارهای سنیگن بروی هر واحد یا بروی هر دو واحد باز می گذارد. جالب است بدانید که جدیدترین پردازنده‌های گرافیکی AMD، Intel و Nvidia همگی از 128 سایه‌زن برای هر بلوک اصلی استفاده می‌کنند (انگار شرکت ها از روی دست هم تقلب کرده اند). همراه با دوبرابر کردن شیدرهای GPU در هر CU، این شرکت تعداد کل CU ها را از 80 به 96 افزایش داده است. در نسل جدید، Navi 31 حدود 2.4 برابر Navi 21 سایه زن دارد این در حالی است که مصرف انرژی تنها 18٪ افزایش یافته است.

AMD همچنین عملکرد شتاب‌دهنده‌های هوش مصنوعی خود را افزایش داده است، که واقعاً در مورد آن صحبت نکرده است. ما در مورد قدرت محاسباتی خام مطمئن نیستیم، اما می دانیم که شتاب دهنده های هوش مصنوعی از هر دو عملیات INT8 و BF16 پشتیبانی می کنند (چیزی شبیه به هسته های Tensor انویدیا). جدا از این، AMD می‌گوید شتاب‌دهنده‌های هوش مصنوعی جدید تا 2.7 برابر بهبود یافته اند.

گدر نهایت، AMD می‌گوید که شتاب‌دهنده‌های پرتوی خود را بهینه کرده است به طوری که RDNA 3 می‌توانند با دستورالعمل‌های اختصاصی جدید و مرتب‌سازی و پیمایش BVH (پرتو/جعبه) بهبودیافته، 1.5 برابر پرتوها را بهتر مدیریت کند. معنای آن در دنیای واقعی هنوز کاملاً مشخص نیست، اما ما قطعاً انتظار یک جهش بزرگ در عملکرد ردیابی پرتوی همراه با بهبود عملکرد شطرنجی داریم. به زبان ساده می توانم بگویم که در بخش ردیابی پرتوها، RDNA 3 شاید نتواند پا به پای RTX 40 پیش آید اما عملکردی مشابه با پرچمداران RTX 30 را ارائه می کند.

علاوه بر واحدهای محاسباتی، بسیاری از فناوری های جدید یا به روز شده را در RDNA 3 می توان مشاهده کرد. یکی از موارد اضافه شده AMD Radiance Display Engine یا اساساً پشتیبانی از خروجی ویدیو است. علاوه بر این، AMD پردازنده‌های گرافیکی RDNA 3 خود را با پشتیبانی از DisplayPort 2.1 ارتقا داده است تا بتواند با پهنای باند بالا، حتی در رزولوشن 8K رفرش ریت های بالا را تجربه کند.

باید بگویم که AMD دومین شرکت تولیدکننده کارت گرافیک است که از DisplayPort 2.X استفاده می کند و اینتل Arc اولین آن. اما تفاوت اصلی در این است که اینتل فقط از سرعت 10 گیگابیت بر ثانیه در هر خط (UHBR10) و در مجموع 40 گیگابیت در ثانیه پشتیبانی می کند اما DisplayPort 2.1 حداکثر تا 20 گیگابیت بر ثانیه (UHBR20) یا در مجموع 80 گیگابیت بر ثانیه را پشتیبانی می کند. AMD از 20 گیگابیت در ثانیه نیز پشتیبانی نمی کند، اما پشتیبانی از 13.5 گیگابیت در ثانیه (UHBR13.5) و مجموع تا 54 گیگابیت بر ثانیه آن بیشتر از اینتل است. این نشان می دهد که AMD با استفاده از پورت های DisplayPort 2.1 خود، توانایی پشتیبانی از نرخ تازه سازی 480 هرتز را در مانیتور 4K یا 165 هرتز بر روی نمایشگرهای 8K را دارد.

AMD همچنین موتور رسانه را با RDNA 3 به طور قابل توجهی بازنگری کرده است. Navi 31 دارای موتورهای رسانه ای دوگانه است که به طور کامل قادر به پشتیبانی از دو جریان همزمان رمزگذاری، رمزگشایی، 8K60 هستند یا می توانند با هم متحد شوند.

یکی دیگر از به‌روزرسانی‌های موتور ویدیو، پشتیبانی از AV1 است تا هر سه تولیدکننده تراشه گرافیکی (انویدیا، ای ام دی و اینتل) از رمزگذاری/رمزگشایی سخت‌افزاری کامل برای AV1 پشتیبانی می‌کنند. قابلیت پشتیبانی AV1 تا به حال کمی کند بوده است، اما امیدواریم که شاهد طیف گسترده ای از راه حل های نرم افزاری و سرویس های پخش باشیم که از AV1 (ویدیوهای با کیفیت) به جای H.264 پشتیبانی می کنند. AMD همچنین می گوید دارای کد ویدیویی تقویت شده با هوش مصنوعی است. نمی دانیم که این موضوع از نظر کیفیت و عملکرد به چه معناست و مشتاقانه منتظر عملکرد این قابلیت هستیم.

در نهایت، AMD بیشتر در مورد فناوری FidelityFX Super Resolution (FSR) صحبت کرد. در حال حاضر، چند نسخه از FSR در دسترس است. FSR اصلی 1.x است و نسخه های 2.0 و 2.1 از جدیدترین ارتقای نرم افزاری استفاده می کنند که عملکردی مشابه و حتی بهتر از DLSS و XeSS دارند. AMD در حال حاضر بیش از 216 بازی و برنامه دارد که از FSR استفاده می کنند، اما بیشتر آن ها پیاده سازی FSR 1.x هستند. FSR 2.0 بسیار جدیدتر است و اولین بار در 2022 وارد کار شده است. FSR 2.1 الگوریتم را برای کمک به حذف شبح و بهبود بیشتر کیفیت تصویر تنظیم می کند و در حال حاضر فقط در تعداد کمی از بازی ها وجود دارد. به هر حال به دلیل باز بودن (اپن سورس) آن، انتظار گسترش هرچه بیشتر در بازی ها و نرم افزارها داریم.

فناوری FSR 3 در سال آینده عرضه می شود. به نظر می‌رسد که نوعی تولید فریم یا بهینه سازی فریم انجام می‌دهد، تا حدودی شبیه به کاری که انویدیا با DLSS 3 انجام می‌دهد باشد. AMD جزئیات زیادی را فاش نکرده است، احتمالاً تا حدودی به این دلیل که FSR 3 هنوز به طور کامل تعریف یا تکمیل نشده، اما در آزمایش اولیه، افزایش دو برابر عملکرد نشان از عملکرد هیجان انگیز آن دارد.

همچنین AMD فناوری جدیدی را به مجموعه نرم افزاری خود به نام HYPR-RX اضافه کرد. این فناوری به گیمرها اجازه می دهد تا با یک کلیک نرخ فریم سریعتر (در حدود 85 درصد) و تأخیر کمتر را به خدمت گیرند. به طور میانگین با خاموش بودن HYPR-RX در بازی ها، حدود 90 فریم در ثانیه و تاخیر 30 میلی‌ثانیه به دست می آید، این در حالی است که با فعال‌سازی این فناوری، در نهایت نرخ 166 فریم در ثانیه و زمان تاخیر 11 میلی‌ثانیه ارائه می شود (میانگین عملکرد بستگی به عنوان دارد). قابلیت HYPR-RX هم مانند FSR 3 در نیمه اول سال 2023 برای گیمرها عرضه می شود.

به طور کلی، AMD با کارت ها و فناوری های جدید خود نشان داد که هنوز هم می شود با مشخصات کمتر بروی برگه، عملکردی خیره کننده را اراده داد. در واقع AMD اکنون استاد بالابردن پتانسیل کاری با معماری های پیچیده اما مصرف بهینه انرژی است. احتمال هم دارد که RTX 4080 12GB به دلیل عملکرد بدی که در برابر RX 7900 XT با قیمت مشابه داشته لغو شده است.

پست های مرتبط

نسخه‌های آینده فناوری DLSS انویدیا می‌توانند از هوش مصنوعی برای ساخت تکسچرها، اشیا و کاراکترها استفاده کنند

گوشی گلکسی اس 25 اولترا سامسونگ بهبود زیادی را با دو دوربین 50 مگاپیکسلی ارائه می‌کند

گوگل با TSMC برای ساخت تراشه سه نانومتری Tensor G5 گوشی پیکسل 10 همکاری می‌کند