به نظر میرسد شرکت چینی DeepSeek به زودی مدل جدیدی را به بازار عرضه خواهد کرد، چراکه جزئیاتی درباره مدل بعدی این شرکت با نام DeepSeek R2 در اینترنت منتشر شده است.
اولین مدل مطرح DeepSeek یعنی R1 به دنیا نشان داد که چین در زمینه توسعه مدلهای هوش مصنوعی پیشرفته، هیچ چیزی از غرب کم ندارد. انتشار این مدل چنان تأثیری بر بازارهای مالی آمریکا گذاشت که میلیاردها دلار از ارزش سهام آنها کاسته شد. این اتفاق همچنین نشان داد که ساخت مدلهای هوش مصنوعی، برخلاف آنچه شرکتهایی مانند OpenAI گفته بودند، لزوماً هزینههای سرسامآوری ندارد. حالا رسانههای چینی خبرهایی از مدل جدید R2 منتشر کردهاند و میتوان گفت بازار هوش مصنوعی غرب، شاید بار دیگر با یک شگفتی دیگر از سوی چین روبرو شود.
با این حال، باید توجه داشت که این اطلاعات در حد شایعه است و هنوز DeepSeek به طور رسمی جزئیاتی درباره مدل جدیدش اعلام نکرده است. طبق گزارشها، گفته میشود که R2 از معماری پیشرفتهای به نام MoE (ترکیبی از چندین متخصص) استفاده خواهد کرد. در این معماری، مدل R2 دارای دو برابر پارامترهای مدل R1 خواهد بود و عدد خیرهکننده 1.2 تریلیون پارامتر را ثبت میکند.
بر اساس همین رقم، انتظار میرود R2 با مدلهای بزرگی مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل رقابت کند. اما این تنها نکته مهم نیست. طبق گزارشها، هزینه پردازش هر توکن در DeepSeek R2 بسیار پایینتر از مدلهای رقیب است؛ به طوری که هزینه ورودی به ازای هر یک میلیون توکن حدود 0.07 دلار و هزینه خروجی حدود 0.27 دلار تخمین زده شده است. این یعنی هزینه استفاده از R2 نسبت به 97.4٪ از هزینههای GPT-4 پایینتر خواهد بود. اگر این اطلاعات درست باشد، R2 تبدیل به مقرونبهصرفهترین مدل برای شرکتها خواهد شد و میتواند نقطه عطفی در اقتصاد هوش مصنوعی ایجاد کند.
نکته جالب دیگر این است که گفته میشود DeepSeek R2 توانسته به 82٪ بهرهوری از کلاسترهای پردازشی تراشه Ascend 910B هواوی برسد و قدرت پردازشی معادل 512 پتافلاپس در دقت FP16 ارائه دهد. این نشان میدهد که DeepSeek تصمیم گرفته برای توسعه مدل جدیدش از تجهیزات داخلی استفاده کند. قبلاً هم مشخص شده بود که این شرکت علاقه زیادی به استفاده از تراشههای هوش مصنوعی هواوی دارد. با این کار، DeepSeek عملاً زنجیره تأمین هوش مصنوعی خود را به صورت کامل در اختیار گرفته است.
البته باز هم باید تأکید کرد که همه این اطلاعات هنوز به صورت رسمی تأیید نشده و مدل نهایی شاید متفاوت باشد. اما اگر گزارشهای موجود درست باشند، به نظر میرسد R2 یک حرکت بزرگ دیگر از سوی چین در بازار جهانی هوش مصنوعی خواهد بود. ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش میدهیم، پس حتماً با ما همراه باشید. شما در مورد مدل هوش مصنوعی DeepSeek R2 چه نظری دارید؟ با ما به اشتراک بگذارید.