امروز: ۱۴۰۵/۰۳/۳۰ ساعت : ۱۷:۰۹

شایعه شده که DeepSeek به زودی مدل جدید هوش مصنوعی R2 را منتشر می‌کند !

به نظر می‌رسد شرکت چینی DeepSeek به زودی مدل جدیدی را به بازار عرضه خواهد کرد، چراکه جزئیاتی درباره مدل بعدی این شرکت با نام DeepSeek R2 در اینترنت منتشر شده است.

اولین مدل مطرح DeepSeek یعنی R1 به دنیا نشان داد که چین در زمینه توسعه مدل‌های هوش مصنوعی پیشرفته، هیچ چیزی از غرب کم ندارد. انتشار این مدل چنان تأثیری بر بازارهای مالی آمریکا گذاشت که میلیاردها دلار از ارزش سهام آن‌ها کاسته شد. این اتفاق همچنین نشان داد که ساخت مدل‌های هوش مصنوعی، برخلاف آنچه شرکت‌هایی مانند OpenAI گفته بودند، لزوماً هزینه‌های سرسام‌آوری ندارد. حالا رسانه‌های چینی خبرهایی از مدل جدید R2 منتشر کرده‌اند و می‌توان گفت بازار هوش مصنوعی غرب، شاید بار دیگر با یک شگفتی دیگر از سوی چین روبرو شود.

با این حال، باید توجه داشت که این اطلاعات در حد شایعه است و هنوز DeepSeek به طور رسمی جزئیاتی درباره مدل جدیدش اعلام نکرده است. طبق گزارش‌ها، گفته می‌شود که R2 از معماری پیشرفته‌ای به نام MoE (ترکیبی از چندین متخصص) استفاده خواهد کرد. در این معماری، مدل R2 دارای دو برابر پارامترهای مدل R1 خواهد بود و عدد خیره‌کننده 1.2 تریلیون پارامتر را ثبت می‌کند.

بر اساس همین رقم، انتظار می‌رود R2 با مدل‌های بزرگی مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل رقابت کند. اما این تنها نکته مهم نیست. طبق گزارش‌ها، هزینه پردازش هر توکن در DeepSeek R2 بسیار پایین‌تر از مدل‌های رقیب است؛ به طوری که هزینه ورودی به ازای هر یک میلیون توکن حدود 0.07 دلار و هزینه خروجی حدود 0.27 دلار تخمین زده شده است. این یعنی هزینه استفاده از R2 نسبت به 97.4٪ از هزینه‌های GPT-4 پایین‌تر خواهد بود. اگر این اطلاعات درست باشد، R2 تبدیل به مقرون‌به‌صرفه‌ترین مدل برای شرکت‌ها خواهد شد و می‌تواند نقطه عطفی در اقتصاد هوش مصنوعی ایجاد کند.

شرکت DeepSeek برنامه‌هایی برای توسعه تراشه داردنکته جالب دیگر این است که گفته می‌شود DeepSeek R2 توانسته به 82٪ بهره‌وری از کلاسترهای پردازشی تراشه Ascend 910B هواوی برسد و قدرت پردازشی معادل 512 پتافلاپس در دقت FP16 ارائه دهد. این نشان می‌دهد که DeepSeek تصمیم گرفته برای توسعه مدل جدیدش از تجهیزات داخلی استفاده کند. قبلاً هم مشخص شده بود که این شرکت علاقه زیادی به استفاده از تراشه‌های هوش مصنوعی هواوی دارد. با این کار، DeepSeek عملاً زنجیره تأمین هوش مصنوعی خود را به صورت کامل در اختیار گرفته است.

البته باز هم باید تأکید کرد که همه این اطلاعات هنوز به صورت رسمی تأیید نشده و مدل نهایی شاید متفاوت باشد. اما اگر گزارش‌های موجود درست باشند، به نظر می‌رسد R2 یک حرکت بزرگ دیگر از سوی چین در بازار جهانی هوش مصنوعی خواهد بود. ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش می‌دهیم، پس حتماً با ما همراه باشید. شما در مورد مدل هوش مصنوعی DeepSeek R2 چه نظری دارید؟ با ما به اشتراک بگذارید.

احسان نیک پویا

ثبت دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *