امروز: ۱۴۰۵/۰۴/۰۲ ساعت : ۲۲:۵۵

هوش مصنوعی Grok 4 اصلاً در حدی که ایلان ماسک تعریف می‌کند نیست !

مدل هوش مصنوعی Grok 4 از شرکت xAI این روزها حسابی خبرساز شده و بخش بزرگی از این توجهات، ناشی از تبلیغات خود ایلان ماسک است.

با این حال، پشت پرده ماجرا چیز دیگری است؛ به نظر می‌رسد که این مدل طوری طراحی شده تا در آزمون‌های معیار هوش مصنوعی عملکرد درخشانی داشته باشد، اما وقتی پای چالش‌های واقعی، پویا و استراتژیک به میان می‌آید، عملکردش به‌شدت افت می‌کند.

برای مثال، همین چند روز پیش این مدل به خاطر بازتاب بی‌نقص دیدگاه‌های ایلان ماسک — به‌ویژه نظرات جنجال‌برانگیزش در مورد مهاجرت و تنش‌های ژئوپلیتیکی جهان — مورد توجه قرار گرفت.

اما این ماجرا به همین‌جا ختم نشد. پس از به‌روزرسانی برخی دستورات سیستمی Grok 4، این مدل خود را MechaHitler (هیتلر ماشینی) نامید و حتی به تمجید از آدولف هیتلر پرداخت و موجی از انتقادات را برانگیخت.

شرکت xAI به دلیل رفتار جانبدارانه هوش مصنوعی Grok عذرخواهی کرد

از نظر فنی، Grok 4 توانست رتبه پنجم را در تست معروف Step Race Benchmark کسب کند. این تست مدل‌ها را در شرایط پرتنش برای همکاری و فریب‌کاری می‌سنجد. در این تست، مدل o3 با امتیاز 9.4 در رتبه اول و Grok 4 با امتیاز 7.9 در جایگاه پنجم قرار گرفت. حتی مدل Gemini 2.5 Flash هم عملکرد بهتری از Grok 4 داشت.

این تفاوت بین نتایج آزمون‌های استاندارد و عملکرد Grok 4 در شرایط واقعی، باعث شده برخی متخصصان این فرضیه را مطرح کنند که Grok 4 به جای یادگیری واقعی، صرفاً داده‌های آموزشی را حفظ کرده و برای گرفتن نمرات بالا در تست‌ها بیش از حد تنظیم (overfit) شده است.

xAI Grokبه گفته یکی از تحلیلگران، مدل Grok 4 در زمینه استدلال (مثل حل پازل‌های نیویورک تایمز) پیشرفت چشم‌گیری داشته، اما در حوزه‌هایی مثل نویسندگی خلاق هنوز عملکرد قابل توجهی ندارد.

البته این‌ها به این معنی نیست که Grok 4 بی‌ارزش باشد. برعکس، توانایی آن در تشخیص مشکلات موجود در کدهای نرم‌افزاری نسبت به گذشته به شکل قابل توجهی بهتر شده و بسیاری از توسعه‌دهندگان از آن برای یافتن باگ‌ها و خطاهای برنامه‌نویسی استفاده می‌کنند.

یکی از کاربران به‌نام Tetsuo گفته که Grok 4 Heavy در شناسایی اشکالات کد جاوااسکریپت بازی‌اش عملکرد عالی داشته است. دیگری، Danny Limanseta، از این مدل برای ساخت نمونه اولیه یک بازی استفاده کرده و کد آن را به محیط Cursor منتقل کرده تا توسعه را ادامه دهد.

با این حال، باید گفت که عملکرد این مدل به آن خوبی نیست که ایلان ماسک ادعا می‌کند. برای مثال، در پلتفرم پیش‌بینی شرط‌بندی Kakshi، مدل Grok 4 تاکنون فقط توجه محدودی را به خود جلب کرده و نتایج متوسطی داشته است.

هوش مصنوعی / Artificial Intelligenceدر همین حال، روزنامه فایننشال تایمز گزارش داده که شرکت xAI که مالک شبکه اجتماعی X هم هست، قصد دارد در دور جدید جذب سرمایه، ارزشی معادل 200 میلیارد دلار برای خود تعریف کند. xAI در ماه ژوئن 300 میلیون دلار از طریق فروش ثانویه سهام و در اوایل جولای هم 10 میلیارد دلار سرمایه جذب کرده بود.

از سوی دیگر، گزارش شده که شرکت فضایی SpaceX هم قصد دارد 2 میلیارد دلار از سرمایه 5 میلیارد دلاری اخیرش را در xAI سرمایه‌گذاری کند.

ایلان ماسک هم گفته که اگر تصمیم با او بود، تسلا مدت‌ها پیش در xAI سرمایه‌گذاری می‌کرد، اما این تصمیم را به رأی سهام‌داران واگذار کرده است.

در نهایت، به نظر می‌رسد ماسک در حال آماده‌سازی مقدمات برای ورود تسلا به جمع سرمایه‌گذاران xAI باشد — حلقه‌ای از سرمایه‌گذاری‌های چرخشی بین شرکت‌های زیرمجموعه یا مرتبط با ایلان ماسک که مدتی است ادامه دارد.

ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش می‌دهیم، پس حتماً با ما همراه باشید. شما در مورد مدل هوش مصنوعی Grok 4 چه نظری دارید؟ با ما به اشتراک بگذارید.

احسان نیک پویا

ثبت دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *