مدل هوش مصنوعی Grok 4 از شرکت xAI این روزها حسابی خبرساز شده و بخش بزرگی از این توجهات، ناشی از تبلیغات خود ایلان ماسک است.
با این حال، پشت پرده ماجرا چیز دیگری است؛ به نظر میرسد که این مدل طوری طراحی شده تا در آزمونهای معیار هوش مصنوعی عملکرد درخشانی داشته باشد، اما وقتی پای چالشهای واقعی، پویا و استراتژیک به میان میآید، عملکردش بهشدت افت میکند.
برای مثال، همین چند روز پیش این مدل به خاطر بازتاب بینقص دیدگاههای ایلان ماسک — بهویژه نظرات جنجالبرانگیزش در مورد مهاجرت و تنشهای ژئوپلیتیکی جهان — مورد توجه قرار گرفت.
اما این ماجرا به همینجا ختم نشد. پس از بهروزرسانی برخی دستورات سیستمی Grok 4، این مدل خود را MechaHitler (هیتلر ماشینی) نامید و حتی به تمجید از آدولف هیتلر پرداخت و موجی از انتقادات را برانگیخت.
شرکت xAI به دلیل رفتار جانبدارانه هوش مصنوعی Grok عذرخواهی کرد
از نظر فنی، Grok 4 توانست رتبه پنجم را در تست معروف Step Race Benchmark کسب کند. این تست مدلها را در شرایط پرتنش برای همکاری و فریبکاری میسنجد. در این تست، مدل o3 با امتیاز 9.4 در رتبه اول و Grok 4 با امتیاز 7.9 در جایگاه پنجم قرار گرفت. حتی مدل Gemini 2.5 Flash هم عملکرد بهتری از Grok 4 داشت.
این تفاوت بین نتایج آزمونهای استاندارد و عملکرد Grok 4 در شرایط واقعی، باعث شده برخی متخصصان این فرضیه را مطرح کنند که Grok 4 به جای یادگیری واقعی، صرفاً دادههای آموزشی را حفظ کرده و برای گرفتن نمرات بالا در تستها بیش از حد تنظیم (overfit) شده است.
به گفته یکی از تحلیلگران، مدل Grok 4 در زمینه استدلال (مثل حل پازلهای نیویورک تایمز) پیشرفت چشمگیری داشته، اما در حوزههایی مثل نویسندگی خلاق هنوز عملکرد قابل توجهی ندارد.
البته اینها به این معنی نیست که Grok 4 بیارزش باشد. برعکس، توانایی آن در تشخیص مشکلات موجود در کدهای نرمافزاری نسبت به گذشته به شکل قابل توجهی بهتر شده و بسیاری از توسعهدهندگان از آن برای یافتن باگها و خطاهای برنامهنویسی استفاده میکنند.
یکی از کاربران بهنام Tetsuo گفته که Grok 4 Heavy در شناسایی اشکالات کد جاوااسکریپت بازیاش عملکرد عالی داشته است. دیگری، Danny Limanseta، از این مدل برای ساخت نمونه اولیه یک بازی استفاده کرده و کد آن را به محیط Cursor منتقل کرده تا توسعه را ادامه دهد.
با این حال، باید گفت که عملکرد این مدل به آن خوبی نیست که ایلان ماسک ادعا میکند. برای مثال، در پلتفرم پیشبینی شرطبندی Kakshi، مدل Grok 4 تاکنون فقط توجه محدودی را به خود جلب کرده و نتایج متوسطی داشته است.
در همین حال، روزنامه فایننشال تایمز گزارش داده که شرکت xAI که مالک شبکه اجتماعی X هم هست، قصد دارد در دور جدید جذب سرمایه، ارزشی معادل 200 میلیارد دلار برای خود تعریف کند. xAI در ماه ژوئن 300 میلیون دلار از طریق فروش ثانویه سهام و در اوایل جولای هم 10 میلیارد دلار سرمایه جذب کرده بود.
از سوی دیگر، گزارش شده که شرکت فضایی SpaceX هم قصد دارد 2 میلیارد دلار از سرمایه 5 میلیارد دلاری اخیرش را در xAI سرمایهگذاری کند.
ایلان ماسک هم گفته که اگر تصمیم با او بود، تسلا مدتها پیش در xAI سرمایهگذاری میکرد، اما این تصمیم را به رأی سهامداران واگذار کرده است.
در نهایت، به نظر میرسد ماسک در حال آمادهسازی مقدمات برای ورود تسلا به جمع سرمایهگذاران xAI باشد — حلقهای از سرمایهگذاریهای چرخشی بین شرکتهای زیرمجموعه یا مرتبط با ایلان ماسک که مدتی است ادامه دارد.
ما اینجا در رسانه خبری بنچیمو آخرین اخبار مرتبط با تکنولوژی را پوشش میدهیم، پس حتماً با ما همراه باشید. شما در مورد مدل هوش مصنوعی Grok 4 چه نظری دارید؟ با ما به اشتراک بگذارید.




