گروک جدیدِ ایلان ماسک برای رقابت با چت جیپیتی
نسخه جدید گروک با ارائه قابلیتهای جدید و بهبود عملکرد، تلاش میکند جایگاه خود را در رقابت با بقیه مدلهای گفتگو بهبود دهد.
خلاصه خبر
گروک جدیدِ ایلان ماسک برای رقابت با چت جیپیتی
نسخه جدید گروک با ارائه قابلیتهای جدید و بهبود عملکرد، تلاش میکند جایگاه خود را در رقابت با بقیه مدلهای گفتگو بهبود دهد.
گروه علم و پیشرفت خبرگزاری فارس- نسخه جدید گروک ۴.۱ که توسط شرکت ایکساِیآی (xAI) معرفی شده، حالا یکی از مهمترین بهروزرسانیهای این پلتفرم هوشمصنوعی است؛ نسخهای که به گفته شرکت، همزمان دقت، رفتار گفتگو، کاهش «توهم» و توان خلاقیت را بهبود داده است. انتشار این نسخه از سوی ایکس.اِی.آی نهتنها یک بهروزرسانی ساده محسوب نمیشود، بلکه تلاشی است برای نزدیکتر شدن به استانداردهای مدلهای پیشرو در بازار مانند «کلود» و «جمنای». این نسخه در تاریخ ۱۷ نوامبر ۲۰۲۵ رسماً عرضه شد و هماکنون در پلتفرم ایکس، وبسایت رسمی و اپلیکیشنهای موبایل در دسترس کاربران قرار دارد.
گروک جدید کمتر توهم میزند
گروک ۴.۱ در مقایسه با نسل قبلی خود، یعنی گروک ۴.۰، تغییرات قابلتوجهی نشان میدهد. مهمترین ادعای ایکس.اِی.آی مربوط به «کاهش نرخ هالوسینیشن» است؛ یعنی همان مشکل تولید پاسخهای نادرست یا ساختگی. بر اساس اطلاعات اعلامشده و گزارشهای رسانهای، در مجموعهای از پرسشهای اطلاعاتمحور، نرخ خطا از حدود ۱۲ درصد به حدود ۴ درصد کاهش یافته است. این کاهش چشمگیر، اگرچه نیازمند آزمونهای کاملاً مستقل است، اما نشان میدهد ایکس.اِی.آی تلاش کرده تا یکی از مهمترین چالشهای مدلهای زبانی را جدیتر مدیریت کند. البته این اعداد تنها در یک محیط آزمایشی گزارش شده و لزوماً نماینده همه موقعیتها نیستند، اما روند کلی بهبود را از نگاه شرکت سازنده تأیید میکنند.
همدلی بیشتر ربات با کاربران
یکی دیگر از محورهای اصلی در نسخه جدید، تمرکز بر «هوش احساسی» است؛ یعنی توانایی مدل برای پاسخگویی با لحن انسانیتر، همدلانهتر و سازگار با موقعیت. کاربران در شبکههای اجتماعی مانند ردیت گزارش دادهاند که گروک ۴.۱ نسبت به نسخههای گذشته کمتر حالت مکانیکی دارد و پاسخهایش طبیعیتر و روانتر به نظر میرسد. با این حال، برخی کاربران نیز اشاره کردهاند که این «دوستانهتر شدن» گاهی به قیمت افزایش «چاپلوسی» تمام شده است؛ همان رفتاری که در آن مدل بیش از حد با نظر کاربر موافقت میکند. این موضوع در نقدهای برخی تحلیلگران نیز تکرار شده و نشان میدهد مدلهای زبانی بزرگ همچنان با مشکل حفظ تعادل میان «همدلی» و «واقعگرایی» مواجه هستند.
کسب رتبه اول در گفتگو و استدلال
در بخش عملکرد فنی، گروک ۴.۱ در بنچمارک «اِلاِم آرِنا» (LMArena) که توان مدل در گفتوگو و استدلال را میسنجد، عملکرد درخشانی داشته است. نسخه «فکری» مد (Thinking Mode) توانسته امتیاز 1483 اِلو (Elo) بهدست آورد و جایگاه نخست را کسب کند. نسخه سریعتر، یعنی حالت Non-Thinking نیز امتیاز 1465 را کسب کرده و در رتبه دوم قرار گرفته است. این رتبهها نشان میدهد که گروک ۴.۱ حداقل در این محیط ارزیابی عمومی، نسبت به بسیاری از مدلهای رقیب برتری داشته است. البته همانطور که متخصصان تأکید میکنند، برتری در یک بنچمارک به معنی برتری قطعی در همه کاربردها نیست؛ ولی میتواند نشانهای از جهش فنی باشد.با وجود این موفقیتها، جنبههایی از گروک ۴.۱ همچنان مبهم باقی مانده است. ایکس.اِی.آی تاکنون جزئیات فنی دقیقی درباره معماری مدل، تعداد پارامترها یا ترکیب دادههای آموزشی منتشر نکرده است. نبود این اطلاعات موجب شده تحلیلگران نتوانند سطح پیشرفت را دقیقاً با مدلهای باز مانند «لاما (LLaMA)» یا «جمینی» مقایسه کنند. در نتیجه، بررسی عملکرد مدل بیشتر بر اساس رفتار عملی، نمونههای واقعی و تستهای عمومی کاربران انجام میشود تا تحلیل مهندسی کامل.
درس عبرتی که از قبل گرفته است
گروک همچنین سابقهای از تولید محتوای جنجالی داشته است. در نسخههای قبلی گزارشهایی از پاسخهای توهینآمیز و محتوای حاوی کلیشههای خطرناک منتشر شده بود. اگرچه ایکس.اِی.آی پس از این اتفاقات، برخی قابلیتها را محدود و مدل را اصلاح کرد، اما این سوابق باعث شده انتشار نسخه جدید با حساسیت بیشتری دنبال شود. در تحلیلهای اخیر نیز نگرانیهایی مطرح شده که شاید نسخه ۴.۱ برای رسیدن به نتایج بهتر در بنچمارکها بخشی از «سیاستهای ایمنی» خود را کاهش داده باشد. بهویژه ادعاهایی درباره افزایش «پذیرش درخواستها» مطرح شده است. این نگرانیها البته نیازمند بررسیهای مستقل و گستردهتر است.
کروگ در مسیر بلوغ
با کنار هم قرار دادن همه این دادهها، میتوان گفت گروک ۴.۱ یک گام مهم برای ایکس.اِی.آی بهشمار میرود—هم از نظر عملکرد و هم از نظر جایگاه در بازار رقابتی مدلهای مکالمهمحور. با این حال، هنوز نقاط مبهمی در مورد ساختار فنی و شیوه آموزش مدل وجود دارد که تنها با انتشار توضیحات رسمی یا تحلیلهای مستقل روشن خواهد شد. علاوه بر آن، هرچند کاهش هالوسینیشن یک دستاورد چشمگیر است، اما رفتارهای جدید مدل در حوزه ایمنی، چاپلوسی و مدیریت محتوا باید در ماههای آینده زیر ذرهبین بماند.در نهایت، گروک ۴.۱ نشان میدهد که ایکس.اِی.آی در مسیر بلوغ قرار دارد؛ مدلی که اکنون هم سریعتر شده، هم دقیقتر و هم از نظر گفتاری توانمندتر. اما همچنان پرسشهایی باقی مانده—از جمله اینکه آیا این پیشرفتها پایدار خواهند بود و آیا گروک میتواند در کنار رقبای پرقدرت خود جایگاه بلندمدتی پیدا کند؟ پاسخ این پرسشها تنها با گذشت زمان و ارزیابیهای مستقل روشن خواهد شد؛ ارزیابیهایی که اکنون بیش از همیشه برای سنجش واقعیتِ ادعاهای هوشمصنوعی ضروریاند.
09:23 - 29 آبان 1404
نظرات کاربران









