گروک جدیدِ ایلان ماسک برای رقابت با چت جی‌پی‌تی

نسخه جدید گروک با ارائه قابلیت‌های جدید و بهبود عملکرد، تلاش می‌کند جایگاه خود را در رقابت با بقیه مدل‌های گفتگو بهبود دهد.

خلاصه خبر

گروک جدیدِ ایلان ماسک برای رقابت با چت جی‌پی‌تی

نسخه جدید گروک با ارائه قابلیت‌های جدید و بهبود عملکرد، تلاش می‌کند جایگاه خود را در رقابت با بقیه مدل‌های گفتگو بهبود دهد.
گروه علم و پیشرفت خبرگزاری فارس- نسخه جدید گروک ۴.۱ که توسط شرکت ایکس‌اِی‌آی (xAI) معرفی شده، حالا یکی از مهم‌ترین به‌روزرسانی‌های این پلتفرم هوش‌مصنوعی است؛ نسخه‌ای که به گفته شرکت، هم‌زمان دقت، رفتار گفتگو، کاهش «توهم» و توان خلاقیت را بهبود داده است. انتشار این نسخه از سوی ایکس.اِی.آی نه‌تنها یک به‌روزرسانی ساده محسوب نمی‌شود، بلکه تلاشی است برای نزدیک‌تر شدن به استانداردهای مدل‌های پیشرو در بازار مانند «کلود» و «جمنای». این نسخه در تاریخ ۱۷ نوامبر ۲۰۲۵ رسماً عرضه شد و هم‌اکنون در پلتفرم ایکس، وب‌سایت رسمی و اپلیکیشن‌های موبایل در دسترس کاربران قرار دارد.

گروک جدید کمتر توهم می‌زند

گروک ۴.۱ در مقایسه با نسل قبلی خود، یعنی گروک ۴.۰، تغییرات قابل‌توجهی نشان می‌دهد. مهم‌ترین ادعای ایکس.اِی.آی مربوط به «کاهش نرخ هالوسینیشن» است؛ یعنی همان مشکل تولید پاسخ‌های نادرست یا ساختگی. بر اساس اطلاعات اعلام‌شده و گزارش‌های رسانه‌ای، در مجموعه‌ای از پرسش‌های اطلاعات‌محور، نرخ خطا از حدود ۱۲ درصد به حدود ۴ درصد کاهش یافته است. این کاهش چشمگیر، اگرچه نیازمند آزمون‌های کاملاً مستقل است، اما نشان می‌دهد ایکس.اِی.آی تلاش کرده تا یکی از مهم‌ترین چالش‌های مدل‌های زبانی را جدی‌تر مدیریت کند. البته این اعداد تنها در یک محیط آزمایشی گزارش شده و لزوماً نماینده همه موقعیت‌ها نیستند، اما روند کلی بهبود را از نگاه شرکت سازنده تأیید می‌کنند.

همدلی بیشتر ربات با کاربران

یکی دیگر از محورهای اصلی در نسخه جدید، تمرکز بر «هوش احساسی» است؛ یعنی توانایی مدل برای پاسخ‌گویی با لحن انسانی‌تر، همدلانه‌تر و سازگار با موقعیت. کاربران در شبکه‌های اجتماعی مانند ردیت گزارش داده‌اند که گروک ۴.۱ نسبت به نسخه‌های گذشته کمتر حالت مکانیکی دارد و پاسخ‌هایش طبیعی‌تر و روان‌تر به نظر می‌رسد. با این حال، برخی کاربران نیز اشاره کرده‌اند که این «دوستانه‌تر شدن» گاهی به قیمت افزایش «چاپلوسی» تمام شده است؛ همان رفتاری که در آن مدل بیش از حد با نظر کاربر موافقت می‌کند. این موضوع در نقدهای برخی تحلیلگران نیز تکرار شده و نشان می‌دهد مدل‌های زبانی بزرگ همچنان با مشکل حفظ تعادل میان «همدلی» و «واقع‌گرایی» مواجه هستند.

کسب رتبه اول در گفتگو و استدلال

در بخش عملکرد فنی، گروک ۴.۱ در بنچمارک «اِل‌اِم آرِنا» (LMArena) که توان مدل در گفت‌وگو و استدلال را می‌سنجد، عملکرد درخشانی داشته است. نسخه «فکری» مد (Thinking Mode) توانسته امتیاز 1483 اِلو (Elo) به‌دست آورد و جایگاه نخست را کسب کند. نسخه سریع‌تر، یعنی حالت Non-Thinking نیز امتیاز 1465 را کسب کرده و در رتبه دوم قرار گرفته است. این رتبه‌ها نشان می‌دهد که گروک ۴.۱ حداقل در این محیط ارزیابی عمومی، نسبت به بسیاری از مدل‌های رقیب برتری داشته است. البته همان‌طور که متخصصان تأکید می‌کنند، برتری در یک بنچمارک به معنی برتری قطعی در همه کاربردها نیست؛ ولی می‌تواند نشانه‌ای از جهش فنی باشد.با وجود این موفقیت‌ها، جنبه‌هایی از گروک ۴.۱ همچنان مبهم باقی مانده است. ایکس.اِی.آی تاکنون جزئیات فنی دقیقی درباره معماری مدل، تعداد پارامترها یا ترکیب داده‌های آموزشی منتشر نکرده است. نبود این اطلاعات موجب شده تحلیلگران نتوانند سطح پیشرفت را دقیقاً با مدل‌های باز مانند «لاما (LLaMA)» یا «جمینی» مقایسه کنند. در نتیجه، بررسی عملکرد مدل بیشتر بر اساس رفتار عملی، نمونه‌های واقعی و تست‌های عمومی کاربران انجام می‌شود تا تحلیل مهندسی کامل.

درس عبرتی که از قبل گرفته است

گروک همچنین سابقه‌ای از تولید محتوای جنجالی داشته است. در نسخه‌های قبلی گزارش‌هایی از پاسخ‌های توهین‌آمیز و محتوای حاوی کلیشه‌های خطرناک منتشر شده بود. اگرچه ایکس.اِی.آی پس از این اتفاقات، برخی قابلیت‌ها را محدود و مدل را اصلاح کرد، اما این سوابق باعث شده انتشار نسخه جدید با حساسیت بیشتری دنبال شود. در تحلیل‌های اخیر نیز نگرانی‌هایی مطرح شده که شاید نسخه ۴.۱ برای رسیدن به نتایج بهتر در بنچمارک‌ها بخشی از «سیاست‌های ایمنی» خود را کاهش داده باشد. به‌ویژه ادعاهایی درباره افزایش «پذیرش درخواست‌ها» مطرح شده است. این نگرانی‌ها البته نیازمند بررسی‌های مستقل و گسترده‌تر است.

کروگ در مسیر بلوغ

با کنار هم قرار دادن همه این داده‌ها، می‌توان گفت گروک ۴.۱ یک گام مهم برای ایکس.اِی.آی به‌شمار می‌رود—هم از نظر عملکرد و هم از نظر جایگاه در بازار رقابتی مدل‌های مکالمه‌محور. با این حال، هنوز نقاط مبهمی در مورد ساختار فنی و شیوه آموزش مدل وجود دارد که تنها با انتشار توضیحات رسمی یا تحلیل‌های مستقل روشن خواهد شد. علاوه بر آن، هرچند کاهش هالوسینیشن یک دستاورد چشمگیر است، اما رفتارهای جدید مدل در حوزه ایمنی، چاپلوسی و مدیریت محتوا باید در ماه‌های آینده زیر ذره‌بین بماند.در نهایت، گروک ۴.۱ نشان می‌دهد که ایکس.اِی.آی در مسیر بلوغ قرار دارد؛ مدلی که اکنون هم سریع‌تر شده، هم دقیق‌تر و هم از نظر گفتاری توانمندتر. اما همچنان پرسش‌هایی باقی مانده—از جمله اینکه آیا این پیشرفت‌ها پایدار خواهند بود و آیا گروک می‌تواند در کنار رقبای پرقدرت خود جایگاه بلندمدتی پیدا کند؟ پاسخ این پرسش‌ها تنها با گذشت زمان و ارزیابی‌های مستقل روشن خواهد شد؛ ارزیابی‌هایی که اکنون بیش از همیشه برای سنجش واقعیتِ ادعاهای هوش‌مصنوعی ضروری‌اند.
09:23 - 29 آبان 1404
نظرات کاربران
ارسال به صورت ناشناس
اخبار داغ