رفتن به نوشته‌ها

گروک 4.1 منتشر شده و انسانی‌تر از همیشه است!

xAI اعلام کرده که گروک 4.1 (Grok 4.1) یک به‌روزرسانی قابل‌توجه است؛ به‌روزرسانی‌ که فقط درباره سریع‌تر یا دقیق‌ترشدن نیست. این مدل تازه، توانایی بسیار بیشتری در تشخیص لحن، واکنش به احساسات و ارائه پاسخ‌هایی دارد که شبیه فردی است که طرف دیگر صفحه حضور دارد و کاربر را درک می‌کند. همچنین به نظر می‌رسد این نسخه کمی شوخ‌طبع و بازیگوش نیز شده است.

عملکرد گروک 4.1

تنها چند ساعت پس از منتشرشدن، گروک 4.1 توانست به صدر دو جدول رتبه‌بندی مهم هوش مصنوعی برسد. در جدول LMArena Text Leaderboard امتیاز اولیه 1483 را ثبت کرد که آن را بالاتر از تمام مدل‌هایی قرار می‌دهد که کاربران در حال حاضر می‌توانند به‌صورت عمومی با آن‌ها گفتگو کنند. علاوه بر این، در رتبه نخست EQ-Bench3 نیز قرار گرفت؛ معیاری که به‌طور ویژه برای سنجش هوش هیجانی طراحی شده و توسط Claude Sonnet 3.7 ارزیابی می‌شود.

بزرگ‌ترین ارتقاهای این نسخه، در دو حوزه اصلی دیده می‌شود: درک هیجانی و بهبود کیفیت نوشتن. مکالمه‌ها نسبت به نسخه‌های قبل طبیعی‌تر شده‌اند؛ پاسخ‌ها اکنون همراه با نشانه‌های کوچکی از همدلی یا شوخی ارائه می‌شوند و دیگر این حس را منتقل نمی‌کنند که نویسنده آن‌ها یک چت‌بات معمولی است. وقتی از آن بخواهند برای یک سفر به سان‌فرانسیسکو پیشنهاد بدهد یا یک پست تند و سریع برای X بنویسد، نتیجه بیشتر شبیه حرف‌های یک دوست باهوش و اهل‌ ذوق به نظر می‌رسد تا خروجی یک نرم‌افزار. xAI گفته این تغییرات با کمک گرفتن از «مربیان خبره هوش مصنوعی» برای اصلاح لحن و سبک نوشتار مدل ایجاد شده است.

البته این به‌روزرسانی فقط نقاط مثبت ندارد. در کارت مدل Grok 4.1 اشاره شده که نرخ رفتارهای نادرست یا فریبنده در آن نسبت به نسخه قبلی اندکی افزایش یافته است. همچنین این نسخه در حالت Thinking تمایل بیشتری دارد که وارد حوزه‌های حساس یا بحث‌برانگیز شود و از طرف دیگر، در API کمی راحت‌تر می‌توان آن را با حملات prompt-injection دور زد. هیچ‌‌یک از این مشکلات کاملاً غیرمنتظره نیستند؛ زیرا xAI نسخه 4.1 را مدلی «بی‌فیلترتر و بیان‌گرتر» توصیف کرده است. با این حال، این نگرانی‌ها همچنان قابل توجه‌اند.

به‌روزرسانی جدید همین حالا در همه جا فعال است. هر کاربری که گروک را در وب یا از طریق اپلیکیشن‌های X استفاده می‌کند، می‌تواند از قسمت انتخاب مدل، نسخه گروک 4.1 را فعال کرده و خودش آن را تجربه کند. اکنون این مدل در رتبه اول جدول‌های عمومی قرار دارد و با توجه به بازخوردهای اولیه، مشخص است که هدفش فقط «باهوش‌بودن» نیست؛ بلکه می‌خواهد دقیقاً آن‌جایی باشد که کاربر قرار دارد و او را به شکلی انسانی‌تر همراهی کند.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *