رفتن به نوشته‌ها

گوگل از جمینای 3.1 پرو با عملکرد بهتر در حل مسائل پیچیده رونمایی کرد

شرکت گوگل بار دیگر از یک مدل جدید هوش مصنوعی رونمایی کرد. این شرکت که در ماه نوامبر سال 2025 نسخه جمینای 3 را عرضه کرده بود، اکنون نسخه پرچم‌دار خود را به 3.1 ارتقا داده است. مدل جدید با نام جمینای 3.1 پرو (Gemini 3.1 Pro) از امروز به‌صورت نسخه پیش‌نمایش در اختیار توسعه‌دهندگان و کاربران قرار گرفته و گوگل وعده داده است که این نسخه در زمینه حل مسائل پیچیده و توانایی استدلال عملکرد بهتری ارائه می‌دهد.

عملکرد جمینای 3.1 پرو

گوگل هفته گذشته از بهبودهایی در ابزار Deep Think خبر داد و اعلام کرد که «هوش هسته‌ای» این به‌روزرسانی بر پایه جمینای 3.1 پرو شکل گرفته است. همانند روال همیشگی، معرفی مدل جدید با انتشار مجموعه‌ای از بنچمارک‌ها همراه بوده که عمدتاً پیشرفت‌هایی نه‌چندان چشمگیر اما قابل توجه را نشان می‌دهند. در آزمون شناخته‌شده Humanity’s Last Exam که دانش پیشرفته و تخصصی در حوزه‌های مختلف را ارزیابی می‌کند، Gemini 3.1 Pro موفق به ثبت رکورد 44.4 درصد شده است. نسخه قبلی یعنی جمینای 3 پرو امتیاز 37.5 درصد را کسب کرده و در همین آزمون، مدل OpenAI یعنی GPT 5.2 به امتیاز 34.5 درصد دست یافته بود.

گوگل همچنین به بهبود عملکرد این مدل در آزمون ARC-AGI-2 اشاره کرده است؛ آزمایشی که شامل مسائل منطقی نوآورانه‌ای می‌شود که امکان آموزش مستقیم آن‌ها به یک سیستم هوش مصنوعی وجود ندارد. نسخه جمینای 3 در این ارزیابی عملکرد ضعیف‌تری داشت و تنها به امتیاز 31.1 درصد رسیده بود، در حالی که مدل‌های رقیب امتیازهایی در بازه 50 تا 60 درصد کسب کرده بودند. اکنون جمینای 3.1 پرو امتیاز گوگل را بیش از دو برابر افزایش داده و به رقم قابل توجه 77.1 درصد رسانده است.

گوگل در گذشته بارها هنگام معرفی مدل‌های تازه خود اعلام کرده بود که آن‌ها پیشاپیش صدر جدول Arena leaderboard (که پیش‌تر با نام LM Arena شناخته می‌شد) را تصاحب کرده‌اند، اما این بار شرایط متفاوت است. در بخش تولید متن، مدل Claude Opus 4.6 با امتیاز 1504 حدود 4 امتیاز بالاتر از Gemini 3.1 Pro قرار گرفته است. در حوزه تولید کد نیز Opus 4.6، Opus 4.5 و GPT 5.2 High اندکی جلوتر از Gemini 3.1 Pro ایستاده‌اند. با این حال باید توجه داشت که رتبه‌بندی Arena leaderboard بر اساس رأی کاربران انجام می‌شود؛ به این معنا که کاربران خروجی‌هایی را که بیشتر می‌پسندند انتخاب می‌کنند و این روند ممکن است پاسخ‌هایی را که ظاهری درست دارند، حتی اگر کاملاً دقیق نباشند، در موقعیت برتر قرار دهد.

برای نمایش پیشرفت‌های جمینای 3.1 پرو، گوگل تمرکز ویژه‌ای بر توانایی این مدل در تولید گرافیک‌ها و شبیه‌سازی‌ها داشته است. نمونه‌های SVG که در ویدئوی مقایسه‌ای منتشرشده ارائه شده‌اند، از نظر ظاهری منظم‌تر و زیباتر به نظر می‌رسند؛ هرچند این نمونه‌ها توسط خود گوگل انتخاب شده‌اند. اعداد بزرگ در بنچمارک‌ها و نمایش‌های گزینشی می‌توانند چشمگیر باشند، اما پرسش اصلی این است که آیا کاربران در استفاده روزمره تفاوت محسوسی احساس خواهند کرد یا خیر.

چنانچه کاربری پرسش‌های انتزاعی مطرح کند و انتظار پاسخ‌های دقیق و چندلایه داشته باشد، احتمالاً جمینای 3.1 پرو نسبت به نسخه 3.0 خروجی‌های باکیفیت‌تری ارائه خواهد داد. توسعه‌دهندگانی که از جمینای برای طراحی گردش‌کارهای عامل‌محور استفاده می‌کنند نیز احتمالاً بهبود عملکرد را مشاهده خواهند کرد، زیرا امتیاز Gemini 3.1 Pro در بنچمارک APEX-Agents تقریباً دو برابر شده است.

مدل به‌روزشده از امروز در محیط AI Studio و Antigravity IDE به‌صورت پیش‌نمایش عرضه شده است. کاربران سازمانی نیز نسخه 3.1 Pro را در Vertex AI و Gemini Enterprise مشاهده خواهند کرد. برای کاربران عادی، این مدل از طریق اپلیکیشن جمینای و NotebookLM در دسترس قرار گرفته است. هزینه استفاده از API برای توسعه‌دهندگان تغییری نکرده و همچنان برابر با 2 دلار برای ورودی و 12 دلار برای خروجی به ازای هر 1M توکن است. همچنین اندازه پنجره زمینه نیز ثابت باقی مانده و شامل 1M توکن ورودی و 64k توکن خروجی می‌شود. در صورتی که الگوی پیشین گوگل ادامه پیدا کند، به احتمال زیاد در آینده نزدیک نسخه 3.1 برای مدل سریع‌تر و ارزان‌تر فلش نیز منتشر خواهد شد.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *