همانطور که میدانید، چند روز پیش گوگل رسماً جمینای 3، پیشرفتهترین مدل هوش مصنوعی خود تا به امروز را معرفی کرد. این نسخه جدید بر پایه پایههای جمینای 1 و جمینای 2 بنا شده و ارتقاهای عمدهای در استدلال، درک چندوجهی و کدگذاری مبتنی بر عامل به آن اضافه شده است. Gemini 3 اکنون چندین محصول گوگل، از جمله جستجو، برنامه Gemini و پلتفرم توسعهدهندگان جدید این شرکت، Google Antigravity را پشتیبانی میکند. در ادامه، نکات جالبی که باید در مورد جمینای 3 گوگا بدانید را با شما به اشتراک میگذاریم.
پاسخهای هوشمندانهتر و صادقانهتر
Gemini 3 نشاندهنده تغییری در نحوه تعامل هوش مصنوعی گوگل با کاربران است. این مدل از تعارفات و خوشامدگوییها اجتناب میکند و بر ارائه پاسخهای دقیق، واضح و مفید تمرکز دارد. گوگل میگوید جمینای 3 پاسخهای هوشمندانه و مستقیمی ارائه میدهد که به جای تکرار انتظارات کاربر، بر بینشهای واقعی تمرکز دارند.
این بهروزرسانی منعکسکننده هدف گستردهتر گوگل برای تبدیل هوش مصنوعی به یک شریک فکری است. جمینای 3 ظرافتهای متنی را درک میکند و لحن خود را بر اساس وظیفه تطبیق میدهد. گوگل ادعا میکند که این امر باعث میشود هوش مصنوعی در استفاده در دنیای واقعی صادقتر و پربارتر ظاهر شود.
درک بهتر همهچیز
در بخش تواناییهای چندوجهی، این مدل از پردازش همزمان متن، تصویر، ویدئو، صوت و کد در یک جریان واحد پشتیبانی میکند. کاربران میتوانند انواع ورودیهای ترکیبی مانند یادداشتهای دستنویس، اسکرینشاتها یا فایلهای یک سخنرانی کامل را بارگذاری کنند و مدل، محتوای ارائهشده را بهصورت یکپارچه تحلیل کند. پس از تحلیل نیز این امکان وجود دارد که فلشکارتهای تعاملی، خلاصههای دقیق یا شبیهسازیهای تصویری، متناسب با مواد آموزشی تولید شود.
همچنین گوگل، محدوده حافظه متنی مدل را به یکمیلیون توکن افزایش داده تا امکان مطالعه و حفظ اسناد طولانی و گفتگوهای مفصل فراهم شود؛ قابلیتی که در پروژههای پژوهشی یا وظایف دانشگاهی تاثیر قابلتوجهی بر دقت مدل میگذارد.
پیشتازی در همه معیارها
جمینای 3 موفق شده است تقریباً در تمام معیارهای مهم مربوط به مدلهای پیشرفته، رتبه برتر را کسب کند. در جدول رتبهبندی LMArena، این مدل با امتیاز Elo 1501 جایگاه نخست را در اختیار دارد. همچنین امتیاز 91.9% در GPQA Diamond، نمره 37.5% در Humanity’s Last Exam و نتیجه 23.4% در MathArena Apex نشان میدهد که توان مدل در استدلال علمی، حل مسائل پیچیده و مهارتهای تحلیلی گسترده است.
در حوزه ارزیابیهای چندوجهی نیز جمینای 3 گوگل رکوردهایی مانند 81% در MMMU-Pro و 87.6% در Video-MMMU را ثبت کرده و دقت واقعی آن در SimpleQA Verified به 72.1% رسیده است.
برای توسعهدهندگان، برتری مدل در WebDev Arena با امتیاز 1487 به چشم میخورد و کسب 76.2% در SWE-Bench Verified و 54.2% در Terminal-Bench 2.0 ثابت میکند که این مدل در برنامهنویسی، وظایف خط فرمان و فرایندهای کدنویسی خودکار از توان بالایی برخوردار است.
عاملهایی که میتوانند خودشان کدنویسی کنند
گوگل پلتفرم توسعهای تازهای با نام Antigravity راهاندازی کرده است؛ بستری که بر پایه Gemini 3 فعالیت میکند و محیطی فراهم میسازد که در آن، عوامل هوشمند قادر باشند کدنویسی، اجرای تست و اجرای کد را بهصورت مستقل انجام دهند.
این عوامل، دسترسی مستقیم به ویرایشگر کد، مرورگر و ترمینال دارند و با تکیه بر توانایی استدلال و مهارت استفاده از ابزارهای جمینای 3 گوگل، قادر هستند وظایف پیچیده در حوزه توسعه نرمافزار را مدیریت کنند. در آزمایشهای داخلی، این سیستم توانست بدون دخالت انسان، یک برنامه ردیاب پرواز را بهطور کامل از مرحله برنامهریزی تا ساخت اجرا کرده و عملکرد آن را از طریق شبیهسازیهای مبتنی بر مرورگر بررسی و تایید کند.
نتایج تعاملی در جستجو
جمینای 3 اکنون در حالت هوش مصنوعی جستجوی گوگل در دسترس است. این حالت، طرحبندیهای بصری پویا، ابزارهای تعاملی و شبیهسازیها را مستقیماً در نتایج جستجو فعال میکند. وقتی کاربران سوالات پیچیده میپرسند، Gemini 3 پاسخهای بلادرنگ ایجاد میکند که شامل جداول، نمودارها یا حتی ماشینحسابهای سفارشی است.
اگر کسی به دنبال موضوعاتی مانند فیزیک مداری یا مقایسههای مالی باشد، Gemini 3 میتواند ماژولهای تعاملی برای کمک به توضیح نتایج تولید کند. این ماژولها با استفاده از قابلیتهای کدنویسی و طراحی رابط کاربری داخلی آن تولید میشوند.
نتایج تعاملی در جستجو
Gemini 3 اکنون در حالت هوش مصنوعی جستجوی گوگل در دسترس است. این حالت، طرحبندیهای بصری پویا، ابزارهای تعاملی و شبیهسازیها را مستقیماً در نتایج جستجو فعال میکند. وقتی کاربران سوالات پیچیده میپرسند، جمینای 3 پاسخهای بلادرنگ ایجاد میکند که شامل جداول، نمودارها یا حتی ماشینحسابهای سفارشی است.
اگر کسی به دنبال موضوعاتی مانند فیزیک مداری یا مقایسههای مالی باشد، Gemini 3 میتواند ماژولهای تعاملی برای کمک به توضیح نتایج تولید کند. این ماژولها با استفاده از قابلیتهای کدنویسی و طراحی رابط کاربری داخلی آن تولید میشوند.
پیشرفتهای جدید در آموزش
محققان گوگل دیپمایند موفقیت جمینای 3 را مدیون پیشرفت در هر دو مرحله پیش از آموزش و پس از آموزش میدانند. اوریول وینیالز، معاون رئیس، گفت که پیشرفتها از Gemini 2.5 به 3.0 بزرگترین پیشرفتهایی بوده که تیم دیده است. او همچنین گفت که پیش از آموزش به محدودیتی نرسیده و هنوز جای رشد وجود دارد.
بسیاری از کارشناسان معتقد بودند که مدلها دادههای عمومی اینترنت را به پایان رساندهاند. به نظر میرسد گوگل راههایی برای استخراج ارزش بیشتر از دادههای موجود پیدا کرده یا از مجموعه دادههای داخلی که در دسترس رقبا نیست، استفاده کرده است. این امر به گوگل یک مزیت بلندمدت در ساخت سیستمهای هوش مصنوعی نسل بعدی میدهد.
ایمنی و آزمایش قویتر
گوگل میگوید جمینای 3 امنترین مدل آن تاکنون است. این سیستم در برابر تزریقهای سریع، رفتارهای چاپلوسی و خطرات سوءاستفاده آزمایش شده است. گروههای امنیتی خارجی مانند Vaultis و Dreadnode در ارزیابیها شرکت داشتند. گوگل همچنین با سازمانهایی مانند UK AISI برای بررسیهای توسعه مسئولانه همکاری کرد.
جمینای 3 پرو اکنون از طریق اپلیکیشن Gemini و حالت هوش مصنوعی گوگل سرچ برای مشترکین پرو و اولترا در سطح جهانی در دسترس است. نسخه پیشرفتهتر «Deep Think» هنوز در دست بررسیهای ایمنی است و بعداً عرضه خواهد شد.
در اخبار مرتبط با هوش مصنوعی، iFlytek هدفونهای ترجمه هوش مصنوعی خود را با طراحی گوش باز، ترجمه همزمان و تا چهل و دو ساعت عمر باتری معرفی کرده است.
اولین باشید که نظر می دهید