رفتن به نوشته‌ها

نکات جالبی که باید در مورد جمینای 3 گوگل بدانید

همانطور که می‌دانید، چند روز پیش گوگل رسماً جمینای 3، پیشرفته‌ترین مدل هوش مصنوعی خود تا به امروز را معرفی کرد. این نسخه جدید بر پایه پایه‌های جمینای 1 و جمینای 2 بنا شده و ارتقاهای عمده‌ای در استدلال، درک چندوجهی و کدگذاری مبتنی بر عامل به آن اضافه شده است. Gemini 3 اکنون چندین محصول گوگل، از جمله جستجو، برنامه Gemini و پلتفرم توسعه‌دهندگان جدید این شرکت، Google Antigravity را پشتیبانی می‌کند. در ادامه، نکات جالبی که باید در مورد جمینای 3 گوگا بدانید را با شما به اشتراک می‌گذاریم.

پاسخ‌های هوشمندانه‌تر و صادقانه‌تر

Gemini 3 نشان‌دهنده‌ تغییری در نحوه‌ تعامل هوش مصنوعی گوگل با کاربران است. این مدل از تعارفات و خوشامدگویی‌ها اجتناب می‌کند و بر ارائه پاسخ‌های دقیق، واضح و مفید تمرکز دارد. گوگل می‌گوید جمینای 3 پاسخ‌های هوشمندانه و مستقیمی ارائه می‌دهد که به جای تکرار انتظارات کاربر، بر بینش‌های واقعی تمرکز دارند.

این به‌روزرسانی منعکس‌کننده هدف گسترده‌تر گوگل برای تبدیل هوش مصنوعی به یک شریک فکری است. جمینای 3 ظرافت‌های متنی را درک می‌کند و لحن خود را بر اساس وظیفه تطبیق می‌دهد. گوگل ادعا می‌کند که این امر باعث می‌شود هوش مصنوعی در استفاده در دنیای واقعی صادق‌تر و پربارتر ظاهر شود.

درک بهتر همه‌چیز

در بخش توانایی‌های چندوجهی، این مدل از پردازش هم‌زمان متن، تصویر، ویدئو، صوت و کد در یک جریان واحد پشتیبانی می‌کند. کاربران می‌توانند انواع ورودی‌های ترکیبی مانند یادداشت‌های دست‌نویس، اسکرین‌شات‌ها یا فایل‌های یک سخنرانی کامل را بارگذاری کنند و مدل، محتوای ارائه‌شده را به‌صورت یکپارچه تحلیل کند. پس از تحلیل نیز این امکان وجود دارد که فلش‌کارت‌های تعاملی، خلاصه‌های دقیق یا شبیه‌سازی‌های تصویری، متناسب با مواد آموزشی تولید شود.

همچنین گوگل، محدوده حافظه متنی مدل را به یک‌میلیون توکن افزایش داده تا امکان مطالعه و حفظ اسناد طولانی و گفتگوهای مفصل فراهم شود؛ قابلیتی که در پروژه‌های پژوهشی یا وظایف دانشگاهی تاثیر قابل‌توجهی بر دقت مدل می‌گذارد.

پیشتازی در همه معیارها

جمینای 3 موفق شده است تقریباً در تمام معیارهای مهم مربوط به مدل‌های پیشرفته، رتبه برتر را کسب کند. در جدول رتبه‌بندی LMArena، این مدل با امتیاز Elo 1501 جایگاه نخست را در اختیار دارد. همچنین امتیاز 91.9% در GPQA Diamond، نمره 37.5% در Humanity’s Last Exam و نتیجه 23.4% در MathArena Apex نشان می‌دهد که توان مدل در استدلال علمی، حل مسائل پیچیده و مهارت‌های تحلیلی گسترده است.

در حوزه ارزیابی‌های چندوجهی نیز جمینای 3 گوگل رکوردهایی مانند 81% در MMMU-Pro و 87.6% در Video-MMMU را ثبت کرده و دقت واقعی آن در SimpleQA Verified به 72.1% رسیده است.

برای توسعه‌دهندگان، برتری مدل در WebDev Arena با امتیاز 1487 به چشم می‌خورد و کسب 76.2% در SWE-Bench Verified و 54.2% در Terminal-Bench 2.0 ثابت می‌کند که این مدل در برنامه‌نویسی، وظایف خط فرمان و فرایندهای کدنویسی خودکار از توان بالایی برخوردار است.

عامل‌هایی که می‌توانند خودشان کدنویسی کنند

گوگل پلتفرم توسعه‌ای تازه‌ای با نام Antigravity راه‌اندازی کرده است؛ بستری که بر پایه Gemini 3 فعالیت می‌کند و محیطی فراهم می‌سازد که در آن، عوامل هوشمند قادر باشند کدنویسی، اجرای تست و اجرای کد را به‌صورت مستقل انجام دهند.

این عوامل، دسترسی مستقیم به ویرایشگر کد، مرورگر و ترمینال دارند و با تکیه بر توانایی استدلال و مهارت استفاده از ابزارهای جمینای 3 گوگل، قادر هستند وظایف پیچیده در حوزه توسعه نرم‌افزار را مدیریت کنند. در آزمایش‌های داخلی، این سیستم توانست بدون دخالت انسان، یک برنامه ردیاب پرواز را به‌طور کامل از مرحله برنامه‌ریزی تا ساخت اجرا کرده و عملکرد آن را از طریق شبیه‌سازی‌های مبتنی بر مرورگر بررسی و تایید کند.

نتایج تعاملی در جستجو

جمینای 3 اکنون در حالت هوش مصنوعی جستجوی گوگل در دسترس است. این حالت، طرح‌بندی‌های بصری پویا، ابزارهای تعاملی و شبیه‌سازی‌ها را مستقیماً در نتایج جستجو فعال می‌کند. وقتی کاربران سوالات پیچیده می‌پرسند، Gemini 3 پاسخ‌های بلادرنگ ایجاد می‌کند که شامل جداول، نمودارها یا حتی ماشین‌حساب‌های سفارشی است.

اگر کسی به دنبال موضوعاتی مانند فیزیک مداری یا مقایسه‌های مالی باشد، Gemini 3 می‌تواند ماژول‌های تعاملی برای کمک به توضیح نتایج تولید کند. این ماژول‌ها با استفاده از قابلیت‌های کدنویسی و طراحی رابط کاربری داخلی آن تولید می‌شوند.

نتایج تعاملی در جستجو

Gemini 3 اکنون در حالت هوش مصنوعی جستجوی گوگل در دسترس است. این حالت، طرح‌بندی‌های بصری پویا، ابزارهای تعاملی و شبیه‌سازی‌ها را مستقیماً در نتایج جستجو فعال می‌کند. وقتی کاربران سوالات پیچیده می‌پرسند، جمینای 3 پاسخ‌های بلادرنگ ایجاد می‌کند که شامل جداول، نمودارها یا حتی ماشین‌حساب‌های سفارشی است.

اگر کسی به دنبال موضوعاتی مانند فیزیک مداری یا مقایسه‌های مالی باشد، Gemini 3 می‌تواند ماژول‌های تعاملی برای کمک به توضیح نتایج تولید کند. این ماژول‌ها با استفاده از قابلیت‌های کدنویسی و طراحی رابط کاربری داخلی آن تولید می‌شوند.

پیشرفت‌های جدید در آموزش

محققان گوگل دیپ‌مایند موفقیت جمینای 3 را مدیون پیشرفت در هر دو مرحله پیش از آموزش و پس از آموزش می‌دانند. اوریول وینیالز، معاون رئیس، گفت که پیشرفت‌ها از Gemini 2.5 به 3.0 بزرگترین پیشرفت‌هایی بوده که تیم دیده است. او همچنین گفت که پیش از آموزش به محدودیتی نرسیده و هنوز جای رشد وجود دارد.

بسیاری از کارشناسان معتقد بودند که مدل‌ها داده‌های عمومی اینترنت را به پایان رسانده‌اند. به نظر می‌رسد گوگل راه‌هایی برای استخراج ارزش بیشتر از داده‌های موجود پیدا کرده یا از مجموعه داده‌های داخلی که در دسترس رقبا نیست، استفاده کرده است. این امر به گوگل یک مزیت بلندمدت در ساخت سیستم‌های هوش مصنوعی نسل بعدی می‌دهد.

ایمنی و آزمایش قوی‌تر

گوگل می‌گوید جمینای 3 امن‌ترین مدل آن تاکنون است. این سیستم در برابر تزریق‌های سریع، رفتارهای چاپلوسی و خطرات سوءاستفاده آزمایش شده است. گروه‌های امنیتی خارجی مانند Vaultis و Dreadnode در ارزیابی‌ها شرکت داشتند. گوگل همچنین با سازمان‌هایی مانند UK AISI برای بررسی‌های توسعه مسئولانه همکاری کرد.

جمینای 3 پرو اکنون از طریق اپلیکیشن Gemini و حالت هوش مصنوعی گوگل سرچ برای مشترکین پرو و اولترا در سطح جهانی در دسترس است. نسخه پیشرفته‌تر «Deep Think» هنوز در دست بررسی‌های ایمنی است و بعداً عرضه خواهد شد.

در اخبار مرتبط با هوش مصنوعی، iFlytek هدفون‌های ترجمه هوش مصنوعی خود را با طراحی گوش باز، ترجمه همزمان و تا چهل و دو ساعت عمر باتری معرفی کرده است.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *