رفتن به نوشته‌ها

گوگل جمینای 3 را معرفی کرد؛ هوشمندترین و دقیق‌ترین مدل هوش مصنوعی

گوگل از امروز شروع به عرضه سری جدید مدل‌های هوش مصنوعی خود با نام جمینای 3 کرده است؛ مدل‌هایی که این شرکت آن‌ها را «هوشمندترین» و «دقیق‌ترین از نظر واقعیات» سیستم‌های هوش مصنوعی خود تا کنون معرفی می‌کند. این عرضه فرصتی برای گوگل فراهم کرده تا پس از مشکلات راه‌اندازی GPT-5 توسط OpenAI، بار دیگر در زمینه مدل‌های هوش مصنوعی مصرف‌کننده پیشتاز شود.

برای نخستین بار، گوگل از روز اول عرضه، دسترسی کامل همه کاربران به مدل پرچم‌دار جدید خود یعنی جمینای 3 پرو را در اپلیکیشن جمینای فراهم کرده است. همچنین این مدل برای مشترکین در داخل جستجوی گوگل نیز در دسترس قرار گرفته است. تولسی دوشی، مدیر ارشد و رئیس محصول Google DeepMind، اعلام کرد که این مدل جدید شرکت را به هدف «دسترسی‌پذیر و مفید کردن جهانی اطلاعات» نزدیک‌تر می‌کند؛ در حالی که موتور جستجوی آن همچنان در حال تکامل است.

به نظر من گام بزرگ واقعی در این مسیر، خروج از پارادایم پاسخ‌های صرفاً متنی و ارائه دیدی غنی‌تر و کامل‌تر از چیزی است که واقعاً می‌توانید ببینید.

تولسی دوشی مدیر ارشد و رئیس محصول Google DeepMind

Gemini 3 Pro به صورت بومی چندوجهی طراحی شده است

جمینای 3 پرو به صورت natively multimodal عمل می‌کند؛ یعنی می‌تواند متن، تصویر و صدا را همزمان پردازش کند. به عنوان مثال، گوگل اعلام کرده این مدل می‌تواند عکس‌های دستور پخت غذا را ترجمه کرده و سپس آن‌ها را به یک کتاب آشپزی تبدیل کند یا بر اساس مجموعه‌ای از سخنرانی‌های ویدیویی، فلش‌کارت‌های تعاملی بسازد.

برخی از این پیشرفت‌ها را در مجموعه محصولات گوگل مشاهده خواهید کرد؛ از جمله در اپلیکیشن جمینای که اکنون می‌توانید برنامه‌های کامل‌تر و غنی‌تری را داخل فضای کاری داخلی به نام Canvas بسازید. مدل ارتقایافته همچنین امکان «رابط‌های تولیدی» (generative interfaces) را فراهم می‌کند؛ ابزاری که گوگل در Gemini Labs آزمایش می‌کند و به جمینای 3 پرو اجازه می‌دهد قالب بصری شبیه مجله با تصاویری قابل مرورپذیر یا چیدمانی پویا با رابط کاربری سفارشی متناسب با پرامپت شما ایجاد کند.

بهبودهای جمینای 3 پرو در حالت AI Mode جستجوی گوگل

جمینای 3 پرو در حالت AI Mode (ویژگی جستجوی گوگل مبتنی بر هوش مصنوعی) نیز عناصر بصری مانند تصاویر، جدول‌ها، گریدها و شبیه‌سازی‌ها را بر اساس پرس‌وجوی شما نمایش می‌دهد. این مدل همچنین با استفاده از نسخه ارتقایافته تکنیک «query fan-out» گوگل قادر به انجام جستجوهای بیشتر است؛ تکنیکی که اکنون نه تنها سوال را به بخش‌های قابل جستجو تقسیم می‌کند؛ بلکه درک بهتری از نیت کاربر دارد و می‌تواند محتوای جدیدی را که قبلاً از قلم افتاده بود، پیدا کند.

گوگل به طور غیرمستقیم به OpenAI کنایه زده و جمینای 3 پرو را کمتر دچار تملق‌های توخالی شبیه ChatGPT توصیف کرده است. دوشی می‌گوید تغییرات «قابل توجه» در پاسخ‌های جمینای 3 پرو مشاهده خواهید کرد؛ پاسخ‌هایی که گوگل آن‌ها را «هوشمند، مختصر و مستقیم» می‌داند و به جای کلیشه و تملق، بینش واقعی ارائه می‌دهند؛ یعنی آنچه نیاز دارید نه صرفاً آنچه دوست دارید بشنوید. این شرکت همچنین اعلام کرده «کاهش سکوفانتی» (sycophancy) قابل توجهی داشته است؛ مشکلی که OpenAI مجبور شد اوایل سال جاری در ChatGPT برطرف کند.

قابلیت‌های استدلال و عامل‌محور پیشرفته‌تر

جمینای 3 پرو همراه با این بهبودها، از قابلیت‌های استدلال و عامل هوشمند بهتری برخوردار شده و می‌تواند وظایف پیچیده‌تر را انجام دهد و به طور قابل اعتماد برای افق‌های زمانی طولانی‌تر برنامه‌ریزی کند. این مدل هوش مصنوعی، ویژگی آزمایشی Gemini Agent را در اپلیکیشن جمینای قدرت می‌بخشد که می‌تواند کارهایی مانند بررسی و سازمان‌دهی ایمیل‌ها یا تحقیق و رزرو سفر را به نمایندگی از شما انجام دهد.

در حال حاضر جمینای 3 پرو در صدر جدول رده‌بندی LMArena (پلتفرم محبوب ارزیابی مدل‌های هوش مصنوعی) قرار گرفته است. حالت Deep Think نیز قابلیت‌های استدلال مدل را بیش از پیش تقویت می‌کند؛ هرچند فعلاً فقط برای تست‌کنندگان در دسترس است.

جمینای 3 پرو از امروز برای همه کاربران داخل اپلیکیشن جمینای قابل استفاده است. مشترکین Google AI Pro و Ultra در ایالات متحده همچنین می‌توانند Gemini Agent را در اپلیکیشن جمینای و جمینای 3 پرو را داخل AI Mode با انتخاب گزینه «Thinking» از منوی کشویی مدل امتحان کنند.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *