رفتن به نوشته‌ها

OpenAI با GPT-5.2 دوباره به میدان برگشت؛ رقیبی تازه‌نفس برای جمینای 3

شرکت OpenAI روز پنجشنبه و در شرایطی که رقابتی تنگاتنگ با گوگل را تجربه می‌کرد، مدل جدید GPT-5.2 را معرفی کرد که به‌عنوان پیشرفته‌ترین نسخه این شرکت و برای استفاده توسعه‌دهندگان و متخصصان در کارهای روزمره طراحی شده است. این معرفی در زمانی صورت گرفت که گزارش‌هایی درباره صدور یادداشت داخلی «کد قرمز» منتشر شده و فشار برای بازپس‌گیری سهم کاربران بالا رفته بود.

این نسخه قرار است برای کاربران پولی ChatGPT و توسعه‌دهندگان API در سه مدل ارائه شود: نسخه Instant که برای پرس‌وجوهای سریع و فعالیت‌هایی مانند جست‌وجوی اطلاعات، نگارش متن و ترجمه طراحی شده؛ نسخه Thinking که برای کارهای پیچیده مثل برنامه‌نویسی، تحلیل اسناد حجیم، ریاضیات و برنامه‌ریزی بهینه شده و نسخه Pro که دقیق‌ترین عملکرد را برای مسائل دشوار ارائه می‌کند.

Fidji Simo (فیدیجی سیمو)، مدیر ارشد محصول، در جلسه روز پنجشنبه توضیح داد که GPT-5.2 با هدف افزایش ارزش اقتصادی برای کاربران توسعه یافته و اکنون توانایی بیشتری در ساخت فایل‌های محاسباتی، تولید ارائه‌ها، نوشتن کد، درک تصاویر، فهم متن‌های طولانی و پیشبرد پروژه‌های چندمرحله‌ای دارد.

رقیبی تازه‌نفس برای جمینای 3

این مدل در زمانی عرضه شده که کوگل با جمینای 3 در اغلب بنچمارک‌ها صدرنشینی می‌کند و تنها حوزه‌ای که گوگل در آن جایگاه نخست ندارد، کدنویسی است؛ جایی که Claude Opus-4.5 از آنتروپیک همچنان برتری خود را حفظ کرده است. در اوایل همین ماه، گزارش شد که سم آلتمن به‌دلیل کاهش ترافیک ChatGPT و نگرانی از کاهش سهم بازار در برابر گوگل، یادداشت «کد قرمز» را منتشر کرده و خواستار تغییر فوری برخی اولویت‌ها شده بود؛ از جمله کنارگذاشتن برنامه‌های تبلیغاتی و تمرکز بر بهبود تجربه کاربری.

GPT-5.2 تلاشی مستقیم برای بازگرداندن پیشتازی OpenAI محسوب می‌شود، حتی با وجود اینکه برخی کارکنان پیشنهاد داده بودند انتشار آن به تأخیر بیفتد تا زمان بیشتری برای بهبود مدل وجود داشته باشد. اگرچه تصور می‌شد تمرکز شرکت بر توسعه امکانات شخصی‌سازی برای کاربران عادی باشد، عرضه این مدل نشان می‌دهد که OpenAI اکنون تلاش می‌کند حضور خود را در بازار سازمانی و میان توسعه‌دهندگان تقویت کند. داده‌های منتشرشده در همین هفته نیز نشان داد که استفاده سازمان‌ها از ابزارهای این شرکت طی یک سال گذشته رشد قابل‌توجهی داشته است.

در همین حال، گوگل تلاش کرده Gemini 3 را به‌طور عمیق در اکوسیستم محصولات و سرویس‌های ابری خود ادغام کند. این شرکت در هفته جاری سرورهای مدیریت‌شده MCP را معرفی کرد که اتصال عامل‌ها به سرویس‌هایی مانند Maps و BigQuery را آسان‌تر می‌کند. MCP درواقع رابط اصلی میان هوش مصنوعی، داده‌ها و ابزارهای بیرونی است.

OpenAI اعلام کرده که GPT-5.2 در حوزه‌هایی مانند برنامه‌نویسی، ریاضیات، علوم، پردازش دیداری، استدلال در متن‌های طولانی و استفاده از ابزارها، نتایج بهتری نسبت به نسخه‌های قبلی و برخی رقبا کسب کرده است. این پیشرفت‌ها می‌تواند به گردش‌کارهای عامل‌محور قابل‌اعتمادتر، تولید کد مناسب برای محیط‌های واقعی و ساخت سیستم‌های پیچیده در زمینه‌های حجیم و داده‌های واقعی منجر شود.

این توانایی‌ها GPT-5.2 را مقابل حالت Deep Think در Gemini 3 قرار می‌دهد؛ حالتی که به‌عنوان جهشی مهم در استدلال منطقی، ریاضی و علمی توصیف شده است. بنچمارک‌های داخلی OpenAI نشان می‌دهد نسخه Thinking در GPT-5.2 در تمامی آزمون‌های استدلال، از جمله SWE-Bench Pro برای مهندسی نرم‌افزار، GPQA Diamond برای دانش علمی سطح دکتری و مجموعه‌های ARC-AGI برای کشف الگو، عملکرد بهتری نسبت به Gemini 3 و Claude Opus 4.5 ارائه می‌دهد.

Aidan Clark (آیدان کلارک)، سرپرست تحقیق، توضیح داد که امتیاز بالای مدل در ریاضیات تنها به معنای حل معادله نیست. او گفت استدلال ریاضی راهی برای سنجش توانایی مدل در دنبال‌کردن منطق چندمرحله‌ای، حفظ سازگاری اعداد و جلوگیری از خطاهای کوچک اما تأثیرگذار است؛ ویژگی‌هایی که در کارهایی مانند مدل‌سازی مالی، پیش‌بینی و تحلیل داده نقش مهمی دارند.

در ادامه، Max Schwarzer (مکس شوارتزر)، مدیر محصول، اعلام کرد که GPT-5.2 در تولید و رفع اشکال کد پیشرفت چشمگیری داشته و توانایی بیشتری در توضیح گام‌به‌گام مسائل پیچیده ریاضی و منطقی دارد. به گفته او، استارتاپ‌هایی مانند Windsurf و CharlieCode گزارش داده‌اند که این مدل توانسته عملکردی هم‌سطح بهترین عامل‌های کدنویسی ارائه دهد و در گردش‌کارهای چندمرحله‌ای بهبود قابل‌اندازه‌گیری ایجاد کند. او همچنین اشاره کرد که نسخه Thinking در این مدل نسبت به نسخه قبلی 38 درصد خطای کمتر دارد و این موضوع باعث افزایش اعتمادپذیری آن در تصمیم‌گیری، پژوهش و نگارش روزمره شده است.

GPT-5.2 مسیر مدل‌های پیشین را ادامه می‌دهد

GPT-5.2 در اصل ادامه‌ای بر مسیر دو نسخه قبلی است. GPT-5 که در آگوست 2025 عرضه شد، ساختاری تازه معرفی کرد که امکان جابه‌جایی بین حالت سریع و حالت Thinking را فراهم می‌کرد. GPT-5.1 نیز که در نوامبر منتشر شد، این سیستم را طبیعی‌تر و مناسب‌تر برای کارهای عامل‌محور و برنامه‌نویسی کرد. نسخه جدید، مجموعه این پیشرفت‌ها را تقویت کرده و مدل را برای استفاده تولیدی پایدارتر ساخته است.

در این مرحله، فشار بر OpenAI بیش از همیشه است. این شرکت تعهداتی به ارزش 1.4 تریلیون دلار برای ساخت زیرساخت‌های هوش مصنوعی طی سال‌های آینده ثبت کرده؛ تعهداتی که زمانی شکل گرفت که شرکت هنوز برتری آغازین خود را در بازار حفظ کرده بود. اکنون که گوگل با سرعت بیشتری پیش می‌رود، همین تعهدات احتمالاً عامل اصلی هشدار «کد قرمز» آلتمن بوده است.

تمرکز بیشتر بر مدل‌های استدلالی نیز با ریسک همراه است. حالت‌هایی مانند Thinking و Deep Research نسبت به چت‌بات‌های معمولی نیازمند محاسبات بیشتری هستند و هزینه اجرای آن‌ها بالاتر است. اتکا به چنین مدل‌هایی در GPT-5.2 ممکن است چرخه‌ای هزینه‌زا ایجاد کند: افزایش مخارج برای کسب رتبه‌های بهتر و سپس افزایش بیشتر هزینه برای اجرای مدل‌های پرمصرف در مقیاس بالا.

گزارش‌ها نشان می‌دهد هزینه‌های محاسباتی OpenAI بیش از چیزی است که قبلاً بیان شده بود. طبق گزارش‌ها، بخش زیادی از هزینه استنتاج به‌جای اعتبارهای ابری، به‌صورت نقد پرداخته می‌شود که نشان می‌دهد هزینه‌ها از سطح مشارکت‌ها و اعتبارهای رایگان فراتر رفته است. با این‌ حال، سیمو توضیح داد که با افزایش مقیاس فعالیت شرکت، امکان ارائه محصولات بیشتر و ایجاد درآمد جدید برای پوشش هزینه‌های بالاتر فراهم می‌شود. او بیان کرد که کاربران امروز به نسبت سال گذشته با همان مقدار هزینه، هوش بسیار بیشتری دریافت می‌کنند.

با وجود تمرکز زیاد بر استدلال، نکته‌ای که در معرفی این مدل وجود نداشت، رونمایی از یک مولد تصویر جدید بود. گفته شده آلتمن در یادداشت کد قرمز اعلام کرده بود که توسعه سیستم تصویر باید در اولویت باشد، خصوصاً پس از اینکه مدل Gemini 2.5 Flash Image یا همان Nano Banana در آگوست 2025 به‌سرعت وایرال شد. ماه گذشته نیز گوگل نسخه Nano Banana Pro یا Gemini 3 Pro Image را معرفی کرد که توانایی بالاتری در رندر متن، دانش دنیای واقعی و تولید تصاویر نزدیک به واقعیت دارد و به‌خوبی در محصولات گوگل ادغام شده است؛ از جمله در ابزار Mixboard برای ساخت خودکار ارائه‌ها.

گزارش‌ها اشاره کرده‌اند که OpenAI احتمالاً در ژانویه 2026 نسخه‌ای با کیفیت تصویری بهتر، سرعت بیشتر و شخصیت بهبود‌یافته معرفی خواهد کرد، هرچند شرکت در مراسم اخیر این خبر را تأیید نکرد. این شرکت همچنین اعلام کرد که اقداماتی در حوزه ایمنی، شامل نظارت بر استفاده مرتبط با سلامت روان و بررسی سن کاربران نوجوان، در راه است؛ هرچند توضیح زیادی درباره این تغییرات ارائه نشد.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *