عرضه gpt-image-1.5 توسط OpenAI برای رقابت با Gemini Nano Banana گوگل

در ماه مارچ، شرکت OpenAI به‌روزرسانی مهمی را برای قابلیت‌های تولید تصویر در ChatGPT ارائه داد؛ این ارتقا با بهره‌گیری از مدلی جدید انجام شد که به‌سرعت توجه گسترده‌ای را به خود جلب کرد. این به‌روزرسانی به تنهایی میلیون‌ها کاربر جدید را به ChatGPT جذب کرد؛ به‌طوری که کاربران در تنها یک هفته بیش از 700 میلیون تصویر ایجاد کردند. در ماه آپریل، OpenAI با راه‌اندازی API gpt-image-1 همان فناوری تولید تصویر را در اختیار توسعه‌دهندگان قرار داد. OpenAI مدتی پیش نیز GPT-5.2 را معرفی کرد.

ورود مدل قدرتمند Gemini Nano Banana

در ماه سپتامبر، گوگل مدل تولید تصویر جدیدی با نام رمز Nano Banana معرفی کرد که به سرعت فراگیر شد و دامنه دسترسی جمینای را به میزان قابل توجهی افزایش داد. مدل Nano Banana در زمینه خلق و ویرایش تصویر از gpt-image-1 بهتر عمل کرد و پذیرش گسترده‌ای را میان توسعه‌دهندگان سراسر جهان به دست‌آورد. ماه گذشته، گوگل مدل Gemini 3 Pro Image را با نام رمز Nano Banana Pro عرضه کرد که از استدلال پیشرفته و دانش دنیای واقعی جمینای برای تولید تصاویری دقیق‌تر از همیشه بهره می‌برد.

نمونه تصاویر تولید شده با gpt-image-1.5

پاسخ OpenAI با معرفی gpt-image-1.5

امروز OpenAI مدل gpt-image-1.5 را منتشر کرده است که یک مدل تولید تصویر جدید با هدف رقابت مستقیم‌تر با سری Gemini Nano Banana شرکت گوگل محسوب می‌شود. همان‌طور که انتظار می‌رفت، مدل gpt-image-1.5 ویرایش تصویر دقیق‌تر و حفظ بهتر لوگوها و چهره‌ها را ارائه می‌دهد. این مدل همچنین در پیروی از دستورالعمل‌ها و پایبندی به پرامپت‌های کاربر به مراتب قوی‌تر است. OpenAI رندر متن در تصاویر تولید شده را به‌ویژه برای متن‌های متراکم‌تر و کوچک‌تر بهبود بخشیده است.

مزایا و کاهش هزینه‌ها برای توسعه‌دهندگان

برای توسعه‌دهندگان، هزینه ورودی‌ها و خروجی‌های تصویر در gpt-image-1.5 نسبت به gpt-image-1 حدود 20 درصد ارزان‌تر است. همانند گذشته، توسعه‌دهندگان می‌توانند با استفاده از پارامتر کیفیت، هزینه‌های تولید تصویر را بیشتر کنترل کنند. OpenAI ادعا می‌کند که مدل جدید حتی زمانی که تنظیمات کیفیت روی حالت پایین قرار داده شود؛ عملکرد قدرتمندی ارائه می‌دهد.

تجربه کاربری جدید در ChatGPT

برای مصرف‌کنندگان عمومی، مدل جدید اکنون تجربه تولید تصویر در ChatGPT را قدرت می‌بخشد. OpenAI تاکید کرد که این مدل ضمن حفظ جزئیاتی مانند نورپردازی؛ ترکیب‌بندی و ظاهر افراد؛ می‌تواند ویرایش‌های دقیقی انجام دهد و عملکردی تا 4 برابر سریع‌تر نسبت به مدل قبلی ارائه می‌دهد.

هاب اختصاصی تصاویر

OpenAI همچنین در حال معرفی یک هاب اختصاصی تصاویر در ChatGPT است که در اپلیکیشن موبایل و وب‌سایت chatgpt.com در دسترس قرار دارد. کاربران می‌توانند با استفاده از مجموعه‌ای از فیلترها و پرامپت‌های پیش‌فرض، به سرعت تولید تصویر را آغاز کنند. OpenAI خاطرنشان کرد که این پیش‌فرض‌ها و پرامپت‌ها به‌طور منظم به‌روزرسانی می‌شوند تا منعکس‌کننده روندهای نوظهور باشند. مدل جدید تولید تصویر و تجربه تصاویر ChatGPT برای تمام کاربران ChatGPT در حال عرضه است.