رفتن به نوشته‌ها

رونمایی انویدیا از مدل‌های هوش مصنوعی Nemotron 3 با سرعت 4 برابر بیشتر

شرکت انویدیا جدیدترین مدل‌های باز خود را تحت خانواده Nemotron 3 معرفی کرده است که شامل سه اندازه مختلف می‌شود و عملکرد هوش مصنوعی سریع‌تری را ارائه می‌دهد. همچنین پس از لغو ممنوعیت‌های صادراتی برای پردازنده‌های گرافیکی Hopper H200 AI شرکت انویدیا توسط دولت ایالات متحده، این محصول با تقاضای چشمگیری در چین مواجه شده است.

معرفی مدل‌های باز هوش مصنوعی Nemotron 3 در اندازه‌های Nano 30B، Super 100B و Ultra 500B

شرکت انویدیا امروز خانواده Nemotron 3 از مدل‌های باز، داده‌ها و کتابخانه‌ها را با هدف تقویت توسعه شفاف، کارآمد و تخصصی هوش مصنوعی عامل‌گرا در صنایع مختلف معرفی کرد. مدل‌های Nemotron 3 در اندازه‌های Nano، Super و Ultra معماری ترکیبی نوآورانه نهفته متخصصان (MoE) را معرفی می‌کنند که به توسعه‌دهندگان در ساخت و استقرار سیستم‌های چندعاملی قابل‌اعتماد در مقیاس وسیع کمک می‌کند.

پلتفرم NVIDIA Nemotron از تلاش‌های گسترده‌تر انویدیا در زمینه هوش مصنوعی حاکمیتی پشتیبانی می‌کند و سازمان‌هایی از اروپا تا کره جنوبی مدل‌های باز، شفاف و کارآمدی را به کار می‌گیرند که به آن‌ها اجازه می‌دهد سیستم‌های هوش مصنوعی هماهنگ با داده‌ها، مقررات و ارزش‌های خود را بسازند. پذیرندگان اولیه شامل Accenture، Cadence، CrowdStrike، Cursor، Deloitte، EY، Oracle Cloud Infrastructure، Palantir، Perplexity، ServiceNow، Siemens و Zoom در حال ادغام مدل‌های خانواده Nemotron برای تقویت گردش‌های کاری هوش مصنوعی در زمینه تولید، امنیت سایبری، توسعه نرم‌افزار، رسانه، ارتباطات و سایر صنایع هستند.

مدل‌های باز Nemotron 3 به استارتاپ‌ها امکان می‌دهند تا سریع‌تر روی عامل‌های هوش مصنوعی کار کنند و نوآوری را از مرحله پروتوتایپ تا استقرار سازمانی شتاب بخشند. شرکت‌های زیرمجموعه Mayfield در حال بررسی Nemotron 3 برای ساخت هم‌تیمی‌های هوش مصنوعی هستند که از همکاری انسان و هوش مصنوعی پشتیبانی می‌کنند.

تحول هوش مصنوعی چندعاملی با کارایی و دقت توسط Nemotron 3

خانواده مدل‌های MoE Nemotron 3 شامل سه اندازه زیر است:

  • مدل Nemotron 3 Nano: یک مدل کوچک 30 میلیارد پارامتری با 3 میلیارد پارامتر فعال برای وظایف هدفمند و بسیار کارآمد است.
  • مدل Nemotron 3 Super: یک مدل استدلالی با دقت بالا با تقریباً 100 میلیارد پارامتر و 10 میلیارد پارامتر فعال برای کاربردهای چندعاملی است.
  • مدل Nemotron 3 Ultra: یک موتور استدلالی بزرگ با حدود 500 میلیارد پارامتر و 50 میلیارد پارامتر فعال برای کاربردهای پیچیده هوش مصنوعی است.

عملکرد و ویژگی‌های فنی

مدل Nemotron 3 Nano که امروز در دسترس قرار گرفته است؛ مقرون‌به‌صرفه‌ترین مدل از نظر محاسباتی محسوب می‌شود و برای وظایف هدفمندی مانند دیباگ نرم‌افزار، خلاصه‌سازی محتوا، دستیارهای هوش مصنوعی و بازیابی اطلاعات با هزینه‌های استنتاج پایین بهینه‌سازی شده است. این مدل از یک معماری منحصر‌به‌فرد ترکیبی MoE استفاده می‌کند که دستاوردهایی را در کارایی و مقیاس‌پذیری ارائه می‌دهد.

این طراحی تا 4 برابر توان عملیاتی توکن بالاتر نسبت به Nemotron 2 Nano را محقق می‌سازد و تولید توکن استدلال را تا 60 درصد کاهش می‌دهد که به‌طور قابل‌توجهی هزینه‌های استنتاج را پایین می‌آورد. مدل Nemotron 3 Nano با پنجره زمینه 1 میلیون توکنی، موارد بیشتری را به خاطر می‌سپارد که آن را دقیق‌تر و در ارتباط دادن اطلاعات در طول وظایف طولانی و چندمرحله‌ای توانمندتر می‌سازد. سازمان مستقل Artificial Analysis که بنچمارک هوش مصنوعی انجام می‌دهد؛ این مدل را به عنوان بازترین و کارآمدترین مدل در میان مدل‌های هم‌اندازه و با دقت پیشرو رتبه‌بندی کرد.

مدل Nemotron 3 Super در کاربردهایی که به تعداد زیادی عامل همکاری‌کننده برای انجام وظایف پیچیده با تأخیر کم نیاز دارند، برتری دارد. مدل Nemotron 3 Ultra به عنوان یک موتور استدلالی پیشرفته برای گردش‌های کاری هوش مصنوعی عمل می‌کند که نیازمند تحقیقات عمیق و برنامه‌ریزی استراتژیک هستند.

مدل‌های Nemotron 3 Super و Ultra از فرمت آموزش فوق‌کارآمد 4 بیتی NVFP4 متعلق به انویدیا روی معماری NVIDIA Blackwell استفاده می‌کنند که نیازهای حافظه را به‌طور قابل‌توجهی کاهش می‌دهد و آموزش را سرعت می‌بخشد. این کارایی اجازه می‌دهد تا مدل‌های بزرگتر بدون به خطر انداختن دقت نسبت به فرمت‌هایی با دقت بالاتر روی زیرساخت‌های موجود آموزش داده شوند.

توسعه‌دهندگان با خانواده مدل‌های Nemotron 3 می‌توانند مدل بازی را انتخاب کنند که برای بارهای کاری خاص آن‌ها مناسب‌سازی شده است و در حالی که از استدلال سریع‌تر و دقیق‌تر در افق طولانی برای گردش‌های کاری پیچیده بهره می‌برند، مقیاس آن را از ده‌ها تا صدها عامل افزایش دهند.

شروع کار با مدل‌های باز انویدیا

مدل Nemotron 3 Nano امروز روی Hugging Face و از طریق ارائه‌دهندگان سرویس استنتاج شامل Baseten، Deepinfra، Fireworks، FriendliAI، OpenRouter و Together AI در دسترس است. مدل Nemotron روی پلتفرم‌های هوش مصنوعی سازمانی و زیرساخت داده شامل Couchbase، DataRobot، H2O.ai، JFrog، Lambda و UiPath ارائه می‌شود. Nemotron 3 Nano برای مشتریان در کلادهای عمومی، روی AWS از طریق Amazon Bedrock (بدون سرور) در دسترس خواهد بود و همچنین به زودی در Google Cloud، Coreweave، Nebius، Nscale و Yotta پشتیبانی می‌شود.

مدل Nemotron 3 Nano به عنوان یک میکروسرویس NVIDIA NIMTM برای استقرار ایمن و مقیاس‌پذیر در هر مکانی روی زیرساخت شتاب‌دهی شده انویدیا جهت حداکثر حریم خصوصی و کنترل در دسترس است. انتظار می‌رود مدل‌های NVIDIA Nemotron 3 Super و Ultra در نیمه اول سال 2026 در دسترس قرار گیرند.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *