انویدیا جزئیات کامل سریعترین تراشه هوش مصنوعی خود را با نام Blackwell Ultra GB300 منتشر کرد؛ تراشهای که 50 درصد سریعتر از GB200 عمل میکند و به حافظه 288 گیگابایت مجهز شده است.
همزمان با کاهش قیمت کارتهای گرافیک سری RTX 50 در بریتانیا و اروپا، انویدیا در گیمزکام 2025 از مجموعهای از نوآوریهای گرافیکی، از جمله ارتقاء سرویس GeForce Now و قابلیتهای تازه در Nvidia App گرفته تا معرفی فناوری واقعگرایانه موی RTX پرده برداشت. همچنین، باندل اختصاصی بازی Borderlands 4 برای دارندگان RTX 50 نشان میدهد که انویدیا علاوهبر هوش مصنوعی، تمرکز ویژهای بر تجربه گیمینگ نسل جدید دارد.
تراشه Blackwell Ultra GB300؛ معجزه انویدیا برای هوش مصنوعی
چند روز پیش انویدیا مقالهای منتشر کرد که در آن به بررسی دقیق جدیدترین و قدرتمندترین تراشه هوش مصنوعی خود یعنی Blackwell Ultra GB300 پرداخت. این تراشه وارد مرحله تولید انبوه شده و هماکنون در اختیار مشتریان کلیدی قرار دارد. هرچند این تراشه نسخه توسعهیافته معماری Blackwell محسوب میشود، اما از نظر کارایی و قابلیتها ارتقای چشمگیری به همراه دارد.
همانطور که سری Super انویدیا نسخه پیشرفته کارتهای گرافیک RTX برای بازی به شمار میرود، سری Ultra نیز نسخه بهینهشده تراشههای هوش مصنوعی معرفیشده پیشین است. در معماریهای Hopper و Volta نسخه Ultra وجود نداشت، اما مدلهای بهبودیافته آنها به نوعی چنین نقشی را ایفا میکردند. علاوه بر برتری سختافزاری، بهینهسازیهای نرمافزاری نیز به افزایش کارایی مدلهای غیر Ultra کمک میکنند.
مشخصات کلی Nvidia Blackwell Ultra GB300
نسخه GB300 به عنوان یک گرافیک پیشرفته از دو قالب Reticle تشکیل شده که به وسیله رابط پهنای باند بالای NV-HBI به یکدیگر متصل شده و در نهایت به صورت یک تراشه واحد عمل میکنند. این گرافیک با فناوری TSMC 4NP «نسخه بهینه 5 نانومتری برای انویدیا» تولید شده و 208 میلیارد ترانزیستور در خود جای داده است. رابط NV-HBI پهنای باند 10 ترابایت بر ثانیه را میان دو قالب گرافیک فراهم میکند و عملکردی یکپارچه ارائه میدهد.
این کارت گرافیک شامل 160 واحد SM است که هرکدام 128 هسته CUDA، چهار هسته Tensor نسل پنجم با پشتیبانی از FP8، FP6 و NVFP4، حافظه Tensor یا TMEM با ظرفیت 256 کیلوبایت و واحدهای SFU دارند. در مجموع این مشخصات به 20480 هسته CUDA و 640 هسته Tensor به همراه 40 مگابایت حافظه TMEM میرسند.
مقایسه Hopper، Blackwell و Blackwell Ultra
ویژگیHopperBlackwellBlackwell Ultraفناوری ساختTSMC 4NTSMC 4NPTSMC 4NPتعداد ترانزیستور80B208B208Bتعداد قالب GPU122عملکرد NVFP4–1020 PetaFLOPSعملکرد FP824 PetaFLOPS5تسریع Attention4.5 TeraExponentials/s5 TeraExponentials/s10.7 TeraExponentials/sحداکثر ظرفیت حافظه HBM80 گیگابایت HBM «H100»؛ 141 گیگابایت HBM3E «H200»192 گیگابایت HBM3E288 گیگابایت HBM3Eحداکثر پهنای باند HBM3.35 ترابایت بر ثانیه «H100»؛ 4.8 TB/s «H200»8 ترابایت بر ثانیه8 ترابایت بر ثانیهپهنای باند NVLink900 گیگابایت بر ثانیه1800 گیگابایت بر ثانیه1800 گیگابایت بر ثانیهحداکثر توان مصرفی «TGP»تا 700 واتتا 1200 واتتا 1400 وات
هستههای Tensor نسل پنجم؛ قلب پردازش هوش مصنوعی
تمام عملیات محاسباتی هوش مصنوعی توسط هستههای Tensor نسل پنجم انجام میشود. انویدیا در هر نسل نوآوری بزرگی در این بخش ارائه کرده است:
- Volta؛ واحدهای MMA با 8 نخ پردازشی و FP16 همراه با FP32 برای آموزش
- Ampere؛ اجرای MMA در سطح Warp کامل با فرمتهای BF16 و TensorFloat-32
- Hopper؛ واحد MMA در گروه Warp با 128 نخ و موتور Transformer با پشتیبانی از FP8
- Blackwell؛ موتور Transformer نسل دوم با FP8، FP6 و NVFP4 به همراه حافظه TMEM
ارتقای حافظه در Blackwell Ultra
این نسخه با حافظه 288 گیگابایت HBM3e در 8 پشته و رابط 8192 بیتی با پهنای باند 8 ترابایت بر ثانیه عرضه میشود. در حالیکه مدل GB200 تنها 192 گیگابایت داشت، این ارتقا امکان پشتیبانی از مدلهای هوش مصنوعی با تریلیونها پارامتر را فراهم میکند. مزایا شامل:
- اجرای مدلهای 300B+ پارامتر بدون نیاز به جابجایی حافظه
- افزایش طول زمینه در مدلهای Transformer به کمک ظرفیت بیشتر KV Cache
- بهبود نسبت محاسبه به حافظه در بارهای کاری متنوع
اتصالات و ارتباطات داده
ارتباط در این گرافیک توسط NVLink نسل پنجم، NVLink-C2C و رابط PCIe Gen6 x16 برقرار میشود. ویژگیها شامل:
- پهنای باند دوطرفه 1.8 ترابایت بر ثانیه به ازای هر گرافیک «18 لینک × 100 گیگابایت بر ثانیه»
- بهبود دو برابری نسبت به NVLink 4 در Hopper
- پشتیبانی از پیکربندی حداکثر 576 گرافیک در ساختار بدون انسداد
- یکپارچگی در سطح رک با چینش NVL72 شامل 72 گرافیک و پهنای باند 130 ترابایت بر ثانیه
- ارتباط CPU-GPU با NVLink-C2C و قابلیت همسانسازی حافظه با پهنای باند 900 گیگابایت بر ثانیه
جدول مقایسه اتصالات در معماریهای Hopper، Blackwell و Blackwell Ultra
ویژگیHopper Blackwell Blackwell UltraNVLink «GPU-GPU»900 GB/s1800 GB/s1800 GB/sNVLink-C2C «CPU-GPU»900 GB/s900 GB/s900 GB/sرابط PCIe128 GB/s «Gen 5»256 GB/s «Gen 6»256 GB/s «Gen 6»
دقت محاسباتی و بهرهوری
این گرافیک با استاندارد NVFP4 توان افزایش 50 درصدی در محاسبات کمدقت متراکم به دست آورده و در عین حال به دقت نزدیک به FP8 میرسد. تفاوت با FP8 معمولاً کمتر از 1 درصد است. علاوه بر این، میزان حافظه مصرفی در مقایسه با FP8 حدود 1.8 برابر کمتر و در مقایسه با FP16 حدود 3.5 برابر کمتر است.
مدیریت پیشرفته و امنیت سازمانی
Blackwell Ultra GB300 امکانات امنیتی و مدیریتی جدیدی ارائه میدهد:
- موتور GigaThread نسل جدید با زمانبندی بهینه و توزیع بهتر بار پردازشی میان 160 SM
- پشتیبانی از Multi-Instance GPU «MIG» برای تقسیم گرافیک به چند نمونه مستقل؛ بهطور مثال ایجاد دو نمونه با 140 گیگابایت حافظه یا چهار نمونه با 70 گیگابایت یا هفت نمونه با 34 گیگابایت
- رایانش محرمانه و امنیت هوش مصنوعی با TEE سختافزاری و NVLink رمزگذاریشده بدون افت پهنای باند محسوس
- موتور RAS پیشرفته با بهرهگیری از هوش مصنوعی برای پایش هزاران پارامتر، پیشبینی خرابی و بهینهسازی نگهداری
جایگاه انویدیا در آینده هوش مصنوعی
تمام این ویژگیها نشان میدهد انویدیا با تراشههای Blackwell و Blackwell Ultra در صدر فناوری هوش مصنوعی قرار دارد. پشتیبانی نرمافزاری عمیق، بهینهسازیهای مداوم و سرمایهگذاری سالانه در تحقیق و توسعه، این شرکت را برای سالهای آینده در مسیر پیشتازی حفظ خواهد کرد.
اولین باشید که نظر می دهید