رفتن به نوشته‌ها

کاهش 10 برابری هزینه توکن با پلتفرم Blackwell انویدیا

انویدیا با اتکا به رویکرد Extreme Codesign موفق شد هزینه هر توکن را با جدیدترین پلتفرم Blackwell تا 10 برابر کاهش دهد؛ دستاوردی که نقطه عطفی در اقتصاد توکن یا Tokenomics محسوب می‌شود. پلتفرم Blackwell انویدیا با تمرکز بر بهینه‌سازی توکن در بارهای کاری استنتاج هوش مصنوعی، سطح جدیدی از بهره‌وری را معرفی کرده است؛ شرکت در تازه‌ترین پست وبلاگی خود از ثبت یک رکورد مهم در حوزه اقتصاد توکن خبر داد. همچنین جایگزین احتمالی انویدیا برای سری RTX 50 SUPER ممکن است گرافیک RTX 5090 با پسوند Mega باشد.

برتری GB200 NVL72 انویدیا نسبت به Hopper در اقتصاد توکن؛ جهش بزرگ در استنتاج هوش مصنوعی

سیستم GB200 NVL72 بر پایه معماری Blackwell توانسته در مقایسه با نسل Hopper تا 10 برابر اقتصاد توکن بهتری ارائه دهد؛ این برتری به موازی‌سازی در سطح تخصصی نسبت داده شده است. انویدیا در حالی که توسعه زیرساخت‌های جدید در اکوسیستم هوش مصنوعی را با سرعت دنبال می‌کند؛ بهبود بهره‌وری سخت‌افزارهای مستقرش را به‌عنوان یکی از اولویت‌های اصلی در نظر گرفته است.

هم‌زمان با عرضه مدل‌های Frontier آموزش‌دیده بر پایه Blackwell در صنعت، روند پیشرفت این شرکت در خروجی توکن و هزینه‌های مرتبط آشکارتر شده است. اکنون انویدیا اعلام می‌کند که با همکاری کسب‌وکارها برای مقیاس‌پذیری عملکرد Blackwell، به بهبود 10 برابری نسبت به نسل Hopper دست یافته است.

ارائه‌دهندگان مطرح استنتاج از جمله Baseten، DeepInfra، Fireworks AI و Together AI به همین دلیل از پلتفرم Blackwell انویدیا استفاده می‌کنند؛ زیرا این پلتفرم امکان کاهش هزینه هر توکن تا 10 برابر نسبت به Hopper را فراهم می‌کند. این شرکت‌ها میزبان مدل‌های متن‌باز پیشرفته‌ای هستند که اکنون به سطح هوش Frontier رسیده‌اند.

ترکیب هوش Frontier متن‌باز با هم‌طراحی افراطی سخت‌افزار و نرم‌افزار در Blackwell و همچنین پشته‌های استنتاج بهینه‌سازی‌شده اختصاصی این ارائه‌دهندگان، کاهش چشمگیر هزینه توکن را برای کسب‌وکارها در تمامی صنایع ممکن کرده است.

انویدیا در بررسی اقتصاد توکن روی Blackwell به شرکت‌هایی مانند Baseten، Sully.ai، DeepInfra با تمرکز بر بازی و Latitude اشاره می‌کند. معماری Blackwell برای هر یک از این سازمان‌ها تاخیر کمتر، هزینه بهینه استنتاج و پاسخ‌های قابل‌اعتماد را فراهم کرده است؛ به همین دلیل این پشته فناوری اکنون به گزینه اصلی شرکت‌های جریان اصلی هوش مصنوعی تبدیل شده است. حتی در گردش‌کارهای چندعاملی و استقرار ایجنت‌های تخصصی هوش مصنوعی، شرکت Sentient Labs نسبت به Hopper به بهبود 25 تا 50 درصدی در بهره‌وری هزینه دست یافته است.

پیشرفت انویدیا در معماری هوش مصنوعی Blackwell بر پایه رویکرد «هم‌طراحی افراطی» شکل گرفته که با معماری‌های MoE امروزی سازگاری بالایی دارد. انویدیا در GB200 NVL72 از پیکربندی 72 تراشه در کنار 30 ترابایت حافظه اشتراکی پرسرعت استفاده می‌کند؛ این ترکیب موازی‌سازی تخصصی را به سطحی کاملاً جدید می‌رساند. در این ساختار، بسته‌های توکن به‌صورت مداوم میان گرافیک‌ها تقسیم و توزیع می‌شوند؛ حجم ارتباطات نیز با نرخ غیرخطی افزایش می‌یابد. چنین ویژگی‌هایی Blackwell را به کارآمدترین معماری انویدیا از منظر اقتصاد توکن تبدیل کرده‌اند.

انویدیا در گام بعدی با معماری Vera Rubin قصد دارد بهره‌وری زیرساخت را به سطح بالاتری ارتقا دهد؛ پیشرفت‌های معماری، مکانیزم‌های تخصصی مانند CPX برای مرحله Prefill و سایر نوآوری‌ها نقش کلیدی در این مسیر ایفا می‌کنند. با توجه به سرعت بالای تحول در اکوسیستم هوش مصنوعی؛ بهینه‌سازی سخت‌افزار هم‌وزن توسعه نسل‌های جدید اهمیت دارد.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *