رفتن به نوشته‌ها

شاهکار استراتژیک انویدیا با تصاحب غیرمستقیم Groq برای تسلط بر بازار استنتاج

انویدیا شرکت Groq را تصاحب نمی‌کند؛ اما جنسن هوانگ یک کلاس درس تخصصی و غیرمنتظره را اجرا کرده است که هیچ‌کس انتظار آن را نداشت. مدیرعامل انویدیا احتمالا به تیم تراشه خود یک هدیه کریسمس که هیچ‌کس انتظارش را نداشت داده است؛ زیرا گزارش‌ها نشان می‌دهند تیم سبز با شرکت Groq که سخت‌افزارهای تخصصی هوش مصنوعی تولید می‌کند، وارد یک توافق‌نامه شده است. این تراشه‌ها قطعات ساده‌ای محسوب نمی‌شوند، بلکه می‌توانند دروازه ورود انویدیا برای تسلط بر بارهای کاری کلاس استنتاج باشند. برای درک این که چرا این اقدام یک شاهکار است، باید دو جبهه متمایز یعنی خلاءهای قانونی که جنسن از آن‌ها بهره برده است و سلطه سخت‌افزاری که او تضمین کرده را بررسی کنیم.

انویدیا همچنین قصد دارد تراشه‌های هوش مصنوعی H200 خود را با قیمت رقابتی به بازار چین عرضه کند.

در ظاهر شبیه تصاحب؛ در باطن یک قرارداد غیر انحصاری

شبکه CNBC اولین رسانه‌ای بود که این تحول را گزارش داد. این رسانه ادعا کرد انویدیا شرکت Groq Inc را در یک معامله عظیم 20 میلیارد دلاری خریداری می‌کند که بزرگ‌ترین تصاحب توسط جنسن محسوب می‌شود. این خبر با سرعت زیادی در صنعت منتشر شد؛ به‌گونه‌ای که برخی بر این باور بودند تحقیقات نظارتی می‌تواند مانع انجام این اقدام شود؛ در حالی که برخی دیگر آن را پایان کار Groq دانستند. با این حال، Groq بعدا بیانیه‌ای رسمی در وب‌سایت خود منتشر کرد که نشان می‌داد یک قرارداد مجوز غیر انحصاری با انویدیا امضا کرده است تا به این غول هوش مصنوعی اجازه دسترسی به فناوری استنتاج را بدهد.

ما قصد داریم پردازنده‌های کم‌تاخیر Groq را در معماری کارخانه هوش مصنوعی انویدیا ادغام کنیم تا پلتفرم را برای پوشش طیف گسترده‌تری از استنتاج هوش مصنوعی و بارهای کاری بلادرنگ گسترش دهیم. در حالی که ما کارمندان بااستعداد را به صفوف خود اضافه می‌کنیم و لیسانس مالکیت معنوی Groq را به دست می‌آوریم؛ شرکت Groq را به عنوان یک مجموعه تصاحب نمی‌کنیم.

ایمیل جنسن هوانگ

استراتژی تصاحب معکوس برای دور زدن قوانین

این یک حرکت کلاسیک تصاحب معکوس استخدامی از سوی انویدیا محسوب می‌شود. اگر کسی با معنای این اصطلاح آشنایی ندارد؛ باید گفت این یک حرکت از روی کتابچه راهنمای مایکروسافت است. این غول فناوری در سال 2024 معامله‌ای به ارزش 653 میلیون دلار با Inflection را اعلام کرد که شامل پیوستن افرادی مانند مصطفی سلیمان و کارن سیمونیان به این شرکت بود که استراتژی هوش مصنوعی این شرکت را پیش بردند.

تصاحب معکوس استخدامی به معنای استخدام استعدادهای کلیدی یک استارتاپ توسط یک شرکت بزرگ و باقی گذاشتن یک ساختار شرکتی حداقلی است که در نهایت مانع از تبدیل شدن چنین حرکتی به یک ادغام رسمی می‌شود. اکنون به نظر می‌رسد جنسن موفق شده است چیزی مشابه را اجرا کند تا تحت بازرسی FTC قرار نگیرد؛ زیرا با قالب‌بندی معامله Groq به عنوان یک قرارداد مجوز غیر انحصاری، انویدیا اساسا خارج از محدوده قانون Hart-Scott-Rodino یا همان HSR قرار می‌گیرد. جالب اینجاست که Groq ذکر می‌کند GroqCloud به فعالیت خود ادامه می‌دهد اما تنها به عنوان یک ساختار حداقلی باقی می‌ماند.

آنچه اتفاق افتاد این بود که انویدیا استعدادها و مالکیت معنوی Groq را با مبلغ گزارش شده 20 میلیارد دلار به دست‌آورد. این شرکت موفق شد از تحقیقات نظارتی فرار کند که به آن‌ها اجازه داد معامله را در عرض چند روز اجرا کنند.

معماری LPU شرکت Groq و قطعه گمشده پازل انویدیا

Groq یک اکوسیستم سخت‌افزاری دارد که می‌تواند موفقیت انویدیا در دوران آموزش مدل‌ها را تکرار کند. صنعت هوش مصنوعی در چند ماه گذشته از نظر تقاضای پردازشی به‌طور چشمگیری تکامل یافته است. در حالی که شرکت‌هایی مانند OpenAI، متا و گوگل مشغول آموزش مدل‌های پیشرو و به دنبال داشتن یک پشته استنتاجی قدرتمند نیز هستند، زیرا اکثر از این بخش درآمد کسب می‌کنند.

برتری SRAM بر HBM در پردازش استنتاجی

زمانی که گوگل تراشه‌های Ironwood TPU را معرفی کرد؛ صنعت آن را به عنوان یک گزینه متمرکز بر استنتاج مورد استقبال قرار داد. این ASICها به عنوان جایگزینی برای انویدیا معرفی شدند؛ عمدتا به این دلیل که ادعا می‌شد جنسن هنوز راهکاری که بر توان استنتاجی مسلط باشد ارائه نکرده است. وقتی در مورد استنتاج صحبت می‌کنیم، تقاضای پردازشی به‌طور چشمگیری تغییر می‌کند؛ زیرا در آموزش مدل‌ها، صنعت به توان عملیاتی بیشتر از تاخیر و شدت محاسباتی بالا نیاز دارد. به همین دلیل شتاب‌دهنده‌های مدرن با HBM و هسته‌های تنسور عظیم تقویت می‌شوند.

از آنجا که شرکت‌های بزرگ به سمت استنتاج تغییر مسیر می‌دهند، اکنون به یک موتور اجرایی سریع و پیش‌بینی‌پذیر و مستقیم نیاز دارند؛ زیرا تاخیر در پاسخگویی گلوگاه اصلی به شمار می‌رود. برای ارائه محاسبات سریع، شرکت‌هایی مانند انویدیا بارهای کاری مانند استنتاج با بافت عظیم (پیش‌پر کردن و استنتاج عمومی) را با Rubin CPX هدف قرار داده‌اند. شرکت گوگل نیز خود را به عنوان انتخابی با بهره‌وری انرژی بالاتر با TPUها معرفی می‌کند. با این حال وقتی نوبت به رمزگشایی می‌رسد، گزینه‌های زیادی در دسترس نیست.

رمزگشایی به مرحله تولید توکن در استنتاج یک مدل ترنسفورمر اشاره دارد. این موضوع به عنوان یک جنبه کلیدی در طبقه‌بندی بارهای کاری هوش مصنوعی اهمیت فزاینده‌ای پیدا کرده است. رمزگشایی به رفتار قطعی و با تاخیر کم نیاز دارد. با توجه به محدودیت‌های ناشی از استفاده از HBM (تاخیر و توان مصرفی) در محیط‌های استنتاج، Groq چیز منحصر‌به‌فردی به نام SRAM یا همان رم استاتیک در اختیار دارد.

ترکیب رمزگشایی با تاخیر کم و شکست رقبا

واحدهای LPU ساخته مدیرعامل سابق Groq یعنی جاناتان راس هستند که پس از قرارداد اخیر به انویدیا ملحق می‌شود. راس به دلیل کار روی TPUهای گوگل شناخته می‌شود؛ بنابراین می‌توانیم مطمئن باشیم تیم سبز یک دارایی بزرگ را به داخل مجموعه خود می‌آورد. واحدهای LPU یا همان واحدهای پردازش زبان، راهکار Groq برای بارهای کاری کلاس استنتاج هستند. این شرکت خود را بر پایه دو شرط اصلی از دیگران متمایز می‌کند. اولین مورد اجرای قطعی و استفاده از SRAM روی تراشه به عنوان ذخیره‌ساز اصلی وزن‌ها است. این رویکرد Groq برای دستیابی به سرعت با تضمین پیش‌بینی‌پذیری است.

شرکت Groq قبلا دو راهکار پیشرو را به نمایش گذاشته بود که شامل GroqChip و GroqCard مبتنی بر شریک تجاری می‌شد. بر اساس اطلاعات منتشر شده در اسناد رسمی، این تراشه‌ها دارای 230 مگابایت SRAM روی تراشه با پهنای باند حافظه تا 80 ترابایت بر ثانیه هستند. استفاده از SRAM یکی از مزیت‌های کلیدی LPUها محسوب می‌شود، زیرا اجازه می‌دهد تاخیر چندین برابر کمتر شود. با در نظر گرفتن تاخیر ناشی از دسترسی به DRAM و صف‌های کنترل‌کننده حافظه در HBM، حافظه SRAM با اختلاف قابل توجهی پیروز می‌شود. حافظه SRAM روی تراشه به Groq اجازه می‌دهد به ده‌ها ترابایت بر ثانیه پهنای باند داخلی دست یابد که به این شرکت امکان ارائه توان عملیاتی پیشرو را می‌دهد.

حافظه SRAM همچنین Groq را قادر می‌سازد یک پلتفرم با بهره‌وری انرژی بالا ارائه دهد؛ زیرا دسترسی به SRAM به انرژی بسیار کمتری در هر بیت نیاز دارد و سربار PHY را حذف می‌کند. در عملیات رمزگشایی، LPUها منجر به بهبود چشمگیر انرژی مصرفی به ازای هر توکن می‌شوند که با توجه به حافظه‌محور بودن بارهای کاری رمزگشایی، یک فاکتور حیاتی است.

در حالی که هنوز مشخص نشده LPUها چگونه می‌توانند در محصولات انویدیا ادغام شوند؛ یک راه برای ادغام LPUها در محصولات انویدیا انجام آن‌ها به عنوان بخشی از سیستم‌های استنتاج در مقیاس رک (مشابه Rubin CPX) همراه با زیرساخت شبکه است. این کار به پردازنده‌های گرافیکی اجازه می‌دهد بخش پیش‌پر کردن یا بافت‌های طولانی را مدیریت کنند، در حالی که LPUها بر رمزگشایی تمرکز می‌کنند. این موضوع اساسا به این معنا است که در وظایف استنتاجی، انویدیا همه چیز را مرتب کرده و LPUها را از یک گزینه آزمایشی به یک روش استنتاج استاندارد تغییر داده و پذیرش گسترده آن‌ها را تضمین کند.

شکسی نیست که این معامله یکی از بزرگ‌ترین دستاوردها برای انویدیا در زمینه پیشبرد سبد محصولاتش محسوب می‌شود. تمام شاخص‌ها به این واقعیت اشاره دارند که استنتاج گزینه بعدی خواهد بود که انویدیا درباره آن صحبت می‌کند و LPUها بخش اصلی استراتژی شرکت برای این زمینه از بارهای کاری هوش مصنوعی خواهند بود.

منتشر شده در دسته‌بندی نشده

اولین باشید که نظر می دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *