فرارو- شرکت DeepSeek در حال آماده سازی برای عرضه مدل زبانی بزرگ نسل بعدی خود با نام DeepSeek-R2 است که طبق برنامه، بین 15 تا 30 آگوست 2025 معرفی خواهد شد. به نقل از گیزموچاینا، این بازه زمانی در جریان گفت وگویی با مدل هوش مصنوعی خود DeepSeek آشکار شد و نشان می دهد که عرضه این مدل تنها چند روز پس از معرفی ChatGPT-5 انجام خواهد شد. انتظار می رود DeepSeek-R2 جهشی قابل توجه در معماری داشته باشد و از ساختار پیشرفته تر Mixture of Experts (MoE) بهره ببرد. همچنین یک شبکه گیتینگ هوشمندتر برای مدیریت بهتر بارهای پردازشی سنگین در مرحله استنتاج در آن ادغام خواهد شد. منابع آگاه می گویند این مدل می تواند تا 1.2 تریلیون پارامتر مقیاس پیدا کند، که تقریباً دو برابر DeepSeek-R1 با 671 میلیارد پارامتر است. با این حال، همچنان از ChatGPT-4/5 با بیش از 1.8 تریلیون پارامتر کوچک تر خواهد بود. گامی به سوی خودکفایی هوش مصنوعی در چین در راستای استراتژی دستیابی به خودکفایی در حوزه هوش مصنوعی، این مدل به طور کامل بر روی تراشه های Ascend 910B هواوی آموزش داده شده است. خوشه پردازشی هواوی با توان 512 PFLOPS در دقت FP16 و بهره وری 82 درصد، reportedly معادل 91 درصد توان خوشه A100 انویدیا را ارائه می دهد. تحلیلگران این اقدام را گامی مهم در کاهش وابستگی چین به سخت افزار هوش مصنوعی ساخت آمریکا می دانند. گزارش ها حاکی از آن است که هزینه آموزش DeepSeek-R2 به لطف استفاده از سخت افزار داخلی و تکنیک های بهینه سازی، 97 درصد کمتر از GPT-4 بوده است. پیش بینی می شود DeepSeek دسترسی API این مدل را با قیمت های پایین تر عرضه کند، اقدامی که می تواند مدل های قیمت گذاری رایج تحت سلطه OpenAI و Anthropic را تحت فشار قرار دهد. انتظار برای DeepSeek-R2 موجب افزایش حرکت در سهام فناوری چین شده است. سهام شرکت سازنده تراشه هوش مصنوعی Cambricon با رشد 20 درصدی، ارزش بازار خود را به بیش از 355 میلیارد یوان (حدود 49.7 میلیارد دلار) رساند. در خبرهای مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب برای تسریع فرایند استنتاج طراحی شده و مدیریت داده های KV Cache را در لایه های حافظه مانند HBM، DRAM و SSD بهینه می کند. هواوی در آزمایش با China UnionPay گزارش داد که این فناوری می تواند تأخیر را تا 90 درصد کاهش دهد و توان عملیاتی را 22 برابر افزایش دهد. این شرکت قصد دارد UCM را در ماه سپتامبر به صورت متن باز منتشر کند. در مجموع، عرضه DeepSeek-R2 و معرفی چارچوب UCM هواوی، نشانه ای از تغییر بزرگ در جاه طلبی های هوش مصنوعی چین است؛ تغییراتی که مسیر ساخت و اجرای سیستم های هوش مصنوعی قدرتمند بدون اتکا به تراشه ها یا ابزارهای نرم افزاری غربی را هموار می کنند. |