在雙方的高效協作下,僅用時一天,便成功完成了與DeepSeek R1的適配工作,并且已正式上線多款大模型服務,其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。
天數智芯副總裁宋煜2月5日對據其介紹:“目前天數已經完成了V3、R1、Janus等模型的推理適配工作,在公開數據的精度測試上也和論文相當。適配成功后,天數也和Gitee AI、并行計算、算力互聯等合作伙伴一起上線了多款大模型服務。”
無獨有偶,華為計算于2月4日表示,潞晨科技攜手昇騰,聯合發布基于昇騰算力的DeepSeek R1系列推理API及云鏡像服務。2月5日,華為官方披露,2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署,帶來更快、更高效、更便捷的AI開發和應用體驗。
摩爾線日表示,作為國產全功能GPU創新企業,摩爾線程快速實現對DeepSeek蒸餾模型推理服務的高效部署,旨在賦能更多開發者基于摩爾線程全功能GPU進行AI應用創新。
各家算力主要面向推理
可以看出,無論華為昇騰、天數智芯還是摩爾線程,均針對DeepSeek推理服務進行適配。
隨著DeepSeek帶來大模型訪問量的暴增,推理芯片或將爆發。浙商證券認為,DeepSeek訓練和推理成本大幅降低將帶來大模型和用戶側準入門檻的同步降低,不僅帶來同等預算下模型側的迭代加速,“低成本+高性能”的模型也會加速推動企業和個人用戶對AI Agent、AI應用等的使用,從而推動AI商業化落地進程的顯著提速,在此背景下,推理環節的算力需求將得到激發。
而算力廠商壁仞科技、云服務廠商優刻得也強調推理效率的重要性。壁仞科技認為,推理效率已成為目前行業各公司發展的核心競爭力。憑借壁仞科技自主研發的壁礪TM系列產品出色的兼容性能,僅用數小時即完成對DeepSeek R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級參數版本,包括LLaMA蒸餾模型和千問蒸餾模型。為開發者提供高性能、低成本的大模型部署與開發解決方案。
關于國產算力芯片適配DeepSeek的重要性,天數智芯副總裁宋煜表示:“目前,大模型生態上,訓練部分主要依賴CUDA+NVIDIA GPU,國產GPU的適配仍需突破。與DeepSeek合作,能加速國產GPU芯片的深度學習框架優化、算子優化、分布式訓練適配,降低國產AI企業的遷移成本,打造‘國產算力+國產大模型’的閉環生態。”
宋煜認為:“DeepSeek等國產大模型廠商的成功,離不開強大的算力支持。我們的目標是提供穩定、可擴展、性價比高的GPU解決方案,推動國產大模型更快迭代、更高效部署。未來,我們可以進一步深化合作,包括聯合優化AI訓練框架、開發定制化AI加速方案,更高效的分布式推理引擎等。”