DeepSeek上線以來,國產算力資源的采購意愿顯著提升。
3月24日,當算力資源的靈活調度成為新趨勢,國產算力芯片的全面普及還面臨哪些挑戰?
但不可否認的是,這場由技術驅動、政策支持、市場需求共同推動的算力革命,正在悄悄改變國產算力的命運,芯片廠商迎來了從技術適配邁向商業落地的關鍵階段。
星期一,在中國電信上海分公司的天翼云能力運營中心,不時有企業咨詢不同芯片算力卡的服務費用。
放下電話,解決方案中心經理宋蒙向自2022年起,從A100、H100到“降級版”A800、H800,美國限制高端AI芯片對華出口背后的底層邏輯是基于AI訓練“大力出奇跡”的認知,即認為更大的AI模型、更多算力資源就意味著更智能的AI。然而,這一認知似乎正在被新的算法范式打破。
今年1月,DeepSeek通過Transformer架構優化、混合精度訓練、計算并行優化以及分布式存儲管理等技術創新,大幅降低AI訓練和推理的計算需求。小而美且開源的DeepSeek,不僅讓全球反思“堆卡燒錢”的OpenAI路線是否走偏,也為國產算力芯片和云服務商打開通往AGI的另一扇窗。
在宋蒙看來,中國AI應用落地受限于兩大瓶頸。首先,英偉達構建的CUDA生態護城河,讓AI大模型向國產算力芯片的遷移變得困難;其次,在國產大模型百花齊放、國產芯片廠商不斷涌現的背景下,多對多的算法和算力適配更是困難重重。
“但DeepSeek很好地解決了第二個問題。”宋蒙告訴此外,三大運營商全面接入DeepSeek后,其GPU利用率及IDC上架率也有所提升。電信天翼云自主研發的“息壤”智算平臺,也在今年2月完成了國產算力芯片與DeepSeek-R1/V3系列大模型的深度適配優化。
談及DeepSeek帶來的業務變化,3月25日,中國電信董事長兼首席執行官柯瑞文在2024年度業績說明會上表示,息壤DeepSeek一體機推出后簽約額已達6億元,從內部資源使用來看,自有算力售賣率已超過90%,相比DeepSeek上線前翻倍。
此外,中國電信天翼云官網訪問量也在兩周內增加了5.7萬人次,為DeepSeek上線倍。與此同時,模型服務和token調用量都呈現出了指數級的增長。
火爆的需求背后是企業對部署方式的多樣化選擇。宋蒙告訴為了避免數據泄露,一些企業開始采取本地化部署。“他們會在自己的機房單獨購買GPU服務器,將開源大模型DeepSeek裝在服務器上,連到企業自己的內網就可以使用了。這種方式保證了數據安全,但最大的問題就是太貴了。”宋蒙坦言。
宋蒙告訴于是,為滿足數據安全、成本節約的需求,“公共算力服務平臺”應運而生。上海電信將其形象地稱為“算力超市”,企業可以通過產品訂購,享受到運營商級的機房環境、獨立的硬件資源以及專屬的DeepSeek模型。
螞蟻集團Ling團隊發表論文稱,實驗表明,MoE大模型可在國產芯片上訓練出與英偉達H800芯片相當的效果,且訓練成本降低20%。
中國正在經歷一場低調的算力革命,這無疑點燃了“去英偉達化”的希望。從華為910B撐起千億參數模型訓練,到DeepSeek帶動國產芯片廠商完成軟硬件協同適配,國產算力正試圖通過算法創新與硬件迭代實現彎道超車。
隨著國產芯片借勢崛起,未來,普惠型“算力超市”又該如何保證優質算力資源上架,降低硬件迭代的采購風險?3月24日,
實探智算中心:國產GPU測試基本完成
來到園區,一棟棟5層高的數據機樓正在加緊建設。走進臨港智算谷,現場物業部經理向“隨著DeepSeek的火爆出圈,我們針對本地化部署需求推出了標準化、模塊化、定制化的算力基礎服務。”臨港算力項目部項目經理時云松告訴目前,已有企業對建設中的數據機樓訂購了包樓服務。對此,項目部需要在園區建設上進行超前考量,結合客戶對機樓層高以及實際荷載要求,以“兩彈一優”的高標準提高供電、散熱、制冷、承重等基礎設施能力,從而實現快速響應和定制化的基礎服務。
行至數據機樓3層,時云松稱,臨港智算中心的國產萬卡算力池,使用的算力卡主要集中在華為910B,另有壁仞、沐曦等國產算力卡也已基本完成性能測試,目前應用于國產混訓項目中。
宋蒙補充道,目前,國產算力廠商不斷推出新型GPU芯片,如果能夠以更低的成本給客戶使用,公司也愿意引入此類產品,但需經過國產GPU創新聯合基地的測評,只有性能符合要求、價格為市場所接受的算力資源才會最終上架。
“長久運營好算力超市,要做好質量與服務兩件事。”在談及未來的長期規劃時,宋蒙認為,向客戶提供高質量的算力服務,不僅體現在擁有琳瑯滿目的算力產品,還要提供滿足客戶需求的使用服務,圍繞客戶的真實使用場景,推出模型調優、AI應用等進階服務。
宋蒙觀察發現,如今越來越多的客戶不僅需要算力和模型,更想要能直接上手的AI應用。中國電信正準備上架一系列AI應用,涉及專屬智能問答、AI企業法務、智能公文寫作等細分領域。