中證網(wǎng)
中證網(wǎng)
返回首頁

DeepSeek吹響“集結(jié)號” 國產(chǎn)AI生態(tài)伙伴火速適配

阮潤生 證券時報

  國產(chǎn)開源大模型DeepSeek憑借出色性價比,成為全球增速最快的AI應(yīng)用,引發(fā)全球科技圈熱切討論和算力信仰震蕩,也進一步增強對構(gòu)建開放型人工智能生態(tài)的信心。目前,不僅英偉達、AMD、英特爾等國際芯片巨頭宣布集成DeepSeek模型、提供算力支持等,國產(chǎn)GPU廠商、云計算廠商和應(yīng)用廠商等AI產(chǎn)業(yè)鏈伙伴也火速支持調(diào)用DeepSeek,升級各自產(chǎn)品和技術(shù)。

  引發(fā)算力巨震

  作為幻方量化旗下的AI公司深度求索研發(fā)的國產(chǎn)開源大模型,DeepSeek近期連續(xù)發(fā)布的DeepSeek V3、DeepSeek-R1等AI模型展示了驚艷效果和低廉的訓(xùn)練成本。移動應(yīng)用分析機構(gòu)SensorTower的數(shù)據(jù)顯示,其應(yīng)用軟件在18天內(nèi)的下載量達到1600萬次,截至2025年2月4日,DeepSeek日活用戶數(shù)超越了2000萬,成為全球增速最快的AI應(yīng)用。

  人工智能業(yè)內(nèi)人士向證券時報記者表示,DeepSeek證明了不用堆疊算力也可以搞好大模型。

  綜合來看,DeepSeek提供了一種高效的模型蒸餾技術(shù),能夠?qū)⒋笠?guī)模模型的能力遷移至更小、更高效的版本,并且通過Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù),顯著降低顯存占用,優(yōu)化模型性能。

  TrendForce集邦咨詢研究指出,DeepSeek采用蒸餾模型(Model Distillation)技術(shù),壓縮大型模型以提升推理速度并降低硬件需求,同時充分發(fā)揮英偉達Hopper降規(guī)版芯片的效益,最大化運算資源利用。其成本優(yōu)勢來自高效能硬件選擇、新型蒸餾技術(shù)及API開源策略,不僅優(yōu)化技術(shù)與商業(yè)應(yīng)用的平衡,也展現(xiàn)AI產(chǎn)業(yè)向高效發(fā)展的趨勢。

  DeepSeek成為現(xiàn)象級AI應(yīng)用,也引發(fā)了對算力信仰的質(zhì)疑。全球算力巨頭英偉達股價1月27日一度下跌近17%,之后逐步企穩(wěn);A股光通信模塊龍頭中際旭創(chuàng)1月27日下跌約10%,2月5日進一步放量下跌,工業(yè)富聯(lián)下跌6.76%,寒武紀(jì)-U下跌12.46%。

  對此,英偉達此前發(fā)表聲明,表示DeepSeek所取得的進展顯示出其芯片在中國市場的實用價值,且未來為滿足DeepSeek的服務(wù),還將需要更多英偉達芯片。

  TrendForce集邦咨詢最新指出,DeepSeek模型雖降低AI訓(xùn)練成本,但AI模型的低成本化可望擴大應(yīng)用場景,進而增加全球數(shù)據(jù)中心建設(shè)量。光收發(fā)模塊作為數(shù)據(jù)中心互連的關(guān)鍵組件,將受惠于高速數(shù)據(jù)傳輸?shù)男枨?,預(yù)測2023年400Gbps以上的光收發(fā)模塊全球出貨量為640萬個,2024年約2040萬個,預(yù)估至2025年將超過3190萬個,年增長率達56.5%。

  AI芯片積極適配

  對DeepSeek的認(rèn)可不僅體現(xiàn)在排行榜和用戶下載量上,也反映在國際AI芯片巨頭的兼容和本土廠商的積極適配。

  1月31日,英偉達發(fā)布搭載DeepSeek-R1 671b的“英偉達NIM微服務(wù)”預(yù)覽版,顯著提升AI模型的運行效率,簡化企業(yè)部署流程,降低AI落地的技術(shù)門檻。

  另外,AMD已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上;英特爾也表示其開發(fā)的AI芯片/GPU芯片可以支持DeepSeek,有意與中國芯片合作打破英偉達打造的生態(tài)壟斷。

  據(jù)業(yè)內(nèi)分析,DeepSeek使用了英偉達的PTX(Parallel Thread Execution)語言,實現(xiàn)在接近匯編語言的層級運行,通過允許進行細粒度的優(yōu)化,能夠?qū)PU硬件進行更底層、更精準(zhǔn)的控制。

  前述業(yè)內(nèi)人士向記者表示,能夠使用PTX證明DeepSeek有能力做到更底層的技術(shù),本質(zhì)上對國產(chǎn)GPU也是好事。有分析指出,通過精通運用PTX語言,有望幫助國產(chǎn)GPU進行針對性算子優(yōu)化,提升模型在國產(chǎn)GPU上的運行效率。

  除了國際巨頭,海光信息作為國產(chǎn)AI芯片企業(yè),2月4日晚宣布成功完成DeepSeekV3和R1模型與海光AI加速卡DCU的適配并正式上線,有望推動AI技術(shù)在更多行業(yè)的落地與普及。2月5日,該公司股價上漲11.19%。

  另外,潞晨科技攜手華為昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek-R1系列推理API及云鏡像服務(wù),實現(xiàn)了昇騰算力與DeepSeek-R1系列模型的推理適配優(yōu)化,性能表現(xiàn)與使用高端GPU持平。另外,DeepSeek系列模型正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署。

  國產(chǎn)GPU廠商沐曦宣布與DeepSeek的合作,摩爾線程宣布部署DeepSeek蒸餾模型推理服務(wù),提升了DeepSeek模型的計算效率和資源利用率;天數(shù)智芯宣布適配DeepSeek-R1千問蒸餾模型,提供更高效、更穩(wěn)定的推理服務(wù),滿足了不同規(guī)模和需求的應(yīng)用場景。

  2月5日,壁仞科技宣布自主研發(fā)的壁礪TM系列產(chǎn)品完成對DeepSeek-R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級參數(shù)版本,包括LLaMA蒸餾模型和千問蒸餾模型,為開發(fā)者提供高性能、低成本的大模型部署與開發(fā)解決方案。

  云廠商及應(yīng)用端接入

  除了AI硬件端廠商,不少云計算巨頭也紛紛入圍DeepSeek“朋友圈”,華為云、騰訊云、阿里云、百度云等已經(jīng)宣布支持部署DeepSeek模型。另外,聯(lián)通云宣布已基于星羅平臺實現(xiàn)國產(chǎn)及主流算力適配多規(guī)格DeepSeek-R1模型,兼顧私有化和公有化場景,提供全方位運行服務(wù)保障,為客戶帶來開箱即用的使用體驗;實現(xiàn)多產(chǎn)品場景調(diào)用,可在全國270多個骨干云池預(yù)部署,全面接入聯(lián)通云桌面、編程助手等多產(chǎn)品場景;提供全方位安全服務(wù)保障,實時提供抗DDoS等三大安全服務(wù)并具備元景安全大模型加持。

  除了云廠商,應(yīng)用端廠商也在積極探索和部署DeepSeek模型。

  2月4日,萬興科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入適配,旗下視頻創(chuàng)意、繪圖創(chuàng)意及文檔創(chuàng)意軟件業(yè)務(wù)產(chǎn)品,諸如萬興喵影、億圖圖示、億圖腦圖MindMaster、萬興PDF等均已融合DeepSeek-R1大模型相關(guān)能力,用戶可搶鮮體驗。接入DeepSeek-R1后,用戶使用產(chǎn)品的門檻降低,大模型應(yīng)用的成本也進一步降低。

  另外,北信源公眾號顯示,其自主研發(fā)的“密信AI能力平臺”第一時間完成了與DeepSeek的技術(shù)對接,這一舉措將為信源密信和第三方應(yīng)用提供DeepSeek大模型AI能力;奇安信宣布已完成與DeepSeek全面深度接入,自研的QAX—GPT安全大模型通過DeepSeek-R1優(yōu)化和蒸餾后,運營成本大幅降低,在威脅研判等多場景下的性能顯著提升,安全專業(yè)問答整體性能分?jǐn)?shù)提升約16%。

  當(dāng)虹科技官微顯示,公司BlackEye多模態(tài)視聽大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成視聽傳媒、工業(yè)與衛(wèi)星、車載智能座艙等多行業(yè)垂類場景的數(shù)據(jù)調(diào)優(yōu)訓(xùn)練,可為視聽傳媒、工業(yè)與衛(wèi)星、車載智能座艙等行業(yè)客戶提供更低成本的大模型部署及全新的大模型體驗。

  易點天下宣布,旗下KreadoAI、數(shù)眼智能、zMaticooADX等多款核心產(chǎn)品將融合DeepSeek-R1大模型相關(guān)能力,提升用戶智能營銷體驗。

  就“公司AI產(chǎn)品有沒有與DeepSeek模型合作或使用”等問題,盛天網(wǎng)絡(luò)2月5日在互動平臺回復(fù),公司目前已有相關(guān)合作,正在進行對接使用DeepSeek模型。公司通過在線API接口以及對開源模型進行私有化部署的方式開展工作,目前已部署完成進入測試階段。公司預(yù)計DeepSeek模型后續(xù)可應(yīng)用于公司社交產(chǎn)品帶帶和給麥,以探索更優(yōu)質(zhì)的產(chǎn)品與服務(wù),并進一步提高公司各項業(yè)務(wù)生產(chǎn)力,結(jié)合公司彈性算力池有效降低算力成本。目前公司一款底層對接DeepSeek的社交小游戲已完成了一輪內(nèi)部測試。

  據(jù)中文在線消息,基于DeepSeek V3與R1提出的技術(shù)路線,中文在線正著力研發(fā)并訓(xùn)練升級版“中文逍遙”,以進一步提升該大模型的創(chuàng)作能力。

  2月5日,閱文集團宣布旗下作家輔助創(chuàng)作產(chǎn)品——作家助手已集成獨立部署的DeepSeek-R1大模型。閱文邀請全行業(yè)網(wǎng)文作家參與,用戶下載作家助手至最新版本即可試用并參與內(nèi)測。

  此外,2月5日,華為終端BG首席執(zhí)行官何剛在微博發(fā)文透露,華為小藝助手已接入DeepSeek,小藝App的智能體廣場已上線DeepSeek-R1的Beta版,升級至原生鴻蒙系統(tǒng)可以體驗。

中證網(wǎng)聲明:凡本網(wǎng)注明“來源:中國證券報·中證網(wǎng)”的所有作品,版權(quán)均屬于中國證券報、中證網(wǎng)。中國證券報·中證網(wǎng)與作品作者聯(lián)合聲明,任何組織未經(jīng)中國證券報、中證網(wǎng)以及作者書面授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。