4月1日,在2025賽迪論壇創(chuàng)新驅動分論壇上,哈爾濱工業(yè)大學商學院教授、香港中文大學(深圳)深圳數(shù)據(jù)經(jīng)濟研究院客座教授馬濤發(fā)表了《DeepSeek技術路線與創(chuàng)新淺析》的主題演講,深入探討DeepSeek的技術創(chuàng)新與能力,分析其在AI領域的最新進展及對產(chǎn)業(yè)的影響。
DeepSeek作為國內領先的人工智能模型,其技術創(chuàng)新得到了業(yè)內廣泛關注。根據(jù)DROP、FRAMES、LongBench v2等多項測評結果,DeepSeek-V3準確率和響應速度均優(yōu)于GPT-4o和Claude-3.5-Sonnet,這是國內大模型技術第一次在綜合能力上達到國際領先水平。
同時,DeepSeek在處理數(shù)學、工具使用、指令遵循等復雜邏輯推理任務時,表現(xiàn)出更強的理解能力和推理能力。這意味著,中國的技術仍在持續(xù)進化,能夠應對更多復雜的任務。
增強AI領域的國際話語權
DeepSeek目前已經(jīng)形成了多種類型的大型模型,包括通用模型(DeepSeek V3)、復雜推理模型(DeepSeek R1)等。特別是在復雜推理任務上,DeepSeek R1首次公開了深度思考模型的訓練過程。其在數(shù)學、代碼和推理任務上的表現(xiàn)可以與OpenAI的o1模型相媲美,這標志著我國在復雜推理模型的研發(fā)上取得了巨大進展。
馬濤表示,國內復雜推理模型進展迅速,迅速追趕國外TOP模型,但在綜合能力上仍有差距,尤其OpenAI發(fā)布的o1-preview,在復雜問題的求解能力上名列前茅,國內大模型在中文問題上的表現(xiàn)優(yōu)勢并不明顯。
馬濤指出,DeepSeek在模型架構和訓練方法上進行了多個創(chuàng)新。首先,通過優(yōu)化模型架構顯著降低大模型訓練和推理的成本。此外,DeepSeek還采用了混合精度訓練(FP8 Training),并引入了群體相關的策略優(yōu)化算法(GRPO),這使得大模型的訓練更加高效。
在計算平臺的優(yōu)化方面,DeepSeek實現(xiàn)了任務級分時調度共享AI算力,支持在上千個計算節(jié)點上穩(wěn)定運行,且日常算力占用率超過95%。通過這種方式,DeepSeek能夠根據(jù)資源需求和集群狀態(tài)進行動態(tài)管理,以確保計算平臺的高效利用。
開源策略是DeepSeek技術發(fā)展的一個重要支撐。通過開源,DeepSeek不僅加速了技術創(chuàng)新,還有效推動了AI技術標準的落地。2024年,DeepSeek R1的開源模型受到了全球開發(fā)者的廣泛關注,GitHub數(shù)據(jù)表明,DeepSeek R1的開源熱度居高不下,吸引了大量開發(fā)者的參與。
值得一提的是,DeepSeek通過開源的方式,不僅促進了AI生態(tài)的成熟化發(fā)展,還有效降低了研發(fā)門檻,推動了大模型的快速應用落地。許多海外AI芯片企業(yè)和云服務商(如亞馬遜云和微軟Azure)紛紛宣布支持DeepSeek R1模型,進一步增強了其在全球AI領域的話語權。
推動AI產(chǎn)業(yè)的多元化發(fā)展
DeepSeek的技術不僅影響了國內AI產(chǎn)業(yè)的發(fā)展,還在全球范圍內產(chǎn)生了深遠的影響。截至2025年2月,DeepSeek的全球累計下載量已經(jīng)接近4000萬次,位居全球各大AI模型前列。相比之下,ChatGPT的下載量為4100萬,而豆包的下載量約為570萬。更令人驚訝的是,DeepSeek在發(fā)布20天內就超越了包括ChatGPT和豆包在內的多個AI助手,成功登頂中美免費APP下載排行榜。
馬濤提到,隨著DeepSeek在各類平臺的廣泛應用,它已經(jīng)成為了一個公共品,為全球開發(fā)者提供了強大的技術支持。許多國內外企業(yè)紛紛接入并支持DeepSeek作為其AI技術的核心。通過大模型的應用,企業(yè)能夠提升自身產(chǎn)品的智能能力,推動技術創(chuàng)新。
隨著AI技術的快速發(fā)展,市場對于大模型的需求日益增長,特別是在企業(yè)數(shù)據(jù)隱私和安全的背景下,DeepSeek也在推動私有化部署的趨勢。超過35家大型企業(yè)和技術公司(如華為、百度)紛紛發(fā)布了DeepSeek的一體機產(chǎn)品,推動了大模型在醫(yī)療、金融、教育等多個行業(yè)的深度應用。
在全球范圍內,DeepSeek正在通過技術創(chuàng)新推動AI產(chǎn)業(yè)的多元化發(fā)展。盡管美國在基礎研究、芯片設計和頂尖人才數(shù)量上仍占據(jù)優(yōu)勢地位,但我國在部分領域,尤其是在大模型技術和應用方面,已經(jīng)實現(xiàn)了超越。
馬濤表示,DeepSeek的成功證明了我國在全球AI格局中逐漸占據(jù)了重要的位置。未來,我們應該持續(xù)推動技術創(chuàng)新,強化產(chǎn)業(yè)鏈的合作,以實現(xiàn)我國在全球AI領域的技術領先地位。盡管目前DeepSeek在大模型技術上取得了顯著進展,但實現(xiàn)AGI(通用人工智能)和ASI(超人工智能)的目標仍需要更多的技術創(chuàng)新。未來,隨著DeepSeek不斷推動開源生態(tài)和技術標準的制定,AI行業(yè)將迎來更多的創(chuàng)新突破。