隨著人工智能成為新質(zhì)生產(chǎn)力,AI 將加速相關(guān)基礎設施的迭代和性能需求,更強的算力和互聯(lián)能力成為剛需。AI 推動算力市場增長的同時,對算力提出更高利用率、更高性能的要求。算力發(fā)展面臨利用率低、算力效率不高以及算力高能耗三大挑戰(zhàn)。2025 年在市場需求、技術(shù)創(chuàng)新驅(qū)動下,算力市場規(guī)模有望快速增長,算力與網(wǎng)絡的融合協(xié)同加速,算力建設從建設走向調(diào)度,綠色算力也將迎來突破。
算力聯(lián)通堵點破解
AI 大模型的快速發(fā)展是算力市場增長的重要動力。2024 年,我國備案的大模型產(chǎn)品已超過 200 家,行業(yè)模型占比達 70%。盡管市場滲透率仍有提升空間,但智算服務市場年同比增速有望超過 80%,特別是與 AIGC 強相關(guān)的 GenAI IaaS、智算集成服務增速均超過 150%。
算力規(guī)模有望快速增長,高性能算力占比增加。未來三年,隨著數(shù)字經(jīng)濟戰(zhàn)略深入推進,大數(shù)據(jù)、人工智能等技術(shù)與行業(yè)深度融合,算力的支撐作用越發(fā)明顯,中國算力規(guī)模將呈現(xiàn)爆發(fā)式增長態(tài)勢。來自賽迪顧問的數(shù)據(jù)顯示,預計到 2026 年,中國算力規(guī)模將超過 360EFLOPS,三年的年復合增長率達到 20%,中國智算算力和超算算力占比之和將達到 40%。
從技術(shù)演進上看,大模型發(fā)展到了新的拐點。訓練算力和推理算力規(guī)模同步擴展,大模型需要更多實時多模態(tài)的數(shù)據(jù)和更大規(guī)模更高利用率的算力以及更高性能的光網(wǎng)絡支持。
推動算網(wǎng)融合,構(gòu)建高速數(shù)據(jù)網(wǎng) + 高速光網(wǎng),構(gòu)建大規(guī)模算力集群,為產(chǎn)業(yè)升級和數(shù)字經(jīng)濟提供堅實支撐。三大運營商以網(wǎng)強算的戰(zhàn)略布局正在逐步落地。
中國電信已在上海和北京部署了兩大算力集群,并啟動了十萬卡集群建設的研究。通過優(yōu)化機房布局、應用綠色節(jié)能技術(shù),以及中國電信正在構(gòu)建高效智能的算力基礎設施。中國聯(lián)通發(fā)布 " 算力智聯(lián)網(wǎng) AINet",建設智算互聯(lián)新底座。中國移動則加快了 "4+N+31+X" 數(shù)據(jù)中心布局,構(gòu)建了覆蓋全國的 AI 推理算力網(wǎng)絡,并在京津冀、長三角、粵港澳大灣區(qū)、成渝等區(qū)域投產(chǎn)了首批 13 個智算中心節(jié)點。
智算中心建設中,提升算力調(diào)度和增強互聯(lián)性能是智算集群規(guī)模擴展和性能提升的關(guān)鍵。隨著 GPU 卡間開放互聯(lián)協(xié)議 OISA 的提出,推動互聯(lián)協(xié)議、交換芯片等核心技術(shù)攻關(guān),滿足卡間互聯(lián)極致的帶寬和時延要求。全調(diào)度以太網(wǎng) GSE,突破無損以太性能瓶頸,網(wǎng)絡性能可比傳統(tǒng) RoCE 網(wǎng)絡提升 30% 以上,大幅提升 GPU 節(jié)點間通信效率。我國智算中心卡間互聯(lián)、機間互聯(lián)等堵點難點問題持續(xù)突破,推動智算中心從 " 建好 " 到 " 用好 "。
算力資源按需合理調(diào)度
目前,算力資源不均衡是我國算力發(fā)展中的一大難題,算力調(diào)度是算力資源效率最大化的路徑。多家分析機構(gòu)稱算力調(diào)度是未來算力網(wǎng)絡的重要拼圖,是算力時代的國家電網(wǎng)。據(jù)測算,2025 年算力調(diào)度潛在市場規(guī)模在 400 億元以上。
隨著算力基礎設施的不斷完善,算力調(diào)度成為算力一體化進程的關(guān)鍵環(huán)節(jié)。賽迪顧問資深分析師袁鈺在 2024 通信產(chǎn)業(yè)大會上表示,未來,中國算力一體化建設將從 " 建設 " 階段轉(zhuǎn)向 " 調(diào)度 " 階段。算力調(diào)度中心將以算力樞紐節(jié)點為原點,在全國范圍內(nèi)不斷鋪開,并作為支點形成算力網(wǎng),推動算力資源按需合理調(diào)度。
當前,國內(nèi)算力資源分布較為分散,不同地區(qū)、不同行業(yè)和不同企業(yè)之間的算力資源差距較大。這導致算力調(diào)度平臺在資源整合和調(diào)度方面面臨較大困難,難以實現(xiàn)資源的優(yōu)化配置和高效利用。
重建設輕運營、國產(chǎn)智算軟硬件生態(tài)體系不健全,以及算力服務模式單一等制約了算力調(diào)度平臺的發(fā)展。當前,國內(nèi)算力調(diào)度平臺的建設力度較大,但運營方面相對薄弱。許多平臺在建成后缺乏有效的運營和管理機制,導致平臺的使用率和效果不理想。
國產(chǎn)智算軟硬件生態(tài)體系的不健全是當前算力調(diào)度平臺面臨的另一個重要問題。由于國產(chǎn)智算軟硬件在性能、穩(wěn)定性和兼容性等方面存在不足,導致算力調(diào)度平臺在選用國產(chǎn)軟硬件時面臨較大困難。這限制了算力調(diào)度平臺在國產(chǎn)化和自主可控方面的發(fā)展。
算力服務模式較為單一。當前,算力調(diào)度平臺提供的算力服務模式較為單一,主要以算力租賃和算力市場為主。這導致用戶在選擇算力服務時缺乏靈活性和多樣性,難以滿足其多樣化的算力需求。
2025 年算力調(diào)度痛點有望逐步突破。目前業(yè)內(nèi)已完成了千億參數(shù)大模型的分布式訓練現(xiàn)網(wǎng)驗證,性能接近集中式訓練的 95%。這一成果為未來分布式 AI 計算奠定了技術(shù)基礎。同時,業(yè)內(nèi)首例現(xiàn)網(wǎng)智算長距無損互聯(lián)技術(shù)驗證的成功,為跨地域、跨層級、跨主體的算力協(xié)同調(diào)度提供了可能。
中國電信研究院網(wǎng)絡技術(shù)研究所副所長雷波在 2024 通信產(chǎn)業(yè)大會上表示,隨著 AI/ 大模型等新業(yè)務的出現(xiàn),云網(wǎng)融合邁入以 AIDC 為核心的云網(wǎng)融合 3.0 新階段。云網(wǎng)融合 3.0 強調(diào)分布式智算網(wǎng)絡的建設,通過優(yōu)化 IP 層和光傳輸層,實現(xiàn)跨區(qū)域、跨節(jié)點的無損智算能力,為 AI 應用的廣泛滲透提供了有力支撐。
綠色算力多方發(fā)力
生成式人工智能的迅猛發(fā)展推動數(shù)據(jù)中心向智算中心演進。然而,智算中心的高功耗和高散熱要求推高了其運營成本,綠色發(fā)展迫在眉睫。綠色算力成為解決算力增長和電力消耗矛盾的重要途徑。
綠色算力主要從使用端和供給端發(fā)力。在使用端,通過先進制冷技術(shù)降低能耗,利用人工智能技術(shù)優(yōu)化溫控供電模式 ; 在供給端,使用綠色電力實現(xiàn)節(jié)能降碳。通過這兩方面的努力,可以有效降低智算中心的運營成本,推動其可持續(xù)發(fā)展。
算電協(xié)同是解決算力增長和電力消耗矛盾的有效路徑。然而,算電協(xié)同面臨資源分配不均、技術(shù)兼容以及市場機制不完善等挑戰(zhàn)。在雙碳戰(zhàn)略與可持續(xù)發(fā)展觀的引導下,2025 年技術(shù)將進一步創(chuàng)新發(fā)展,企業(yè)積極探索源網(wǎng)荷儲等技術(shù)研發(fā)。同時,規(guī)劃、調(diào)度、市場和產(chǎn)業(yè)的協(xié)同加速,算力電力雙向協(xié)同機制初步形成,為綠色算力的發(fā)展提供了有力保障。
隨著 AI 技術(shù)的加速演進,算力領域正面臨前所未有的發(fā)展機遇和挑戰(zhàn)。通過算力、網(wǎng)絡與數(shù)據(jù)的一體化協(xié)同,算力調(diào)度的優(yōu)化升級,以及綠色算力的持續(xù)發(fā)展,2025 年一個更加高效、智能、綠色的算力生態(tài)即將加速。
圖表:曙念