2025 年以來(lái),生成式 AI 的風(fēng)潮已經(jīng)從卷技術(shù),逐漸走向卷應(yīng)用、但大半年過(guò)去了,各行業(yè)雖然有不少應(yīng)用場(chǎng)景出現(xiàn),但距離企業(yè)級(jí) AI 應(yīng)用的 "iPhone 時(shí)刻 " 似乎又離的很遠(yuǎn)。
究其原因,一方面是企業(yè)內(nèi)部訓(xùn)練、微調(diào)大模型的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)不夠;另一方面,在算力利用率、異構(gòu)多元算力融合方面,行業(yè)仍有一段路要走。
智算行業(yè)興起
自從 ChatGPT 問(wèn)世之后,生成式 AI 成為了全球科技圈熱議的焦點(diǎn),而作為生成式 AI 底層支撐的智能算力,也迎來(lái)了快速增長(zhǎng)的時(shí)代。據(jù)工信部數(shù)據(jù)顯示,截至 2025 年一季度,中國(guó)智算規(guī)模已達(dá)到 748EFlops,占整體算力規(guī)模的 35%,智算已經(jīng)成為算力增長(zhǎng)的核心驅(qū)動(dòng)力。
無(wú)獨(dú)有偶,IDC 也十分看好中國(guó)智算產(chǎn)業(yè)發(fā)展,IDC 數(shù)據(jù)顯示,2025 年,中國(guó)智能算力規(guī)模將達(dá)到 1037.3EFLOPS,預(yù)計(jì) 2028 年將達(dá)到 2781.9EFLOPS;中國(guó)通用算力規(guī)模將達(dá)到 85.8EFLOPS,預(yù)計(jì) 2028 年將達(dá)到 140.1EFLOPS,對(duì)此,IDC 中國(guó)副總裁周震剛曾告訴筆者,從增加趨勢(shì)上分析,2023-2028 年,中國(guó)智能算力五年年復(fù)合增長(zhǎng)率預(yù)計(jì)將達(dá)到 46.2%,通用算力預(yù)計(jì)將達(dá)到 18.8%,預(yù)計(jì)到 2028 年,中國(guó)智能算力規(guī)模將達(dá)到 2781.9EFLOPS,是 2024 年的近四倍。
從數(shù)據(jù)上不難看出,目前,用戶對(duì)于算力的需求,絕大部分的增量將產(chǎn)生在智能算力方面。
從服務(wù)器出貨量角度,也可以看出目前智算已經(jīng)成為算力產(chǎn)業(yè)發(fā)展的主流趨勢(shì)。據(jù) IDC 數(shù)據(jù)顯示,2024 年全球人工智能服務(wù)器市場(chǎng)規(guī)模為 1251 億美元,2025 年將增至 1587 億美元,2028 年有望達(dá)到 2227 億美元,其中生成式人工智能服務(wù)器占比將從 2025 年的 29.6% 提升至 2028 年的 37.7%。
而龐大的需求主要來(lái)自生成式 AI 技術(shù)和應(yīng)用的爆發(fā),僅 2024 上半年,中國(guó) GenAI IaaS 市場(chǎng)同比增長(zhǎng) 203.6%,市場(chǎng)規(guī)模達(dá) 52 億元人民幣,占比整體智算服務(wù)市場(chǎng) 35.6%。
當(dāng)生成式 AI 的技術(shù)逐漸成熟,業(yè)內(nèi)也在逐漸從 " 卷 " 模型技術(shù),向著 " 卷 "AI 應(yīng)用的方向出發(fā)。在此趨勢(shì)下,大模型技術(shù)的演進(jìn)也隨之從預(yù)訓(xùn)練側(cè),向著推理側(cè)、后訓(xùn)練側(cè)發(fā)展。對(duì)此,聯(lián)想中國(guó)基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略管理總監(jiān)黃山表示,行業(yè)的算力需求從預(yù)訓(xùn)練主導(dǎo)轉(zhuǎn)向了后訓(xùn)練和推理主導(dǎo)。
此外,在應(yīng)用層面,AI 已經(jīng)開(kāi)始對(duì)企業(yè)流程進(jìn)行智能化改造,尤其是在 DeepSeek 問(wèn)世之后,諸如醫(yī)療、生物科學(xué)、交通等領(lǐng)域的垂類應(yīng)用不斷涌現(xiàn),在應(yīng)用側(cè)對(duì)于后訓(xùn)練、推理的要求會(huì)更高," 對(duì)于算力產(chǎn)業(yè)而言,從應(yīng)用層到算力層都發(fā)生了很大的變化," 黃山進(jìn)一步指出," 在變化的過(guò)程中,應(yīng)用層、模型層、算力層軟件之間的相互影響很大。"
這種相互作用的影響也推動(dòng)了智算產(chǎn)業(yè)的變革,一方面,智算在自己的 " 賽道 " 內(nèi)不斷向前發(fā)展;另一方面,智算的發(fā)展并非孤立存在,智算與超算、通算之間實(shí)現(xiàn) " 超智融合 " 也成為當(dāng)前算力產(chǎn)業(yè)發(fā)展的關(guān)鍵。
超智融合是關(guān)鍵
從宏觀維度看,超智融合不僅能夠充分發(fā)揮各類算力的優(yōu)勢(shì),實(shí)現(xiàn)資源的高效利用,更能為解決復(fù)雜的科學(xué)問(wèn)題、推動(dòng)產(chǎn)業(yè)升級(jí)提供強(qiáng)大支撐。
超算與智算、傳統(tǒng)數(shù)據(jù)中心之間最大的差別是應(yīng)用場(chǎng)景不同。超算主要應(yīng)用于大規(guī)模科學(xué)計(jì)算、工程仿真、氣象預(yù)報(bào)、生物信息等領(lǐng)域,這些應(yīng)用需要處理海量數(shù)據(jù)和高復(fù)雜度計(jì)算,對(duì)計(jì)算性能要求極高。
智算則主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、圖像處理、語(yǔ)音識(shí)別等領(lǐng)域,這些應(yīng)用需要快速迭代和優(yōu)化模型,對(duì)計(jì)算效率要求較高。而相較于超算、智算而言,傳統(tǒng)數(shù)據(jù)中心的應(yīng)用則更加廣泛,包括云計(jì)算、大數(shù)據(jù)分析、企業(yè)級(jí)應(yīng)用等。
而超算、智算、通算的融合,也成為了整個(gè)算力產(chǎn)業(yè)接下來(lái)很長(zhǎng)一段時(shí)間發(fā)展的重點(diǎn)方向。具體來(lái)看,在算力方面,超智融合可以提升算力效率,降低能耗成本。通過(guò)實(shí)現(xiàn)超智融合,可根據(jù)具體任務(wù)需求靈活調(diào)度算力資源,避免資源浪費(fèi)。例如,在氣象預(yù)測(cè)中,超算提供高性能計(jì)算支持復(fù)雜模型的模擬,智算進(jìn)行數(shù)據(jù)分析和結(jié)果優(yōu)化,通算處理日常業(yè)務(wù)數(shù)據(jù),三者協(xié)同提升效率。
在應(yīng)用方面,超智融合可以推動(dòng)科學(xué)研究與產(chǎn)業(yè)創(chuàng)新,為解決復(fù)雜的科學(xué)問(wèn)題提供了強(qiáng)大工具。例如,國(guó)家超級(jí)計(jì)算無(wú)錫中心的超智融合算力平臺(tái)系統(tǒng),為新藥研發(fā)、企業(yè)級(jí)智能增強(qiáng)系統(tǒng)等提供全棧智能應(yīng)用計(jì)算解決方案。在產(chǎn)業(yè)領(lǐng)域,超智融合助力制造業(yè)智能化升級(jí)。三一重工通過(guò)整合通算、智算和超算資源,實(shí)現(xiàn)了生產(chǎn)流程的數(shù)字化和智能化,產(chǎn)能提升 123%,人員效率提升 98%,單位制造成本降低 29%。
對(duì)此,黃山也向筆者介紹了一些聯(lián)想在超智融合方面的經(jīng)驗(yàn)和案例,他表示,在聯(lián)想與北京大學(xué)的合作中,雙方共同建設(shè)了高性能計(jì)算平臺(tái),平臺(tái)以聯(lián)想開(kāi)發(fā)的模型為底座,采用聯(lián)想深騰 X8810 系統(tǒng),并配置聯(lián)想數(shù)據(jù)中心采用的英特爾至強(qiáng)鉑金處理器,為各學(xué)科領(lǐng)域提供大規(guī)模數(shù)據(jù)處理和大規(guī)??茖W(xué)計(jì)算的支持。
" 以生命科學(xué)研究場(chǎng)景為例,原先需要 15 分鐘才能完成的核磁共振影像結(jié)果,通過(guò)該平臺(tái)的加持,現(xiàn)在僅需 20 秒左右就能完成。" 黃山介紹道。
此外,在與吉利汽車的合作中,聯(lián)想和英特爾共同為吉利打造了一套 HPC 集群化解決方案。該方案通過(guò)聯(lián)想萬(wàn)全異構(gòu)智算平臺(tái) HPC 版和英特爾五代至強(qiáng)可擴(kuò)展處理器,對(duì) " 星睿智算 HPC 集群 " 進(jìn)行升級(jí),提升了研發(fā)效率,縮短了產(chǎn)品迭代周期。" 在多達(dá) 5000 個(gè) CPU 的仿真集群中,通過(guò)異構(gòu)算力平臺(tái),融合 HPC 與智算的能力," 黃山進(jìn)一步指出," 目前,該方案已經(jīng)落地了超過(guò) 19 種仿真應(yīng)用。"
異構(gòu)算力融合仍面臨挑戰(zhàn)
超算與智算的融合首先體現(xiàn)在硬件架構(gòu)的深度重構(gòu)。傳統(tǒng)超算以 CPU 為核心,側(cè)重雙精度浮點(diǎn)運(yùn)算(FP64),而智算依賴 GPU/TPU 等加速芯片,聚焦半精度(FP16)和整數(shù)運(yùn)算(INT8)。兩者的硬件架構(gòu)和計(jì)算范式存在本質(zhì)差異。這種架構(gòu)差異在 AI for Science 場(chǎng)景中形成瓶頸,比如,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)需要同時(shí)處理高精度分子模擬與數(shù)據(jù)驅(qū)動(dòng)的模型優(yōu)化。
除此之外,超算的 " 時(shí)間復(fù)雜度 " 與智算的 " 空間復(fù)雜度 " 難以兼容。融合需從芯片設(shè)計(jì)、存儲(chǔ)網(wǎng)絡(luò)到算法層面實(shí)現(xiàn)軟硬協(xié)同創(chuàng)新,例如通過(guò)動(dòng)態(tài)異構(gòu)資源池化技術(shù)解決算力調(diào)度問(wèn)題。所以超智融合目前來(lái)看仍是一個(gè)比較棘手的問(wèn)題。
對(duì)此,黃山指出,超算與智算的融合,目前還存在一些難點(diǎn),主要是因?yàn)閮煞N計(jì)算模式下,算力調(diào)度機(jī)制不同,融合調(diào)度機(jī)制將成為接下來(lái)實(shí)現(xiàn)超智融合過(guò)程中,最需要首先解決的問(wèn)題。
除此之外,黃山告訴筆者,算法也是實(shí)現(xiàn)超算與智算融合發(fā)展的一大掣肘," 因?yàn)槌闩c智算的算法也完全不同,在計(jì)算過(guò)程中,如何將雙方的計(jì)算結(jié)果結(jié)合在一起,進(jìn)而進(jìn)行融合計(jì)算,也是實(shí)現(xiàn)超智融合的難點(diǎn)之一。" 黃山強(qiáng)調(diào)道。
而面對(duì)超算、智算、通算融合難題,平臺(tái)化的解決方案似乎成為了當(dāng)前狀態(tài)下的最優(yōu)解。以聯(lián)想為例,其通過(guò) " 一橫五縱 " 戰(zhàn)略框架構(gòu)建了覆蓋通用、科學(xué)、AI 算力的異構(gòu)智算平臺(tái)——萬(wàn)全異構(gòu)智算平臺(tái)。黃山表示,萬(wàn)全異構(gòu)智算平臺(tái)是聯(lián)想 AI 方案的整體抓手,通過(guò)智算與 HPC 計(jì)算硬件方面多年的積累,再加上對(duì)于軟硬協(xié)同方面的行業(yè) Know-How,提高了算力的利用率,并優(yōu)化了軟硬件之間的適配度,向上支持模型應(yīng)用,向下融合異構(gòu)算力。
在軟件層面,聯(lián)想通過(guò)萬(wàn)全異構(gòu)智算平臺(tái) 3.0 實(shí)現(xiàn) HPC 與 AI 框架的無(wú)縫銜接。其 AI 編譯優(yōu)化器采用算子融合與路徑優(yōu)化技術(shù),降低訓(xùn)練與推理成本各 15% 以上;專家并行通信算法針對(duì) MoE 架構(gòu)通信瓶頸,通過(guò)計(jì)算通信協(xié)同優(yōu)化將推理時(shí)延降低三倍,網(wǎng)絡(luò)帶寬利用率達(dá) 90%。
在硬件層面,聯(lián)想通過(guò)萬(wàn)全異構(gòu)智算平臺(tái)持續(xù)拓展與國(guó)內(nèi)外知名合作伙伴的長(zhǎng)期合作。資料顯示,萬(wàn)全異構(gòu)智算平臺(tái) 3.0 已實(shí)現(xiàn)了對(duì)大多數(shù)國(guó)內(nèi)芯片實(shí)現(xiàn)了兼容,兼容后較傳統(tǒng) CPU 集群提速 15 倍。
在模型層面,萬(wàn)全異構(gòu)智算平臺(tái)已經(jīng)接入了包括 DeepSeek 在內(nèi)的,目前市面上主流的開(kāi)源大模型,并且可以針對(duì) MoE、LLM 等不同架構(gòu)的模型,提供想對(duì)應(yīng)的適配與優(yōu)化。正如黃山前文所述——萬(wàn)全異構(gòu)智算平臺(tái)已經(jīng)成為聯(lián)想集團(tuán)在企業(yè)級(jí) AI 落地方面的核心抓手。
而在異構(gòu)算力平臺(tái)及整合大模型能力平臺(tái)方面布局不僅是聯(lián)想獨(dú)有的布局,從市面上常見(jiàn)的軟硬件服務(wù)商的布局可以看出,平臺(tái)化的軟件產(chǎn)品的與硬件的結(jié)合,是當(dāng)下提升硬件易用性的最優(yōu)解,圍繞此,神州數(shù)碼推出了神州文學(xué)平臺(tái)、浪潮信息推出了 EPAI 平臺(tái)、青云科技推出了 AI 智算平臺(tái) .......
綜合來(lái)看,通過(guò)平臺(tái)化的產(chǎn)品和生態(tài)的構(gòu)建,推進(jìn)超算、智算,以及通算融合已經(jīng)是大勢(shì)所趨,而超算、智算、通算的融合不僅是技術(shù)路徑的選擇,更是 AI 時(shí)代的必經(jīng)之路。通過(guò)硬件異構(gòu)化、軟件協(xié)同化、網(wǎng)絡(luò)泛在化的技術(shù)突破,以及科研、工業(yè)、醫(yī)療等領(lǐng)域的深度應(yīng)用,超智融合正在重構(gòu)計(jì)算范式,推動(dòng)生產(chǎn)力躍升。
未來(lái),隨著內(nèi)生智能計(jì)算系統(tǒng)的成熟,超算與智算的界限將徹底模糊,形成 " 超級(jí)智能計(jì)算 " 新形態(tài),開(kāi)啟人類認(rèn)知與創(chuàng)新的新紀(jì)元。
來(lái)源:鈦媒體