狂飙电视剧40集在线观看免费下载,成人9x9x在线观看网站,91精品乱码久久久久蜜桃,泰坦尼克号未删减完整版在线观看国语,李安色戒完整版,亚洲伦乱,九色蝌蚪国产

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

“買顯存送核心”,AI芯片競賽進入“內存為王”!智能體大時代,中國AI芯片有何機會?

2026-03-05 00:42:42

2025年下半年以來存儲芯片持續(xù)漲價,進入2026年漲幅更驚人,AI芯片進入“內存為王”時代。大模型發(fā)展使訓練和推理對顯存需求大增,內存重要性超GPU核心。在此背景下,中國AI芯片廠商在工程化領域或凸顯優(yōu)勢。

每經記者|朱成祥    每經編輯|杜宇    

曾經,云服務廠商買AI芯片,關注GPU(圖形處理器)算力大小,而如今,可能更多的是看重顯存大小,比如是40GB還是80GB。

甚至有人調侃“買顯存送核心”,即買一張GPU算力卡,更看重的是顯存帶寬和容量,而不是GPU算力大小。

如今,內存芯片一兩個月價格翻倍的大漲潮,正是對AI芯片進入“內存為王”的集中體現。

AI云基礎設施廠商PPIO相關專家告訴每經記者:“HBM(高帶寬內存)及CoWoS(基板上晶圓、芯片)封裝產生的成本已經超過純GPU芯片,HBM成本已經‘碾壓’核心,‘買顯存送核心’已成為現實?!?/p>

某GPU芯片企業(yè)技術負責人李明(化名)對每經記者表示:“結合我們硬件設計與供應鏈經驗,CoWoS封裝GPU中,當前HBM顯存成本已接近甚至超過GPU核心,是整卡成本最高的單一組件?!?/p>

懂芯創(chuàng)始人張慧娟告訴每經記者:“AI芯片的競爭已從單純的算力競賽,轉向了內存帶寬和內存容量的雙重競賽。HBM通過先進封裝技術與GPU裸片集成在同一封裝內,實現了計算與存儲的緊耦合,極大地緩解了內存難題,越來越成為業(yè)界追捧的主要方向?!?/p>

圖片來源:每經媒資庫

智能體大時代:內存需求強勁

2025年下半年以來,存儲芯片持續(xù)漲價成了半導體行業(yè)最熱門的話題。進入2026年,存儲芯片仍保持上漲趨勢,且漲幅驚人。

而這背后,是AI芯片已進入“內存為王”的時代。

2023年,ChatGPT石破天驚,人類社會進入大模型時代。進入2026年,大模型已然從思考轉向應用,智能體、Skill以及“養(yǎng)蝦”成了熱門話題。

人工智能的發(fā)展,也對AI芯片有了新的要求。隨著大模型參數的增加,訓練和推理對顯存(內存的一種)的需求也與日俱增。

張慧娟表示:“我們已經見證了模型參數量的指數級增長,從GPT-3的1750億到萬億級MoE(混合專家模型),直接推動了HBM需求的爆發(fā)。這也逐步造成,制約算力的瓶頸往往不是芯片算力本身,而是數據從內存?zhèn)鬏數接嬎愫诵牡乃俣龋驗閰当仨毐患虞d到計算單元附近的高速存儲介質中,計算單元才能以極低的延遲調用它們進行運算。”

李明認為:“大模型的參數量與內存需求之間存在著直接的正向關系。在2026年的技術背景下,雖然模型架構(如MoE混合專家模型)和量化技術(Quantization)在不斷優(yōu)化,但‘參數量越大,內存需求越高’依然是AI領域的基本物理定律。除了模型權重需要的靜態(tài)顯存占用以外,大模型運行時需要的KV Cache和激活值等都會額外占用顯存。在訓練任務中,還需要額外顯存來保存梯度和優(yōu)化器狀態(tài)等信息。”

但大模型對內存的強勁“渴望”,不僅僅局限于參數的增長。

智能體的快速發(fā)展,令AI推理對AI芯片的需求大增。業(yè)界普遍認為,未來AI推理對AI芯片的需求將大幅超越AI訓練。

PPIO專家表示:“大模型推理場景中,GPU內存主要用于兩個方面,一是保存大模型的權重,另一個是推理過程中用于存儲中間狀態(tài),也就是KV Cache緩存。前者由大模型參數量決定,后者取決于會話的上下文長度。大模型發(fā)展至今,參數量已經趨于穩(wěn)定,不會大幅增加。而會話的上下文長度還在持續(xù)增加,特別是Agent(智能體)場景下,1百萬Token的上下文長度已成為主流。這樣進一步增加對內存的開銷,長上下文成為內存需求的主要因素?!?/p>

參數、長上下文,這兩大因素的作用下,內存的重要性已然超越GPU計算核心。

成本結構:內存>算力

不僅僅客戶需求側更加看重內存。在成本結構中,內存的成本也大幅高于純粹的GPU核心。

PPIO專家稱:“一張GPU的成本構成主要分成三部分,一是HBM內存,容量越大成本越高;二是GPU核心(邏輯計算芯片);三是先進封裝工藝(CoWoS)。高端GPU,由于HBM內存容量更大,其HBM的成本更高,以B200(英偉達GPU)為例,其總生產成本的構成中,HBM內存占比約45%,CoWoS封裝及良率損失占比約34%,GPU核心芯片占比只有14%左右。”

即英偉達B200的成本結構中,45%源自向SK海力士、三星、美光等廠商購買HBM,14%源自臺積電代工的GPU裸芯,34%源自臺積電代工的CoWoS封裝及良率損失。

而HBM由多層DRAM(動態(tài)隨機存取存儲器)堆疊而成。HBM需求大增,意味著SK海力士這類廠商將越來越多的DRAM產能用于制造HBM,相應用于消費級的DRAM產能便少了。

PPIO專家表示:“三大存儲巨頭(三星、SK海力士、美光)已經將70%的產能轉移到HBM上,用于消費電子的GDDR產能反而會下降。因此我們首先看到消費領域的GeForce GPU的價格普遍上漲,大內存GPU減產甚至停產,這是由于GDDR內存減產以優(yōu)先保障HBM內存導致的?!?/p>

那么,若未來存儲行業(yè)產能提升,消費電子領域存儲價格是否也將率先受到沖擊?

張慧娟認為:“消費電子往往是最先感知到波動的領域。特別是對于存儲來說,比如手機、PC(個人電腦)用的LPDDR(低功耗內存)、SSD(固態(tài)硬盤)等接近于標準品,價格彈性大。一旦上游晶圓產能提升,最先反映在現貨價上的是這些產品?!?/p>

李明認為:“未來存儲產能提升后,最先受到影響的是消費電子用存儲。消費級存儲認證周期短、需求彈性大、替換靈活,新產能可快速導入消費端,價格波動也最為明顯。而數據中心用存儲認證流程通常需要6—18個月,新產能導入速度較慢,且存儲廠商會優(yōu)先保障數據中心的產能供給,因此它受產能提升的影響最晚、幅度最小??傮w而言,產能提升的影響會先平抑消費端價格,再逐步傳導至企業(yè)級市場?!?/p>

簡而言之,存儲產能提升后,將率先平抑消費端存儲芯片價格。

HBM需求強勁,產能嚴重不足

值得一提的是,三星、SK海力士未來將有兩座晶圓廠陸續(xù)投產,這將緩解內存“缺貨漲價”嗎?若P4L(三星電子)和M15x(SK海力士)提前投入運營,是否將對存儲芯片價格帶來沖擊?

張慧娟認為:“P4L和M15x新增產能,很大程度上是為HBM和高性能DDR5(第五代計算機內存規(guī)格)準備的,而不是傳統(tǒng)的DDR4(第四代計算機內存規(guī)格)或NAND(閃存)。這些屬于高端產能。”

其補充表示:“對HBM的價格沖擊可能不大,甚至不會降價。因為AI芯片開發(fā)周期長,且市場處于供不應求的局面。新增產能是為了填平供需缺口,有望抑制價格進一步大漲,但難以帶來大幅降價。對普通DRAM而言,假設HBM需求不及預期,或者廠商將部分產線切換回通用DRAM,那么會對消費電子內存價格帶來壓力。但目前看,晶圓廠更傾向于優(yōu)先保證高利潤的HBM生產。”

李明對每經記者表示:“從存儲芯片供應鏈與GPU硬件配套的角度分析,三星P4L與SK海力士M15x即便提前投產,短期內對存儲芯片價格的沖擊也較為有限。核心原因在于,這兩座工廠的新產能主要聚焦于HBM、先進制程DDR等高端存儲產品,并未直接擴產消費級存儲。”

李明補充表示:“當前AI需求呈爆發(fā)式增長,高端存儲仍處于供需緊張狀態(tài),因此短期價格將維持高位。中長期來看,隨著產能逐步釋放,高端存儲的供給壓力會有所緩解,但新產能將優(yōu)先配套AI與數據中心需求,普通消費級存儲不會出現大幅降價,整體呈現結構性緩和態(tài)勢。此外,各大廠商的存儲優(yōu)化技術,也能進一步平衡供需,避免全品類存儲價格出現大幅波動?!?/p>

PPIO認為:“HBM的產能嚴重不足以及AI數據中心對GPU的旺盛需求是造成HBM內存成本遠高于GPU核心的主要因素。市場的供需不平衡會促使更多內存廠商擴大生產,尤其是增加HBM的生產和供給,不過短期很難改變供需失衡的現狀,未來HBM內存價格還將繼續(xù)上漲,但趨勢會放緩?!?/p>

在AI算力相對不稀缺而HBM短缺的背景下,中國AI芯片廠商有何機會?

據記者了解,國內AI芯片廠商除了自身產品和技術解決方案,還在基礎軟件層面聯(lián)合各大人工智能基礎設施公司、大模型廠商和互聯(lián)網等生態(tài)伙伴一同研究例如低精度量化、專家預測加載等工程優(yōu)化技術,來系統(tǒng)性地降低實際大模型部署和應用過程中對內存的需求。

即在工程化領域,中國工程師紅利或將凸顯。


封面圖片來源:每經媒資庫

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

5

0