用戶名: 密碼: 驗(yàn)證碼:

服務(wù)器CPU,顛覆前夜?

摘要:AI 算力從 GPU 主導(dǎo)轉(zhuǎn)向 CPU+GPU 協(xié)同,英偉達(dá)發(fā)力 Arm 架構(gòu)服務(wù)器 CPU,全球服務(wù)器 CPU 供不應(yīng)求。x86 雙寡頭格局松動(dòng),ARM 份額快速提升,RISC-V 加速入局,行業(yè)進(jìn)入全系統(tǒng)競(jìng)爭(zhēng)階段。

  ICC訊   當(dāng)憑借驅(qū)動(dòng)AI的專用GPU賺得盆滿缽滿的英偉達(dá)宣布“看好CPU賽道的潛力?!碑?dāng)Vera Rubin平臺(tái)帶著36顆Vera CPU與72顆GPU的配置亮相,當(dāng)國(guó)際機(jī)構(gòu)集體預(yù)判CPU供需缺口將持續(xù)擴(kuò)大,一個(gè)明確的信號(hào)已然浮現(xiàn):AI算力的核心敘事邏輯,正在從“GPU單極主導(dǎo)”向“CPU+GPU協(xié)同共生”演進(jìn)。

  01 CPU的重要性,不亞于GPU

  黃仁勛對(duì)CPU的押注,絕非臨時(shí)起意,在過(guò)去很長(zhǎng)一段時(shí)間中,英偉達(dá)都對(duì)PC市場(chǎng)充滿渴望。

  早在2011 年的CES上,英偉達(dá)正式公布Project Denver(丹佛計(jì)劃),宣布基于 ARM 架構(gòu)開(kāi)發(fā)定制CPU 核心。之后在2014年與2018年,英偉達(dá)陸續(xù)發(fā)布移動(dòng)處理器Tegra K1、用于自動(dòng)駕駛與邊緣計(jì)算Carmel CPU 核心等。

  2021年4月英偉達(dá)發(fā)布基于Arm架構(gòu)的Grace CPU,標(biāo)志著這家GPU巨頭正式殺入服務(wù)器CPU戰(zhàn)場(chǎng)。Grace并非傳統(tǒng)意義上的通用處理器,而是專為AI、HPC(高性能計(jì)算)和大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的“加速型CPU”。

  近日,Meta宣布與英偉達(dá)公司達(dá)成新的采購(gòu)協(xié)議,將購(gòu)買數(shù)百萬(wàn)顆英偉達(dá)下一代Vera Rubin圖形處理器和同等數(shù)量的Grace中央處理器,以支持其人工智能發(fā)展戰(zhàn)略。據(jù)悉,Meta已經(jīng)是英偉達(dá)最大的客戶之一,多年來(lái)一直在使用英偉達(dá)的GPU,但這項(xiàng)新協(xié)議表明兩家公司將建立更深層次的合作伙伴關(guān)系。值得注意的是,Meta還承諾大量采購(gòu)英偉達(dá)的Grace CPU,并將其作為獨(dú)立芯片部署,而不是與GPU配合使用。

  英偉達(dá)表示,Meta將成為首家獨(dú)立部署Grace CPU的公司,從明年開(kāi)始,還將部署下一代Vera CPU。值得注意的是,Vera CPU是英偉達(dá)推出的新一代AI芯片,屬于其自研Arm架構(gòu)CPU系列,于2026年1月6日在CES 2026上官宣,并預(yù)計(jì)于2026年3月16日至19日在GTC 2026上正式發(fā)布,計(jì)劃于2026年下半年開(kāi)始向微軟等首批客戶交付。該芯片旨在為下一代大模型訓(xùn)練與推理提供支持 。

  在此前的拉斯維加斯消費(fèi)電子展上,黃仁勛還表示:"英偉達(dá)躋身全球頂級(jí)CPU制造商行列不會(huì)令人意外。"

  在AI算力被GPU刷屏的這幾年,市場(chǎng)很容易形成一個(gè)慣性認(rèn)知:AI = GPU。但走到2026年,一個(gè)被云廠商、大模型公司用真金白銀驗(yàn)證的結(jié)論正在成為共識(shí):CPU在數(shù)據(jù)中心的重要性,絲毫不亞于GPU。

  為什么過(guò)去幾年行業(yè)只追捧GPU,卻把CPU當(dāng)成 “配角”?核心原因很簡(jiǎn)單:AI還處在 “訓(xùn)練為王” 的階段。2023—2025年,行業(yè)重心是把大模型 “訓(xùn)出來(lái)”,比拼的是極致并行算力、矩陣乘法效率,GPU憑借架構(gòu)優(yōu)勢(shì),天然成為訓(xùn)練階段的絕對(duì)主角。此時(shí)CPU只承擔(dān)基礎(chǔ)調(diào)度、數(shù)據(jù)搬運(yùn)等輔助工作,自然不被輿論聚焦。

  但從2025下半年到2026年,AI產(chǎn)業(yè)完成了一次關(guān)鍵范式切換:從訓(xùn)練為主,轉(zhuǎn)向推理、執(zhí)行、規(guī)模化落地為主。Agent、RAG、工具調(diào)用、多模態(tài)交互、強(qiáng)化學(xué)習(xí)環(huán)境搭建…… 這些商用化場(chǎng)景,不再是單純的并行計(jì)算,而是大量邏輯判斷、串行執(zhí)行、系統(tǒng)調(diào)度、I/O 管控、內(nèi)存調(diào)度、任務(wù)分發(fā)。這些恰恰是GPU的短板、CPU的主場(chǎng)。

  行業(yè)數(shù)據(jù)已經(jīng)給出答案:在典型 Agent 工作流中,CPU處理延遲占比高達(dá)90%,成為端到端性能的頭號(hào)瓶頸。過(guò)去“堆 GPU 就能提效” 的邏輯徹底失效 ——CPU跟不上,GPU利用率就上不去;CPU規(guī)格不夠,集群就開(kāi)不滿。2026 年開(kāi)年Intel、AMD服務(wù)器CPU集體漲價(jià)、產(chǎn)能被搶空,正是這一趨勢(shì)的直接體現(xiàn)。

  目前英特爾和AMD的CPU普遍缺貨,服務(wù)器CPU交貨周期最長(zhǎng)可達(dá)6個(gè)月,消費(fèi)級(jí)CPU也面臨延遲和漲價(jià)。英偉達(dá)選在這個(gè)節(jié)點(diǎn)重兵投入服務(wù)器CPU,既是補(bǔ)全自身全棧算力版圖,也是直擊 x86 陣營(yíng)的供給軟肋。它的邏輯非常清晰:

  ● 不做通用CPU,而是為AI集群量身定制,和GPU、DPU、高速互聯(lián)深度協(xié)同;

  ● 解決行業(yè)最痛的問(wèn)題:CPU瓶頸導(dǎo)致GPU利用率上不去、集群跑不滿;

  ● 用一體化方案,對(duì)沖當(dāng)前x86 CPU缺貨、交付不穩(wěn)定的風(fēng)險(xiǎn)。

  這也意味著,數(shù)據(jù)中心算力競(jìng)爭(zhēng)正式從“單芯片比拼” 進(jìn)入 “全系統(tǒng)較量”。

  02 CPU缺貨了,格局也變了

  再看一下當(dāng)前服務(wù)器CPU市場(chǎng)的競(jìng)爭(zhēng)格局。

  過(guò)去二十年,服務(wù)器CPU市場(chǎng)幾乎被英特爾和AMD牢牢掌控。憑借成熟的x86指令集、龐大的軟件生態(tài)以及與操作系統(tǒng)、中間件的高度兼容性,x86架構(gòu)成為企業(yè)級(jí)市場(chǎng)的默認(rèn)選擇。尤其在通用計(jì)算、數(shù)據(jù)庫(kù)、虛擬化等場(chǎng)景中,x86 CPU的綜合優(yōu)勢(shì)無(wú)可替代。

  但這一雙寡頭格局正加速生變,英特爾長(zhǎng)期以來(lái)的主導(dǎo)地位持續(xù)承壓,AMD 則憑借技術(shù)突破實(shí)現(xiàn)份額穩(wěn)步攀升。

  上圖顯示,截至2025年,AMD在服務(wù)器市場(chǎng)的出貨份額已接近30%,而英特爾雖仍占據(jù)主導(dǎo)地位,但份額較高峰期有所回落。這一變化源于多重產(chǎn)業(yè)因素,而非單一技術(shù)優(yōu)劣。

  業(yè)內(nèi)人士向半導(dǎo)體產(chǎn)業(yè)縱橫表示:

  首先,客戶需求正在分化。

  超大規(guī)模云服務(wù)商對(duì)高核數(shù)、高能效、高I/O帶寬的需求快速上升。AMD自EPYC系列起采用Chiplet(小芯片)架構(gòu),結(jié)合臺(tái)積電先進(jìn)制程,在96核以上產(chǎn)品上實(shí)現(xiàn)較快落地,契合了部分云廠商對(duì)“每瓦性能”和橫向擴(kuò)展能力的偏好。但這并不意味著AMD毫無(wú)短板。該人士表示:“AMD的Chiplet小芯片架構(gòu),雖然能快速堆核心數(shù),但不同小芯片之間的通信延遲偏高,這是它一直以來(lái)的問(wèn)題?!睒I(yè)內(nèi)人士補(bǔ)充道,而英特爾的優(yōu)勢(shì)恰恰在這里——核電通信延遲低,再加上多年積累的軟件和硬件生態(tài),適配性更好,這也是它在當(dāng)前AI浪潮中能穩(wěn)住份額的關(guān)鍵。

  其次,價(jià)格策略,則成為AMD撬動(dòng)市場(chǎng)的另一把“鑰匙”。

  “整體來(lái)看,AMD的服務(wù)器CPU價(jià)格會(huì)比英特爾略低,尤其是在渠道市場(chǎng),AMD的策略更激進(jìn)?!睒I(yè)內(nèi)人士透露,AMD對(duì)老型號(hào)產(chǎn)品會(huì)給出大幅折扣,導(dǎo)致市場(chǎng)上充斥著高性價(jià)比的舊款A(yù)MD CPU,而英特爾則堅(jiān)持穩(wěn)健的價(jià)格控制,不輕易降價(jià)。這種價(jià)格差異,也讓不同客戶群體做出了不同選擇?;ヂ?lián)網(wǎng)大廠和主流服務(wù)器廠商,更看重技術(shù)迭代,會(huì)緊跟英特爾的新品節(jié)奏,優(yōu)先采購(gòu)最新款或上一代產(chǎn)品;而廣大中小客戶、渠道裝機(jī)市場(chǎng),更在意性價(jià)比,大量選用AMD的舊型號(hào)產(chǎn)品。除此之外,工控、IoT、邊緣端等細(xì)分領(lǐng)域,雖有部分客戶仍在使用老舊產(chǎn)品,但這部分市場(chǎng)對(duì)整體格局的影響相對(duì)有限。

  最后,供應(yīng)鏈策略差異也正在顯現(xiàn)。

  作為長(zhǎng)期占據(jù)行業(yè)龍頭的英特爾,曾憑借自主制造體系(IDM模式)穩(wěn)穩(wěn)握住技術(shù)主動(dòng)權(quán),但2021年前后,其制程工藝的迭代突然“慢了下來(lái)”。從而導(dǎo)致新品推出節(jié)奏明顯脫節(jié),比AMD慢了半拍甚至一拍,很多客戶等不及,就轉(zhuǎn)頭選擇了AMD的新品?!睒I(yè)內(nèi)人士解釋道。

  反觀AMD,走了一條與英特爾截然不同的路——放棄自主制造,全部交由臺(tái)積電代工。這一選擇恰好踩中了先進(jìn)制程的風(fēng)口,從7nm到如今的3nm,AMD緊跟臺(tái)積電的工藝節(jié)奏,產(chǎn)品性能和能效比一路提升。不過(guò)近幾年,英特爾 18A 制程工藝日趨成熟,正逐步削弱制程層面帶來(lái)的性能差距。

  對(duì)于市場(chǎng)普遍關(guān)注的“未來(lái)5-10年,AMD是否能拿下半數(shù)的數(shù)據(jù)中心x86 CPU市場(chǎng)”的疑問(wèn),業(yè)內(nèi)人士給出了明確答案:“大概率不會(huì)?!痹谒磥?lái),雙方的優(yōu)勢(shì)領(lǐng)域已經(jīng)形成互補(bǔ),且難以相互替代。

  “AMD的高核心數(shù)適合云計(jì)算、大數(shù)據(jù)這類規(guī)?;瘓?chǎng)景,而英特爾的低延遲和成熟生態(tài),在AI、金融科技等高端領(lǐng)域不可替代?!彼M(jìn)一步分析,如今英特爾的制程已經(jīng)基本回歸先進(jìn)水平,短板主要在產(chǎn)品設(shè)計(jì)上,目前也在不斷優(yōu)化產(chǎn)品理念,應(yīng)對(duì)AMD的競(jìng)爭(zhēng);而AMD則需要解決延遲問(wèn)題,同時(shí)補(bǔ)齊軟件生態(tài)的短板,才能進(jìn)一步提升份額。

  03 CPU市場(chǎng)的變量,不止英偉達(dá)

  除卻英偉達(dá),CPU底層架構(gòu)的博弈正悄然重塑服務(wù)器市場(chǎng)的長(zhǎng)期格局。

  此前x86架構(gòu)在全球服務(wù)器CPU市場(chǎng)占有率同樣高達(dá)90%,然而根據(jù)市場(chǎng)研究機(jī)構(gòu)Dell'Oro Group最新報(bào)告,2025年第二季度,ARM架構(gòu)處理器在服務(wù)器CPU市場(chǎng)份額已達(dá)到25%,相比去年同期的15% 大幅提升了10個(gè)百分點(diǎn)。 這一顯著增長(zhǎng)主要得益于英偉達(dá)基于ARM架構(gòu)的Grace平臺(tái)的大規(guī)模交付,以及大型科技企業(yè)定制芯片的加速部署。

  比如,亞馬遜網(wǎng)絡(luò)服務(wù)憑借其Graviton系列開(kāi)創(chuàng)了超大規(guī)模ARM服務(wù)器處理器,首次發(fā)布于2018年。該公司認(rèn)識(shí)到,在其數(shù)據(jù)中心運(yùn)行的大部分工作負(fù)載不需要x86處理器提供的最大單線程性能,但將從改進(jìn)的能效和成本效益中獲益巨大。到2024年,AWS表示其大約一半的新CPU部署使用Graviton處理器而不是x86芯片。

  谷歌隨后推出了其Axion處理器,于2024年宣布,聲稱與同類x86處理器相比功耗降低百分之六十,同時(shí)為典型云工作負(fù)載提供同等性能。

  究其原因,首先,傳統(tǒng)x86架構(gòu)在高負(fù)載下往往伴隨顯著的能源消耗,而ARM通過(guò)精簡(jiǎn)指令集與更高效的芯片設(shè)計(jì),在同等算力下大幅降低單位能耗,為云服務(wù)提供商節(jié)省了持續(xù)性的運(yùn)營(yíng)成本。其次,其靈活的許可模式則徹底打破了芯片授權(quán)的壟斷邏輯——云廠商無(wú)需支付高額授權(quán)費(fèi)用,即可自由定制處理器架構(gòu),深度適配自身工作負(fù)載,將算力從"通用適配"升級(jí)為"場(chǎng)景定制"。這種模式不僅重構(gòu)了芯片創(chuàng)新的參與門檻,更讓云服務(wù)從"購(gòu)買硬件"轉(zhuǎn)向"定義算力",真正實(shí)現(xiàn)按需優(yōu)化。最后,低成本優(yōu)勢(shì)則進(jìn)一步消除了算力普及的障礙,使云服務(wù)在經(jīng)濟(jì)性上更具競(jìng)爭(zhēng)力。

  不止是ARM架構(gòu),基于 RISC-V 架構(gòu)的服務(wù)器 CPU 也在迅速“破圈”。RISC-V架構(gòu)有著開(kāi)源、指令精簡(jiǎn)和可擴(kuò)展的優(yōu)勢(shì),在注重能效比的物聯(lián)網(wǎng)領(lǐng)域收獲頗豐。不過(guò),這并不意味著RISC-V無(wú)法進(jìn)軍有更高性能要求的PC和服務(wù)器市場(chǎng)。

  關(guān)于RISC-V 架構(gòu)的優(yōu)勢(shì),筆者總結(jié)主要有四點(diǎn):

  第一點(diǎn),它是開(kāi)源的,這意味著它自主可控。第二點(diǎn),它是可定制化的,如此便十分契合專用服務(wù)器的定制化需求。第三點(diǎn),它的成本更低,目前RISC-V IP核的授權(quán)費(fèi)和版稅只有ARM的1/3-1/4。如果采用RISC-V方案,能很大程度降低芯片、服務(wù)器廠商的成本。第四點(diǎn),RISC-V存在一些獨(dú)特的性能優(yōu)勢(shì),比如其有能力在單位面積上提供更高性能和核數(shù),這使其在有著高效能需求的AI等應(yīng)用中更加高效。

  如今,已有多家公司的RISC-V架構(gòu)服務(wù)器CPU芯片亮相。比如阿里巴巴的玄鐵RISC-V CPU,以及睿思芯科的全自研高性能RISC-V服務(wù)器芯片等。

  阿里云無(wú)影事業(yè)部總裁張獻(xiàn)濤曾表示“我覺(jué)得經(jīng)過(guò)5-8年的發(fā)展,未來(lái)在服務(wù)器里面的大規(guī)模應(yīng)用應(yīng)該是不成問(wèn)題的。很多公司對(duì)它的期待很高,一定會(huì)加速進(jìn)程往前發(fā)展的。RISC-V架構(gòu)從低功耗IoT終端大規(guī)模應(yīng)用到數(shù)據(jù)中心,大概5-8年內(nèi)就能實(shí)現(xiàn)?!?

  微核芯CEO郇丹丹表示高性能計(jì)算場(chǎng)景才是打開(kāi)RISC-V市場(chǎng)空間的關(guān)鍵。“過(guò)去RISC-V大多都是面向AIoT領(lǐng)域,低成本低性能領(lǐng)域已經(jīng)是紅海市場(chǎng),作為新興指令集的RISC-V產(chǎn)業(yè)要想發(fā)展壯大,只有伴隨著數(shù)據(jù)中心在高性能領(lǐng)域(服務(wù)器、AI計(jì)算)的新興應(yīng)用成長(zhǎng)才是打開(kāi)市場(chǎng)空間的關(guān)鍵?!?

  如今,英偉達(dá)攜Grace、Vera CPU重兵入局,ARM架構(gòu)憑高能效與定制化優(yōu)勢(shì)快速崛起,RISC-V則以開(kāi)源之力打破壟斷壁壘,曾經(jīng)由x86雙寡頭主導(dǎo)的格局被徹底打破。隨著AI產(chǎn)業(yè)從“訓(xùn)練為王”轉(zhuǎn)向“推理落地”,CPU的核心價(jià)值愈發(fā)凸顯,算力競(jìng)爭(zhēng)也從單芯片比拼升級(jí)為全系統(tǒng)較量。

內(nèi)容來(lái)自:半導(dǎo)體產(chǎn)業(yè)縱橫
本文地址:http://www.n2software.net//Site/CN/News/2026/03/10/20260310033441047989.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:服務(wù)器CPU,顛覆前夜?
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right