作者 | ?ZeR0,編輯 | ?漠影
陳立武表露對(duì)“新英特爾”的期許。
芯東西5月20日?qǐng)?bào)道,臺(tái)北國(guó)際電腦展COMPUTEX 2025今日盛大開幕,芯片產(chǎn)業(yè)領(lǐng)袖云集,陳立武首次以英特爾CEO身份赴臺(tái),并與中國(guó)臺(tái)灣供應(yīng)鏈伙伴餐敘。英特爾更是一舉發(fā)布多款GPU和AI產(chǎn)品,包括英特爾銳炫Pro B50/B60 GPU、Gaudi 3 AI加速器、輕量級(jí)開源軟件框架Intel AI Assistant Builder,展露其在AI及專業(yè)視覺(jué)領(lǐng)域的最新布局。
英特爾銳炫Pro B60/B50 GPU基于Xe?2架構(gòu),具備AI特性,為要求嚴(yán)苛的AI推理工作負(fù)載和工作站應(yīng)用而設(shè)計(jì),進(jìn)一步豐富了英特爾專業(yè)級(jí)GPU產(chǎn)品線。其中,銳炫Pro B60配備24GB顯存,AI峰值算力為197TOPS,適用于推理工作站;銳炫Pro B50配備16GB顯存,AI峰值算力為170TOPS,適用于圖形工作站。
兩款GPU均搭載英特爾XMX AI核心和先進(jìn)的光線追蹤單元,并支持多GPU擴(kuò)展,通過(guò)將高顯存容量與關(guān)鍵軟件兼容性相結(jié)合,為創(chuàng)作者和AI開發(fā)者提供了可擴(kuò)展的、經(jīng)濟(jì)高效的解決方案。銳炫Pro B50直接面向零售市場(chǎng),建議零售價(jià)為299美元(約合人民幣2159元),性價(jià)比優(yōu)勢(shì)突出。銳炫Pro B60將主要通過(guò)B2B模式進(jìn)行項(xiàng)目采購(gòu),正在與多家系統(tǒng)集成商和OEM廠商進(jìn)行合作。
華擎、藍(lán)戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將于今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將于今年7月開始在英特爾授權(quán)經(jīng)銷商處上市。
有合作伙伴將提供銳炫Pro B60的單卡雙GPU方案,板載顯存容量達(dá)48GB。英特爾Gaudi 3 AI加速器提供PCIe和機(jī)架級(jí)系統(tǒng)部署選擇,為企業(yè)和云AI推理提供可擴(kuò)展的開放解決方案。英特爾Gaudi 3 PCIe卡支持在現(xiàn)有服務(wù)器數(shù)據(jù)中心環(huán)境中進(jìn)行可擴(kuò)展的AI推理,將于今年下半年上市。
在CES 2025首次亮相后,英特爾AI Assistant Builder軟件框架現(xiàn)已在GitHub上提供公開測(cè)試版。該框架專為在基于英特爾AI PC上本地構(gòu)建和運(yùn)行自定義AI agents而設(shè)計(jì),可幫助企業(yè)或個(gè)人快速構(gòu)建并部署AI agents。
01.銳炫Pro B50:AI性能提升至3倍,性價(jià)比較RTX A1000翻番
英特爾銳炫Pro B50 GPU實(shí)現(xiàn)了同類價(jià)位段最高配置:擁有16個(gè)Xe核心,配備16GB顯存、128 XMX引擎,顯存帶寬為224GB/s,AI峰值算力(Int8)為170TOPS,單卡功耗僅70W。PCIe Gen 5速度的提升也會(huì)帶來(lái)10%-20%的性能提升。
與同類產(chǎn)品對(duì)比,銳炫Pro B50的顯存容量、驅(qū)動(dòng)程式優(yōu)化、PCIe Gen 5提升均表現(xiàn)更優(yōu)。同類產(chǎn)品通常配備6GB或8GB顯存。
與上一代產(chǎn)品及競(jìng)品相比,銳炫Pro B50在圖形和AI推理性能上有1.1倍~3.5倍的提升。
在通用性能方面,銳炫Pro B50相比上一代產(chǎn)品提升50%~130%。其性價(jià)比不僅相較銳炫Pro A50、英偉達(dá)RTX A1000翻倍提升,比起銳炫Pro A60也略勝一籌。
該系列GPU在Windows上兼容消費(fèi)級(jí)和專業(yè)級(jí)驅(qū)動(dòng)程序,在Linux上支持容器化的軟件棧。其軟件??梢院?jiǎn)化AI部署,并支持逐步升級(jí)和功能優(yōu)化。新發(fā)布的兩款GPU針對(duì)AEC(建筑、工程、施工)和推理工作站進(jìn)行了優(yōu)化,并通過(guò)大量ISV認(rèn)證和優(yōu)化的軟件提供穩(wěn)定、可靠的性能。
英特爾副總裁兼客戶端顯卡總經(jīng)理Vivian Lien稱,全新英特爾銳炫Pro GPU為一直在尋求針對(duì)性解決方案的中小型企業(yè),提供了易于獲取且可擴(kuò)展的解決方案。
02.銳炫Pro B60:AI峰值算力197TOPS,跑DeepSeek-R1倍殺RTX 5060Ti
銳炫Pro B60擁有20個(gè)Xe核心,配備24GB顯存、160 XMX引擎,顯存帶寬為456GB/s,AI峰值算力(Int8)為197TOPS,根據(jù)不同系統(tǒng)設(shè)計(jì),單卡功耗區(qū)間為120~200W。
從性能來(lái)看,銳炫Pro B60運(yùn)行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模型時(shí),相比英偉達(dá)RTX 2000 Ada 16GB、RTX 5060Ti 16GB的吞吐量更高。
更大參數(shù)規(guī)模的模型,需要更大的顯存。7B模型若采用FP16進(jìn)行推理,至少需要16GB顯存。70B模型采用INT4量化,需要超過(guò)30GB的顯存,若采用FP16,顯存需求更是將超過(guò)100GB。
通過(guò)多卡互連,銳炫Pro B60能夠以更大的顯存容量,來(lái)支撐大模型運(yùn)行,并在上下文和并發(fā)擴(kuò)展方面展現(xiàn)優(yōu)勢(shì)。一張銳炫Pro B60跑不了32B參數(shù)量的DeepSeek-R1蒸餾模型,但2張GPU就能支持20k tokens上下文,4張GPU可將上下文窗口擴(kuò)展到100k以上,足以直接輸入一本不太厚的書或論文。
企業(yè)級(jí)應(yīng)用場(chǎng)景對(duì)并發(fā)性提出了更高的要求。在設(shè)定8k上下文窗口的情況下,單張銳炫Pro B60無(wú)法支撐DeepSeek-R1 32B FP8精度模型的運(yùn)行。使用兩張顯卡時(shí),系統(tǒng)可支持5-6個(gè)并發(fā)用戶。
而當(dāng)采用四張顯卡、利用全部96GB顯存時(shí),系統(tǒng)可支持超過(guò)50個(gè)并發(fā)用戶,足以滿足中小企業(yè)的大部分需求。英特爾自己也用銳炫Pro B60來(lái)解決問(wèn)題。在開發(fā)酷睿Ultra第二代Lunar Lake產(chǎn)品時(shí),英特爾在VPC解碼過(guò)程中發(fā)現(xiàn)了一個(gè)Bug,表現(xiàn)出現(xiàn)花屏現(xiàn)象。這類問(wèn)題通常非常復(fù)雜,可能跨越多個(gè)軟件層,且代碼量巨大。
一位經(jīng)驗(yàn)豐富的工程師通常需要花費(fèi)數(shù)天時(shí)間,從數(shù)萬(wàn)行l(wèi)og中發(fā)現(xiàn)問(wèn)題,debug找到根源,并提供代碼修復(fù)方案,然后重新進(jìn)行測(cè)試。而英特爾在配備4張銳炫Pro B60和至強(qiáng)W處理器的服務(wù)器上部署運(yùn)行多AI agent協(xié)同方案,僅花費(fèi)數(shù)小時(shí)便完成了從問(wèn)題定位到代碼修復(fù)的全過(guò)程,并最終完成了所有問(wèn)題的修復(fù)和重新測(cè)試。
03.8張銳炫Pro B60互連,可跑1500億參數(shù)大模型
推理工作站具有廣闊的發(fā)展前景,主要體現(xiàn)在:1)安全部署,數(shù)據(jù)無(wú)需上傳至云端,可在本地處理;2)提供一站式解決方案,將所有軟件置于容器中,幫助客戶解決問(wèn)題,易于設(shè)置;3)易于擴(kuò)展,可靈活配置不同數(shù)量的顯卡;4)成本效益具有顯著優(yōu)勢(shì)。英特爾發(fā)布了一款可配置的工作站級(jí)英特爾至強(qiáng)平臺(tái)(代號(hào)Project Battlematrix),旨在減少AI開發(fā)人員的摩擦點(diǎn)。
借助高達(dá)192GB的視頻隨機(jī)存取存儲(chǔ)器(VRAM),它最多可支持8張英特爾銳炫Pro B60 24GB GPU,運(yùn)行高達(dá)1500億個(gè)參數(shù)的中等規(guī)模且精度高的AI模型。
為了優(yōu)化AI推理性能,英特爾在底層軟件上引入GPUDirect Peer-to-Peer技術(shù),可在GPU之間直接拷貝數(shù)據(jù),不需要CPU參與。此外,其張量并行算法則可以把一張顯卡放不下的大模型平均切分到4張或者是8張卡上進(jìn)行推理,然后把結(jié)果合并輸出給用戶。
英特爾采用容器化方案來(lái)幫助客戶解決軟件部署的復(fù)雜性問(wèn)題,在容器內(nèi)部對(duì)大語(yǔ)言模型進(jìn)行了大量的優(yōu)化,包括Linux軟件棧的支持、驗(yàn)證以及分階段的軟件發(fā)布。其Project Battlematrix Linux軟件棧如下圖所示,Linux操作系統(tǒng)位于容器之外,往上是用戶層驅(qū)動(dòng),Level 0是英特爾的底層驅(qū)動(dòng),再向上是英特爾OneAPI和XPU Manager,上層是英特爾對(duì)生態(tài)系統(tǒng)的支持。目前該軟件棧采用vLLM Serving,未來(lái)也將支持SGLang等其他開源軟件。英特爾對(duì)各層軟件進(jìn)行了完整的驗(yàn)證和優(yōu)化,并通過(guò)容器形式一鍵交付給客戶,以方便部署。
英特爾還展示了軟件功能路線圖,預(yù)計(jì)第三季度發(fā)布經(jīng)過(guò)完整驗(yàn)證和產(chǎn)品化的容器,第四季度推出SR-IOV、VDI虛擬桌面的軟件性能優(yōu)化以及完整的管理功能。
04.英特爾Gaudi 3:PCIe卡AI峰值算力達(dá)1678TFLOPS,機(jī)架級(jí)配備8.2TB HBM
英特爾進(jìn)一步推進(jìn)其AI戰(zhàn)略,推出英特爾Gaudi 3 AI加速器的全新部署方案。
英特爾Gaudi 3 PCIe卡配備128GB HBM2e,F(xiàn)P8精度下AI峰值算力達(dá)到1678TFLOPS,支持在現(xiàn)有服務(wù)器數(shù)據(jù)中心環(huán)境中進(jìn)行可擴(kuò)展的AI推理。
以AI大模型Llama為例,得益于可擴(kuò)展配置,可靈活運(yùn)行從輕量級(jí)Llama 3.1 8B到規(guī)模較大的Llama 4 Scout或Maverick等各種規(guī)模的AI模型。英特爾Gaudi 3機(jī)架級(jí)系統(tǒng)參考設(shè)計(jì)帶來(lái)了極大的靈活性和可擴(kuò)展性,每個(gè)機(jī)架最多可容納64個(gè)加速器,并擁有高達(dá)8.2TB的高帶寬內(nèi)存(HBM)。其機(jī)架級(jí)架構(gòu)針對(duì)大型AI模型進(jìn)行深度優(yōu)化,可提供實(shí)時(shí)推理性能。開放式模塊化設(shè)計(jì)打破了供應(yīng)商的限制,而有線背板和盲插2D全機(jī)架布線讓安裝和維護(hù)變得更加簡(jiǎn)單。
通過(guò)液冷,這些系統(tǒng)可提供強(qiáng)大的性能,并有助于TCO的控制。這些配置支持云服務(wù)提供商(CSP)的定制化需求和開放計(jì)算項(xiàng)目(OCP)設(shè)計(jì)規(guī)范。英特爾承諾構(gòu)建開放、靈活和安全AI基礎(chǔ)設(shè)施。
05.結(jié)語(yǔ):英特爾邁向全面轉(zhuǎn)型,力補(bǔ)AI產(chǎn)品實(shí)力,強(qiáng)調(diào)“執(zhí)行力”與“說(shuō)真話”
此次新品發(fā)布正值英特爾與臺(tái)灣科技生態(tài)系統(tǒng)合作40周年。英特爾進(jìn)一步擴(kuò)大專業(yè)級(jí)GPU陣容,提供大顯存、高性價(jià)比以及為AI推理和專業(yè)工作站量身定制的配置,并展示了其AI加速器產(chǎn)品及AI Assistant Builder的可用性。這些新產(chǎn)品有望為英特爾開辟新的局面。
在英特爾臺(tái)灣40周年晚宴活動(dòng)上,陳立武發(fā)表致辭,談到英特爾將全面轉(zhuǎn)型,重回工程導(dǎo)向,不僅做CPU,還要構(gòu)建完整的AI計(jì)算系統(tǒng),包括芯片、軟件、存儲(chǔ)、互連及工作負(fù)載整合,并強(qiáng)化與中國(guó)臺(tái)灣科技供應(yīng)鏈及客戶的交流合作。陳立武再度表露改造英特爾的決心和策略,以及對(duì)“新英特爾”的期許。英
特爾在PC市場(chǎng)有超過(guò)68%的市占率,在服務(wù)器市場(chǎng)有55%的市占率。據(jù)陳立武透露,一些客戶反饋為了提高系統(tǒng)性能,正在評(píng)估推動(dòng)開發(fā)定制芯片。陳立武強(qiáng)調(diào)了兩個(gè)目標(biāo):打造好產(chǎn)品,令客戶滿意。為此,他讓英特爾工程團(tuán)隊(duì)直接向他匯報(bào),確保做出正確的芯片產(chǎn)品,并積極招募人才。他告訴團(tuán)隊(duì):“如果你不先告訴我壞消息,而是讓我從客戶口中得知,那你就麻煩大了。我要的是誠(chéng)實(shí)、真實(shí)的文化。”
此次來(lái)臺(tái)行程中,陳立武拜訪了許多OEM客戶,聽到很多反饋。“你會(huì)看到一個(gè)全新的英特爾?!彼嘈庞⑻貭栁磥?lái)將以更謙卑、更開放的態(tài)度,主動(dòng)傾聽客戶聲音,不僅要推出好產(chǎn)品,更要讓生產(chǎn)穩(wěn)定、準(zhǔn)時(shí)、品質(zhì)穩(wěn)定?!拔蚁嘈胖灰掷m(xù)執(zhí)行、執(zhí)行、執(zhí)行,就能讓英特爾恢復(fù)元?dú)??!标惲⑽湔f(shuō),他不是搞營(yíng)銷的,不會(huì)吹噓表現(xiàn),英特爾將用成果說(shuō)話。