作者 | 金旺
來(lái)源 | 科技行者
近日,在MWC 2025前夕,英特爾正式對(duì)外發(fā)布了兩款至強(qiáng)6系列處理器新品——英特爾至強(qiáng)6700/6500性能核處理器。
早在2024年,英特爾至強(qiáng)系列處理器首次對(duì)外區(qū)分能效核和性能核,并發(fā)布了英特爾至強(qiáng)6700能效核處理器和英特爾至強(qiáng)6900性能核處理器。
相較于去年英特爾發(fā)布的兩款至強(qiáng)6系列處理器,此次發(fā)布的是從16核到86核的中端至強(qiáng)6系列處理器,是更適合主流數(shù)據(jù)中心應(yīng)用的產(chǎn)品,也是英特爾目標(biāo)服務(wù)于傳統(tǒng)企業(yè)包括數(shù)據(jù)庫(kù)、邊緣計(jì)算、AI應(yīng)用等更廣泛應(yīng)用的處理器產(chǎn)品。
英特爾臨時(shí)聯(lián)合首席執(zhí)行官兼英特爾產(chǎn)品首席執(zhí)行官M(fèi)ichelle Johnston Holthaus,“英特爾深耕數(shù)據(jù)中心市場(chǎng)數(shù)十余年,并通過(guò)x86 架構(gòu)引領(lǐng)標(biāo)準(zhǔn)制定和行業(yè)發(fā)展,目前,英特爾的處理器正為絕大多數(shù)數(shù)據(jù)中心提供動(dòng)力。”
作為長(zhǎng)期在商用服務(wù)器領(lǐng)域占據(jù)主導(dǎo)地位的X86服務(wù)器關(guān)鍵處理器,同時(shí)也是AI服務(wù)器的CPU機(jī)頭節(jié)點(diǎn)首選,此次至強(qiáng)6系列處理器新品面世,又將會(huì)為市場(chǎng)帶來(lái)怎樣的變化?
01 什么樣的CPU,更適合主流數(shù)據(jù)中心?
2023年,我國(guó)數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到53.9萬(wàn)億元,占GDP比重為42.8%,據(jù)中商產(chǎn)業(yè)研究院預(yù)測(cè)數(shù)據(jù)顯示,2024年我國(guó)數(shù)字經(jīng)濟(jì)占GDP比重將會(huì)進(jìn)一步增長(zhǎng)至44.6%。
數(shù)字經(jīng)濟(jì)規(guī)模不斷擴(kuò)大,外加人工智能技術(shù)的爆發(fā),各行各業(yè)對(duì)新一代算力基礎(chǔ)設(shè)施都提出了更高的需求。
作為全球算力核心供應(yīng)商之一,英特爾在過(guò)去幾年里一直是數(shù)據(jù)中心CPU的主要玩家,這次英特爾至強(qiáng)6系列處理器產(chǎn)品的問(wèn)世,一些新的特性也隨之更新。
首先是硬件性能更新。
英特爾至強(qiáng)6700/6500性能核處理器最高擁有86個(gè)核心、350W功率,相較于上一代產(chǎn)品,在企業(yè)工作負(fù)載中可以實(shí)現(xiàn)平均1.4倍的性能提升。
據(jù)英特爾官方透露,雖然此次發(fā)布的英特爾至強(qiáng)6700/6500性能核處理器核心數(shù)不是最多的,但是它的目標(biāo)更廣泛,是為了面對(duì)主流數(shù)據(jù)中心,更好地服務(wù)傳統(tǒng)企業(yè)數(shù)據(jù)中心廣泛應(yīng)用而設(shè)計(jì),支持單路、雙路、4路,甚至8路服務(wù)器設(shè)計(jì)。
例如,相較于高核高密度計(jì)算的大芯片,英特爾至強(qiáng)6700/6500性能核處理器150W-350W的TDP(熱功耗)在內(nèi)存通道上同樣支持8個(gè)內(nèi)存通道配置,支持AMX加速技術(shù)。
其次是對(duì)人工智能技術(shù)的支持。
早在大模型興起之前,人工智能就已經(jīng)廣泛應(yīng)用在數(shù)據(jù)中心中,例如搜索、推薦引擎等應(yīng)用,很多國(guó)內(nèi)互聯(lián)網(wǎng)巨頭都在使用英特爾至強(qiáng)處理來(lái)支持相關(guān)業(yè)務(wù),這讓英特爾在過(guò)往這些年里積累了不少諸如AMX這樣的AI加速技術(shù),這些技術(shù)是如今英特爾面向人工智能時(shí)代的優(yōu)勢(shì)所在。
此外,據(jù)英特爾數(shù)據(jù)中心與AI集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立透露,“在GPU服務(wù)器中,機(jī)頭位置的CPU選擇至關(guān)重要,英特爾至強(qiáng)系列處理器一直以來(lái)都是AI服務(wù)器CPU機(jī)頭的首選,相較于市面上其他產(chǎn)品,至強(qiáng)6處理器在所需核心數(shù)減少三分之一的情況下,性能卻可以高出50%。”
什么是服務(wù)器的“機(jī)頭”?
所謂服務(wù)器的機(jī)頭是指計(jì)算機(jī)網(wǎng)絡(luò)中用于識(shí)別目標(biāo)服務(wù)器的重要組件, 它可以根據(jù)特定規(guī)則和協(xié)議判斷請(qǐng)求的目標(biāo)服務(wù)器地址,并將請(qǐng)求轉(zhuǎn)發(fā)給相應(yīng)的服務(wù)器,起到路由和轉(zhuǎn)發(fā)的作用。
陳葆立指出,“在處理大模型計(jì)算時(shí),我們會(huì)關(guān)注提問(wèn)后第一個(gè)回答的延遲時(shí)間,如果使用CPU處理,這一指標(biāo)將與內(nèi)存帶寬密切相關(guān)。”
為了滿足企業(yè)對(duì)于人工智能技術(shù)的普遍應(yīng)用需求,英特爾至強(qiáng)6系列處理器首次引入了內(nèi)存優(yōu)化技術(shù)——MRDIMM。
這也是英特爾面向更廣泛的企業(yè)應(yīng)用需求引入的一項(xiàng)新技術(shù)。
02 人工智能推理,英特爾的思路
如今的人工智能技術(shù)就像十年前的云計(jì)算技術(shù)一樣,已經(jīng)成為了這個(gè)時(shí)代的確定性,這其中,在以生成式AI、大模型為代表的人工智能技術(shù)進(jìn)入應(yīng)用階段后,AI推理的重要性逐漸凸顯。
在2024年年底的NeurIPS 2024大會(huì)上,OpenAI前首席科學(xué)家Ilya Sutskever就曾指出,“大模型預(yù)訓(xùn)練時(shí)代已經(jīng)結(jié)束,接下來(lái)更為重要的將會(huì)是智能體、推理、理解、自我意識(shí)推動(dòng)的超級(jí)智能體。”
面對(duì)AI推理,CPU也就有了大用處。
英特爾技術(shù)專家指出,“我們發(fā)現(xiàn),在小于20B參數(shù)規(guī)模的模型中,用至強(qiáng)處理器做AI推理有很大的優(yōu)勢(shì)。”
對(duì)于20B以內(nèi)參數(shù)規(guī)模的大語(yǔ)言模型而言,在推理過(guò)程中,不僅會(huì)在生成首個(gè)token時(shí)需要進(jìn)行密集的計(jì)算,在后續(xù)大多數(shù)token推理中,對(duì)內(nèi)存帶寬也有很高的要求。
于是,英特爾在至強(qiáng)6系列處理器中引入了用于內(nèi)存優(yōu)化的MRDIMM技術(shù)。
什么是MRDIMM?
MRDIMM是多路復(fù)用雙列直插式內(nèi)存模組,可以在單個(gè)通道上組合和傳輸多個(gè)數(shù)據(jù)信號(hào),從而在無(wú)需額外物理連接的前提下提升帶寬。
那么,這樣的MRDIMM有怎樣的魔力?
一個(gè)對(duì)比數(shù)據(jù)是,相比內(nèi)存速度在4800-5600MT/s的英特爾第五代至強(qiáng)處理器,英特爾至強(qiáng)6處理器的內(nèi)存速度已經(jīng)提升到了6400MT/s,而在引入MRDIMM后,這個(gè)速度可以進(jìn)一步被提升到8800MT/s。相較于當(dāng)下市面上部署的數(shù)據(jù)中心服務(wù)器,內(nèi)存速度提升達(dá)到50%以上。
除了MRDIMM,英特爾AMX是英特爾應(yīng)對(duì)人工智能技術(shù)另一項(xiàng)沉淀下來(lái)的重要技術(shù)。
大模型在2023年火遍全球之前,推薦引擎、自然語(yǔ)言處理、圖像處理、目標(biāo)識(shí)別等人工智能技術(shù)場(chǎng)景都得益于英特爾AMX技術(shù)加持下的英特爾至強(qiáng)處理器。
在端到端的業(yè)務(wù)流程中,無(wú)論是傳統(tǒng)的AI,還是現(xiàn)在的生成式AI,都對(duì)矢量數(shù)據(jù)庫(kù)搜索有需求,這些需求在實(shí)際行業(yè)部署中得益于英特爾至強(qiáng)內(nèi)置的AMX加速引擎,在同等核心數(shù)下,至強(qiáng)在矢量數(shù)據(jù)庫(kù)離線構(gòu)建索引表的過(guò)程中,性能相較行業(yè)中其他處理器提升了30%。
與此同時(shí),人工智能技術(shù)的發(fā)展,也加大了企業(yè)對(duì)于安全性能的提升。
英特爾TDX是英特爾早在英特爾第四代至強(qiáng)處理器就已經(jīng)引入的安全計(jì)算技術(shù),它是一種基于硬件可信執(zhí)行環(huán)境來(lái)部署信任域,信任域是硬件隔離的虛擬機(jī),旨在保護(hù)敏感數(shù)據(jù)和應(yīng)用程序免遭未經(jīng)授權(quán)的訪問(wèn)。
在人工智能時(shí)代,異構(gòu)系統(tǒng)越來(lái)越普及,企業(yè)對(duì)安全計(jì)算技術(shù)提出了更高的需求,希望英特爾可以和其他加速卡生產(chǎn)商一起聯(lián)合構(gòu)建一個(gè)不僅包含CPU,同時(shí)還包含GPU的硬件防護(hù)體系,于是就有了英特爾至強(qiáng)6處理器引入的TDX Connect技術(shù)。
據(jù)英特爾技術(shù)專家解釋,“TDX Connect技術(shù)通過(guò)在系統(tǒng)中實(shí)現(xiàn)英特爾至強(qiáng)處理器和GPU的聯(lián)合協(xié)作,構(gòu)建一個(gè)整體的防護(hù)網(wǎng)。”
無(wú)論是放在CPU、業(yè)務(wù)入口上的數(shù)據(jù),還是運(yùn)行在GPU上的模型參數(shù)和數(shù)據(jù),都能得到硬件防護(hù),這就是TDX Connect技術(shù)為安全領(lǐng)域帶來(lái)的一個(gè)顯著變化。
這個(gè)變化,正是人工智能時(shí)代數(shù)據(jù)保護(hù)所特別需要的。
03 至強(qiáng)6 SoC如何為運(yùn)營(yíng)商提升能效?
在人工智能浪潮中,各行各業(yè)都在進(jìn)行著悄然改變,這其中也包括網(wǎng)絡(luò)連接方式和運(yùn)維方式。
就在前不久,面對(duì)DeepSeek席卷全球,以及隨之而來(lái)的一波人工智能的應(yīng)用爆發(fā),國(guó)內(nèi)三大運(yùn)營(yíng)商迅速完成了DeepSeek的接入。
中信證券在隨后的研報(bào)中指出,中國(guó)電信、中國(guó)聯(lián)通、中國(guó)移動(dòng)三大運(yùn)營(yíng)商紛紛宣布全面接入DeepSeek,通過(guò)各自的平臺(tái)和資源實(shí)現(xiàn)了DeepSeek在多場(chǎng)景、多產(chǎn)品中的廣泛應(yīng)用,有望加速運(yùn)營(yíng)商云計(jì)算收入增長(zhǎng)。
實(shí)際上,為了充分釋放下一代網(wǎng)絡(luò)連接技術(shù)的潛力,電信運(yùn)營(yíng)商正在積極采用網(wǎng)絡(luò)切片、AI驅(qū)動(dòng)的無(wú)線控制器和云原生架構(gòu)等技術(shù),接入DeepSeek只是電信運(yùn)營(yíng)商面對(duì)當(dāng)下網(wǎng)絡(luò)技術(shù)環(huán)境的一個(gè)積極求變的縮影。
在此次發(fā)布會(huì)上,英特爾面向網(wǎng)絡(luò)和邊緣計(jì)算應(yīng)用也發(fā)布了一款英特爾至強(qiáng)6系統(tǒng)級(jí)芯片(SoC)。
據(jù)英特爾中國(guó)網(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超介紹稱,“這款系統(tǒng)級(jí)芯片整合了不同的加速器,以提供更高性能和能效,專門面向運(yùn)營(yíng)商網(wǎng)絡(luò)和邊緣應(yīng)用而設(shè)計(jì)。”
網(wǎng)絡(luò)與邊緣設(shè)備涉及的地區(qū)非常廣泛,需兼顧計(jì)算密度、連接性能、功耗限制與物理尺寸的約束,與此同時(shí),它們通常分布在不同位置,需要考慮到傳輸過(guò)程中的安全性。
據(jù)悉,英特爾至強(qiáng)6系統(tǒng)級(jí)芯片整合了,擁有72個(gè)核心,整合和了各種加速器,以及英特爾至強(qiáng)6性能核處理器其它諸多特性,具體包括以下三方面:
第一,Webroot CSI上傳模型的推理速度大幅提升,相較于英特爾至強(qiáng)D-2899NT處理器,提升最高可達(dá)4.3倍;
第二,得益于vRAN Boost技術(shù),單核AI RAN性能比上一代提升3.2倍;
第三,在視頻邊緣服務(wù)器上,一個(gè)38核系統(tǒng)可同時(shí)支持多達(dá)38路攝像頭視頻流的int8推理。
據(jù)阮伯超透露,“英特爾至強(qiáng)6系統(tǒng)級(jí)芯片已經(jīng)被廣泛運(yùn)用到運(yùn)營(yíng)商網(wǎng)絡(luò)以及網(wǎng)絡(luò)與邊緣當(dāng)中。”
以運(yùn)算網(wǎng)絡(luò)為例,目前英特爾與諾基亞合作,基于英特爾至強(qiáng)6系統(tǒng)級(jí)芯片,諾基亞提升了70%的性能功耗比,幫助運(yùn)營(yíng)商提升了整體密度,帶來(lái)高達(dá)2.4倍的無(wú)線接入網(wǎng)工作負(fù)載容量提升。
除此以外,英特爾本次還發(fā)布了實(shí)現(xiàn)了帶寬翻倍、可以達(dá)到200GbE的吞吐量的以太網(wǎng)控制器E830和網(wǎng)絡(luò)適配器,以及增加了控制功能、提升了可管理性的以太網(wǎng)控制器E610和網(wǎng)絡(luò)適配器。
面對(duì)人工智能應(yīng)用涌現(xiàn)的這一年,這些也將成為英特爾為電信運(yùn)營(yíng)商備戰(zhàn)2025的新裝備。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究利用大語(yǔ)言模型解決科學(xué)新穎性檢測(cè)難題,南洋理工大學(xué)團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了閉合領(lǐng)域數(shù)據(jù)集并提出知識(shí)蒸餾框架,訓(xùn)練輕量級(jí)檢索器捕捉想法層面相似性而非表面文本相似性。實(shí)驗(yàn)表明,該方法在市場(chǎng)營(yíng)銷和NLP領(lǐng)域顯著優(yōu)于現(xiàn)有技術(shù),為加速科學(xué)創(chuàng)新提供了有力工具。
un?CLIP是一項(xiàng)創(chuàng)新研究,通過(guò)巧妙反轉(zhuǎn)unCLIP生成模型來(lái)增強(qiáng)CLIP的視覺(jué)細(xì)節(jié)捕捉能力。中國(guó)科學(xué)院研究團(tuán)隊(duì)發(fā)現(xiàn),雖然CLIP在全局圖像理解方面表現(xiàn)出色,但在捕捉細(xì)節(jié)時(shí)存在不足。他們的方法利用unCLIP生成模型的視覺(jué)細(xì)節(jié)表示能力,同時(shí)保持與CLIP原始文本編碼器的語(yǔ)義對(duì)齊。實(shí)驗(yàn)結(jié)果表明,un?CLIP在MMVP-VLM基準(zhǔn)、開(kāi)放詞匯語(yǔ)義分割和視覺(jué)中心的多模態(tài)任務(wù)上顯著優(yōu)于原始CLIP和現(xiàn)有改進(jìn)方法,為視覺(jué)-語(yǔ)言模型的發(fā)展提供了新思路。
這項(xiàng)研究介紹了RPEval,一個(gè)專為評(píng)估大語(yǔ)言模型角色扮演能力而設(shè)計(jì)的新基準(zhǔn)。研究團(tuán)隊(duì)從法國(guó)里爾大學(xué)開(kāi)發(fā)的這一工具專注于四個(gè)關(guān)鍵維度:情感理解、決策制定、道德對(duì)齊和角色一致性,通過(guò)單輪交互實(shí)現(xiàn)全自動(dòng)評(píng)估。研究結(jié)果顯示Gemini-1.5-Pro在總體表現(xiàn)上領(lǐng)先,而GPT-4o雖在決策方面表現(xiàn)出色,但在角色一致性上存在明顯不足。這一基準(zhǔn)為研究人員提供了一個(gè)可靠、可重復(fù)的方法來(lái)評(píng)估和改進(jìn)大語(yǔ)言模型的角色扮演能力。
這篇論文介紹了LegalSearchLM,一種創(chuàng)新的法律案例檢索方法,將檢索任務(wù)重新定義為法律要素生成。研究團(tuán)隊(duì)構(gòu)建了LEGAR BENCH數(shù)據(jù)集,涵蓋411種犯罪類型和120萬(wàn)案例,并開(kāi)發(fā)了能直接生成關(guān)鍵法律要素的檢索模型。實(shí)驗(yàn)表明,該模型在準(zhǔn)確率上超越傳統(tǒng)方法6-20%,且在未見(jiàn)犯罪類型上展現(xiàn)出強(qiáng)大泛化能力。這一突破為法律專業(yè)人士提供了更高效、精準(zhǔn)的案例檢索工具。
關(guān)注智造、硬件、機(jī)器人。