飛象原創(chuàng)(魏德齡/文)擁抱AI,將現(xiàn)有業(yè)務(wù)與新技術(shù)相融合,是如今正在被眾多企業(yè)所關(guān)注的話題。但如個人用戶在部署本地AI時,可能會考慮內(nèi)存與算力如何與相關(guān)大語言模型所匹配的問題類似,企業(yè)在自身能力基礎(chǔ)上需要做出更多考量,如何控制能源的消耗,獲得最優(yōu)的投入產(chǎn)出,才能免除部署疑慮,在軟硬件的更新?lián)Q代中實現(xiàn)AI融合。
近日,英特爾擴展了至強6產(chǎn)品組合,帶來面向通用服務(wù)器負(fù)載的至強6700/6500P系列(Granite Rapids-SP)和面向網(wǎng)絡(luò)和邊緣應(yīng)用的至強6 SoC(Granite Rapids-D)。兩款產(chǎn)品均針對AI需求提供了專門的技術(shù)支持。其中至強6700/6500P系列中首次支持的MRDIMM技術(shù),讓CPU實現(xiàn)了對AI更好的支持。
首款支持MRDIMM的平臺
至強6700/6500P系列的目標(biāo)是更好地服務(wù)傳統(tǒng)企業(yè)各種不同的廣泛應(yīng)用,包括最新的AI應(yīng)用、傳統(tǒng)的數(shù)據(jù)庫或者是邊緣、存儲或不同的傳統(tǒng)計算。
在AI工作負(fù)載需求日益增強的情況下,更快的內(nèi)存帶寬可以讓CPU更好地支持AI。原因在于部分工作負(fù)載,如推薦系統(tǒng)中的某些任務(wù),仍然依賴CPU處理且對內(nèi)存帶寬極為敏感。
英特爾在多年以前便開始與眾多廠商進(jìn)行MRDIMM技術(shù)的推進(jìn)。在此次發(fā)布的至強6產(chǎn)品中,相比內(nèi)存速度在4800-5600MT/s的第五代至強,至強6的速度已經(jīng)提升到了DDR5 6400MT/s。MRDIMM更可以把這個速率大幅提升到8800MT/s。相比于現(xiàn)已在市面上部署的數(shù)據(jù)中心服務(wù)器,提升達(dá)到50%以上。
MRDIMM可以在第一時間大幅度提升內(nèi)存帶寬,能夠為中小模型推理任務(wù)提供更好的性價比。MRDIMM與至強6的結(jié)合,以及與其他加速卡的搭配,將顯著提升端到端業(yè)務(wù)的性能。
例如對于小規(guī)模的大語言模型而言,其推理過程不僅在生成首個Token時需要進(jìn)行密集的計算,更重要的是,在后續(xù)的大多數(shù)Token推理中,對內(nèi)存帶寬的需求非常高。因此,至強6處理器與MRDIMM技術(shù)的結(jié)合可以帶來更佳表現(xiàn)。
“我們的最新超級計算機將配備英特爾至強6處理器,采用P核,這是最新的處理器技術(shù),并結(jié)合高帶寬MRDIMM內(nèi)存。它將為用戶提供顯著加速解決特定受內(nèi)存限制任務(wù)的能力,這對于科學(xué)研究至關(guān)重要!盜T4Innovations超級計算服務(wù)總監(jiān)Jansik表示。
同時,至強6平臺上還完整地支持了業(yè)界標(biāo)準(zhǔn)CXL 2.0。其中一個突出的應(yīng)用場景就是如何通過CXL2.0擴展內(nèi)存,來以更高的性價比去拓展服務(wù)器的內(nèi)存空間,進(jìn)而滿足包括AI在內(nèi)對于內(nèi)存總量敏感的應(yīng)用場景需求。
打消部署后顧之憂
英特爾至強6700/6500性能核處理器能夠提供出色的性能與能效平衡。與上一代產(chǎn)品相比,至強6處理器在廣泛的企業(yè)工作負(fù)載中實現(xiàn)了平均1.4倍的性能提升。作為AI系統(tǒng)的機頭節(jié)點CPU,至強6可與GPU搭配,為客戶提供優(yōu)選組合。
此外,它以更少的核心數(shù)量,提供高達(dá)1.5倍的AI推理性能提升。能夠在如大數(shù)據(jù)、科學(xué)計算、AI、網(wǎng)絡(luò)等應(yīng)用中,以在同樣能耗的情況下,帶來更加顯著的性能提升。以5年使用周期計,平均可以實現(xiàn)以一臺新的服務(wù)器替代五臺舊服務(wù)器5,在某些用例中該比例可達(dá)10:1,從而節(jié)省高達(dá)68%的TCO。
得益于至強內(nèi)置的AMX加速引擎,在同等核心數(shù)下,至強在矢量數(shù)據(jù)庫離線構(gòu)建索引表的過程中,性能甚至可以高過友商30%。另在圖片分類這樣的傳統(tǒng)AI領(lǐng)域最高可達(dá)50%以上的性能提升。
英特爾還關(guān)注到了由AI部署所產(chǎn)生的AI隱憂,針對進(jìn)入到AI時代后異構(gòu)系統(tǒng)的普及,業(yè)界希望英特爾可以和其他加速卡生產(chǎn)商一起聯(lián)合構(gòu)建一個不僅包含CPU,同時也包含GPU的硬件防護(hù)的體系。至強6中的TDX Connect技術(shù)構(gòu)建了一個CPU與GPU整體的防護(hù)網(wǎng),無論是放在CPU上的數(shù)據(jù)抑或是業(yè)務(wù)入口,又或者運行在GPU上的模型參數(shù)或是模型數(shù)據(jù),都能得到硬件防護(hù)。這也意味著,即便是一臺云主機,云服務(wù)提供商也無法獲取用戶的任何數(shù)據(jù)。
“Intel TDX Connect代表了提升機密計算的一大里程碑,增強了性能和可擴展性。它使現(xiàn)有和全新的工作負(fù)載能夠受益于機密計算的隱私保障,而不會在成本或性能上妥協(xié)!蔽④汚zure產(chǎn)品主管Vikas Bhatia表示。
顯然,在云端至強6700/6500P系列解除了企業(yè)在面對各類任務(wù)流時的掣肘,在與AI業(yè)務(wù)相關(guān)的任務(wù)中,無論是如圖像識別、語言處理、推薦系統(tǒng)等這類經(jīng)典AI模型,還是中小參數(shù)量的大語言模型,都能在保證安全的情況下,以更小的能耗,帶來更優(yōu)的性能表現(xiàn)。
借助融合降低TCO的全新SoC
在邊緣側(cè),以電信運營商為代表的廠商同樣正在思考AI融合的問題,將傳統(tǒng)的網(wǎng)絡(luò)在連接功能基礎(chǔ)上引入智能與算力。以AI應(yīng)用為例,邊緣服務(wù)器可應(yīng)用于智能工廠,助力礦山開采作業(yè),亦能用于智能攝像頭相關(guān)場景。此類設(shè)備會集成多種網(wǎng)絡(luò)功能,如SD-WAN,同時整合安全功能。更為重要的是,它可以將各類AI應(yīng)用集成于一體,例如智能監(jiān)控與安全監(jiān)控應(yīng)用。
本次同期推出的至強6處理器便是一款專為網(wǎng)絡(luò)和邊緣應(yīng)用設(shè)計了一款全新SoC。該產(chǎn)品是專門面向運營商,針對網(wǎng)絡(luò)和邊緣應(yīng)用而設(shè)計的。對多樣化的功能特性進(jìn)行了高度集成,整合了英特爾至強6性能核處理器的特性,將核心提升至72個,并整合多種加速器,例如面向vRAN的vRAN boost技術(shù)、面向媒體的英特爾媒體轉(zhuǎn)碼加速器,以及面向AI加速的英特爾高級矩陣擴展。
作為一顆系統(tǒng)芯片,至強6處理器實現(xiàn)了功耗與性能的平衡。例如在與諾基亞的合作中,提升了70%的性能功耗比,幫助運營商提升了整體密度,帶來高達(dá)2.4倍的無線接入網(wǎng)工作負(fù)載容量提升;另外在AI領(lǐng)域,該產(chǎn)品內(nèi)置新的英特爾高級矩陣擴展英特爾AMX,讓單核AI RAN性能較上一代提升3.2倍;在網(wǎng)絡(luò)安全領(lǐng)域,該產(chǎn)品實現(xiàn)了Webroot CSI上傳模型的推理速度大幅提升,相比于英特爾至強D-2899NT處理器,提升最高可達(dá)4.3倍。
至強6處理器還是首款內(nèi)置媒體轉(zhuǎn)碼加速器的服務(wù)器SoC。得益于此在編解碼任務(wù)時可實現(xiàn)較大性能功耗比的提升。相較于英特爾至強6538N處理器,每瓦性能提升達(dá)到了14倍。在Synamedia已經(jīng)采用了至強6系統(tǒng)級芯片,實現(xiàn)了編解碼的每瓦性能提升。另外還能幫助傳統(tǒng)VDI領(lǐng)域,提升媒體的處理效率,減少總體擁有成本。
“業(yè)界常常討論智算網(wǎng)融合,原因是希望可以有一個基礎(chǔ)建設(shè)能用到不同場景中,讓你的‘投資’不會被鎖到某一個領(lǐng)域當(dāng)中。所以為了經(jīng)濟性,我們的看法是選一個可以支持各種應(yīng)用的平臺,不管是網(wǎng)絡(luò)、AI、網(wǎng)絡(luò)邊緣還是控制的應(yīng)用!庇⑻貭栔袊W(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超表示。
英特爾同樣以這一原則來設(shè)計產(chǎn)品,無論是選擇AI應(yīng)用、網(wǎng)絡(luò)部署還是邊緣控制,英特爾的產(chǎn)品均基于同一開發(fā)平臺實現(xiàn)。通過軟件層面的差異化配置,可以滿足不同應(yīng)用場景需求,無需分別為網(wǎng)絡(luò)、AI搭建獨立平臺。借助這一融合平臺,能夠最大程度降低總體擁有成本。
目前至強6能效核處理器,已經(jīng)用在很多的5G網(wǎng)絡(luò)中,通過與業(yè)界伙伴的合作,其性能得到了充分發(fā)揮。經(jīng)5G核心網(wǎng)解決方案合作伙伴獨立驗證,該處理器實現(xiàn)了3.2倍的性能提升、3.8倍的每瓦性能提升。此外,配合在MWC24上推出的英特爾基礎(chǔ)設(shè)施電源管理器軟件,運行時功耗更可降低60%。
至強6新品正在以最優(yōu)TCO釋放AI潛能,讓企業(yè)能夠從云到邊無憂部署,不僅助力高效應(yīng)對AI計算挑戰(zhàn),還在云端、邊緣等多場景下提供更優(yōu)的能效表現(xiàn),讓AI融合之路更輕松、更經(jīng)濟、更具未來價值。