2020年6月19日,英特爾發(fā)布多款數(shù)據(jù)中心級產(chǎn)品和方案,包括第三代至強(qiáng)可擴(kuò)展處理器,第二代傲騰和PCIe 4.0 SSD,以及一款為AI設(shè)計的FPGA新品。
第三代可擴(kuò)展處理器:最懂AI的CPU
今年2月,英特爾發(fā)布了幾款二代至強(qiáng)可擴(kuò)展處理器的升級版,當(dāng)時提到,這次發(fā)布在性價比上有較大提升。四個月之后,北京時間6月19日,英特爾全球同步發(fā)布第三代至強(qiáng)可擴(kuò)展處理器,發(fā)布節(jié)奏明顯比前幾年要快了許多,要知道第一代至強(qiáng)可擴(kuò)展處理器是2017年發(fā)布的。
其實,今年二月份發(fā)布的是通用性更強(qiáng)的方案,而此次發(fā)布的第三代至強(qiáng)主要是面向四路和八路市場的處理器,主要應(yīng)用于高性能計算這類場景,與二月份的發(fā)布并不沖突。
不過,英特爾也表示,今年下半年晚些時候會發(fā)布基于Ice Lake的單路和雙路版本,主打通用場景。2021年將發(fā)布下一代可擴(kuò)展處理器,從單路到八路全面覆蓋。
三年計劃了三代產(chǎn)品,英特爾產(chǎn)品迭代速度明顯加快,對用戶來說是再好不過的事兒了,一方面產(chǎn)品性能步伐加快,帶來直接的性價比提升,另一方面,豐富的SKU給了用戶更多選擇,根據(jù)需求,選擇合適的方案也能帶來降本增效的效果,對整個行業(yè)的發(fā)展也能夠起到積極推動作用。
此次發(fā)布的第三代至強(qiáng)可擴(kuò)展處理器包括白金8300系列,黃金6300和5300系列,其中8300系列有四路和八路兩種配置,最高28核心,6內(nèi)存通道,最大支持單路4.5TB內(nèi)存,標(biāo)稱TDP最高達(dá)250瓦。黃金6300和5300系列只有四路配置。
第三代至強(qiáng)可擴(kuò)展處理器主要強(qiáng)化了安全性和多核計算性能,適用于業(yè)務(wù)關(guān)鍵性負(fù)載,實時分析,機(jī)器學(xué)習(xí)以及混合云等工作負(fù)載。與五年前的平臺相比,平均性能提升1.9倍,跑數(shù)據(jù)庫的性能最高提升1.98倍,運(yùn)行的虛擬機(jī)的數(shù)量達(dá)到前者的2.2倍,作為市場上唯一可提供八路x86服務(wù)器處理器的平臺,至強(qiáng)同時還集成了深度學(xué)習(xí)加速的功能。
從第一代至強(qiáng)可擴(kuò)展處理器開始,至強(qiáng)就在往AI上靠,第一代加入了AVX-512指令,優(yōu)化了FP32計算能力,2019年第二代可擴(kuò)展處理器中引入了深度學(xué)習(xí)加速技術(shù)(Intel Deep Learning Boost),提升了Int8推理能力,第三代至強(qiáng)可擴(kuò)展處理器在深度學(xué)習(xí)加速技術(shù)中加入了Bfloat16數(shù)據(jù)格式。
BFloat是一種越來越流行的加速機(jī)器學(xué)習(xí)的浮點格式,最早出現(xiàn)在谷歌的TPU里,英特爾和ARM以及許多新的AI芯片公司也都將其視為AI加速架構(gòu)的核心功能之一,可見其重要性。對比BFloat16與FP32,BFloat16大多數(shù)情況下有FP32的準(zhǔn)確性,而效率要高于FP32,可以看做是FP32的改良版。
英特爾第三代至強(qiáng)可擴(kuò)展處理器在AI性能方面表現(xiàn)如何呢?BFloat16的加入,讓第三代可擴(kuò)展處理器提升了訓(xùn)練和推理方面的能力,從圖中可見,CPU在推理方面的提升更多一些。與第二代可擴(kuò)展處理器上使用的FP32格式相比,訓(xùn)練性能最高能提升1.96倍,推理性能最高能提升1.9倍。另外,與上代相比,在圖像分類的訓(xùn)練性能提升了1.93倍,推理性能提升了1.7倍。
對開發(fā)者來說,需要極少的代碼改動就能用上新平臺,所以,目前包括阿里云,螞蟻金服,騰訊云,東軟等國內(nèi)廠商都已經(jīng)用上了帶有Bfloat16的處理器,在推理和訓(xùn)練性能方面有近兩倍的提升。
AI作為最新最熱的工作負(fù)載類型之一,頗受英特爾的關(guān)注。英特爾一方面致力于把至強(qiáng)打造成最適合AI的CPU,同時,還希望把GPU、FPGA等各種硬件加速方案組合在一起,共同解決AI工作負(fù)載。不過,英特爾此次發(fā)布會中沒有提及GPU的細(xì)節(jié),只是說Xe GPU正在開發(fā)中,可能會在今年下半年的發(fā)布中做一些介紹。可以說,第三代至強(qiáng)可擴(kuò)展處理器是市場上AI能力最強(qiáng)的CPU,是最懂AI的CPU了。
第二代傲騰持久內(nèi)存
第三代至強(qiáng)可擴(kuò)展處理器同樣支持傲騰持久內(nèi)存,而傲騰持久內(nèi)存終于迎來了新一代產(chǎn)品——Optane Persistent Memory 200系列,傲騰持久內(nèi)存的提升可以按照內(nèi)存的要求來看,就是容量更大,性能更高。
上一代傲騰持久內(nèi)存配合第二代至強(qiáng)可擴(kuò)展處理器,單路最高能放6條512GB持久內(nèi)存,最大3TB持久內(nèi)存。200系列能在單路第三代至強(qiáng)可擴(kuò)展處理器上提供最高4.5TB內(nèi)存,包括3TB的傲騰持久內(nèi)存和普通的DRAM內(nèi)存,單條可用容量沒變,有128GB,256GB和512GB三個型號,支持與普通DRAM公用內(nèi)存插槽,支持兩種內(nèi)存的混插。
另外,性能方面,帶寬平均比上代提升了25%,與主流的NAND SSD相比,可以把數(shù)據(jù)傳輸訪問效率提升225倍。
傲騰持久內(nèi)存掉電不丟數(shù)據(jù),能加速系統(tǒng)故障之后重新啟動的時間,未來可能會有越來越多的利用這一特性的應(yīng)用出現(xiàn)。
大容量內(nèi)存的好處毋庸置疑,能更好地支持內(nèi)存數(shù)據(jù)庫,能減少服務(wù)器數(shù)量,進(jìn)而還能減少License授權(quán)費用,對TCO的好處是許多用戶選傲騰的重要原因。
PCIe 4.0終于來了
另外,英特爾還發(fā)布了D7-P5500和P5600兩個系列的NAND SSD,它采用了96層的TLC而不是QLC,接口協(xié)議方面,支持PCIe 4.0和NVMe 1.3c,4K隨機(jī)讀最高一百萬IOPS,4K隨機(jī)寫IOPS最高能達(dá)到26萬,延遲也有大幅降低,作為一款強(qiáng)調(diào)性能的產(chǎn)品,該系列SSD主要用在全閃存陣列當(dāng)中,支持人工智能和大數(shù)據(jù)分析等IO密集型場景。
2019年下半年以來,市場上開始出現(xiàn)PCIe 4.0 SSD,有消費級的,也有企業(yè)級的SSD,這次應(yīng)該是英特爾首款PCIe 4.0 SSD,CPU平臺也會有一些支持,英特爾平臺對于PCIe 4.0的支持,標(biāo)志著市場真正開始轉(zhuǎn)向4.0了。
首款面向AI優(yōu)化的FPGA-Stratix 10 NX
英特爾有一系列FPGA,而最新發(fā)布的FPGA-Stratix 10 NX是面向AI設(shè)計的,英特爾在其中嵌入了AI優(yōu)化模塊AI Tensor,與現(xiàn)有的Stratix 10 MX相比,前者的Int8計算性能要高出十五倍。
Stratix 10 NX在定位上是作為至強(qiáng)處理器的補(bǔ)充,專門針對特定應(yīng)用提供定制,為了進(jìn)一步優(yōu)化性能,英特爾重新設(shè)計了計算模塊(DSP模塊)。
在自然語言處理,在欺詐檢測,在智慧城市等場景中,Stratix 10 NX的表現(xiàn)都幾倍于英偉達(dá)顯卡V100的表現(xiàn)。
盡管GPU是AI計算領(lǐng)域應(yīng)用的最為廣泛,但許多新的面向AI場景設(shè)計的芯片,包括Stratix 10 NX這類FPGA還有一些IPU之類的,在一些場景下的表現(xiàn)都優(yōu)于GPU,AI芯片會隨著AI計算負(fù)載的變化還繼續(xù)演進(jìn)。
結(jié)語
第三代英特爾至強(qiáng)可擴(kuò)展處理器及英特爾傲騰持久內(nèi)存200系列目前已開始陸續(xù)交付,其通用OEM系統(tǒng)配置以及英特爾Stratix 10 NX FPGA都將在今年下半年交付。
從近三年的英特爾至強(qiáng)可擴(kuò)展處理器路線圖可以看到,英特爾計劃今年推出的產(chǎn)品功能更為聚焦,拆分成了專注于4/8路服務(wù)器市場的Cooper Lake和專注于1/2路的Ice Lake。
另外無論是第三代至強(qiáng)還是新一代Stratix 10 NX FPGA,英特爾都特意針對AI性能做了相當(dāng)程度的優(yōu)化。
隨著單一芯片越來越難以滿足日趨豐富的算力需求,異構(gòu)計算已成為業(yè)界公認(rèn)的計算發(fā)展方向,而英特爾的遠(yuǎn)見體現(xiàn)于早早洞察到這一技術(shù)趨勢,并通過一系列收購和技術(shù)研發(fā)形成了完整覆蓋CPU、GPU、FPGA及專用處理器的組合陣容,并持續(xù)地降低一系列軟硬件及前沿算法的應(yīng)用門檻。
今天發(fā)布的重點是AI和數(shù)據(jù)中心,但英特爾的硬件、軟件、生態(tài)布局已經(jīng)延伸于遠(yuǎn)遠(yuǎn)超出AI的整個數(shù)據(jù)處理與計算范疇。
如果您非常迫切的想了解IT領(lǐng)域更新產(chǎn)品與技術(shù)信息,那么訂閱強(qiáng)川技術(shù)郵件將是您的更佳途徑之一。