- 北京時間12月12日晚,Intel在圣克拉拉舉辦了架構(gòu)日活動。在五個小時的演講中,Intel揭開了2021年CPU架構(gòu)路線圖、下一代核心顯卡、圖形業(yè)務(wù)的未來、全新3D封裝技術(shù),甚至部分2019年處理器新架構(gòu)的面紗。
- 姍姍來遲的消費級CPU路線圖
- 近一段時間以來,業(yè)界一直非常期待看到Intel未來的架構(gòu)路線圖,但自Skylake以來卻一直處于猶抱琵琶半遮面的狀態(tài)。最近幾個月Intel簡單公布了一部分數(shù)據(jù)中心產(chǎn)品路線圖,包括Cascade Lake,Cooper Lake和Ice Lake以及未來幾代,但消費級產(chǎn)品卻依舊難產(chǎn)。
- 在本次架構(gòu)日活動上,Intel終于帶來了消費級的PC處理器架構(gòu)路線圖和Atom架構(gòu)路線圖。
- 在高性能的Core系列產(chǎn)品線上,Intel列出了未來三年內(nèi)的三個新代號:Sunny Cove、Willow Cove和Golden Cove,其中
離我們最近的
Sunny Cove將于2019年上市
。- 據(jù)悉,Sunny Cove架構(gòu)旨在提高通用計算任務(wù)下每時鐘計算性能和降低功耗,
將擁有AVX-512單元
,并包含了可加速人工智能和加密等專用計算任務(wù)的新功能,將成為Intel下一代PC和服務(wù)器處理器的基礎(chǔ)架構(gòu)。- 隨后的Willow Cove在路線圖上位于2020年,很可能也是10nm。Intel將此處的重點列為緩存重新設(shè)計、新的晶體管優(yōu)化以及其他安全功能,可能是指新一類側(cè)信道攻擊的進一步增強。
- Golden Cove則位于圖表中的2021年,工藝制程仍是一個問號,可能是10nm也可能是7nm,Intel將進一步提升其單線程性能和人工智能性能,并在核心設(shè)計中增加了潛在的網(wǎng)絡(luò)和AI功能,安全特性看起來也得到了提升。
- Atom系列低功耗處理器的架構(gòu)路線圖比酷睿系列的節(jié)奏慢,考慮到其歷史,這并不奇怪。鑒于Atom必須適應(yīng)各種設(shè)備,業(yè)界更多的是期望產(chǎn)品能夠提供更廣泛的功能,尤其是SoC方面。
- 即將在2019年推出的架構(gòu)名為Tremont,專注于單線程性能、網(wǎng)絡(luò)服務(wù)器性能以及電池續(xù)航時間的提升。緊隨Tremont之后的將是Gracemont,Intel將其列為2021年的產(chǎn)品,可能會擁有更寬的矢量處理單元或支持新的矢量指令。
- 從路線圖上看,Gracemont之后還會有一款“XXXmont”系列核心,Intel正在研究這款新內(nèi)核在2023年時可能具備的性能、頻率和特性。
- 上面這些是架構(gòu)的名稱,而實際產(chǎn)品可能可能會有另外的代號,也就是酷睿系列近些年來一直使用的“XXX-Lake”命名,比如代號為Ice Lake的處理器就是由Sunny Cove架構(gòu)的CPU內(nèi)核與Gen11核心顯卡聯(lián)合構(gòu)成。
- 活動中的另一個值得關(guān)注的消息是,
Intel未來的架構(gòu)很可能與工藝制程脫離關(guān)系
。Raja Koduri和Murthy Renduchintala博士解釋稱,為了讓產(chǎn)品線擁有一定的彈性,未來這些架構(gòu)的最新產(chǎn)品將以當(dāng)時可用的最佳工藝制程推向市場。- 雖然沒有明說,但雷鋒網(wǎng)認為這應(yīng)該意味著
目前已經(jīng)名存實亡的“Tick-Tock”策略徹底被掃進了歷史的垃圾桶,未來某些核心設(shè)計跨越不同制程的情況可能會成為常態(tài)
。- 窺探Sunny Cove架構(gòu)
- 每次聽到全新處理器架構(gòu)的消息時,大家最期待的都是對于新架構(gòu)的詳細分析,以及相對前代的變化情況。
- 自Skylake于2015年首次推出以來,到目前為止Intel已經(jīng)推出了Kaby Lake、Coffee Lake和Coffee Lake三代小改款,由于每代提升都不大,被玩家戲稱為“擠牙膏”。雖然這次Intel展示了全新的Sunny Cove架構(gòu),但遺憾的是其信息還不夠全面,主要集中在架構(gòu)設(shè)計的后端部分。
- Intel將其微體系結(jié)構(gòu)更新分為兩個不同的部分:通用性能提升和特殊用途性能提升,通用性能提升指原始IPC吞吐量或頻率增加,IPC的增加可能來自核心更寬、更深或更智能,而頻率通常是實現(xiàn)和過程的函數(shù),而特殊用途性能提升可以通過其他加速方法來改進特定方案中使用的某些工作負載。
- 據(jù)悉,Sunny Cove在通用性能和特殊用途性能兩個方面有著全方位的提升。在架構(gòu)的后端部分,Intel已經(jīng)做了包括增加高速緩存大小、增加核心執(zhí)行寬度、增加L1存儲帶寬等改進。
- Sunny Cove架構(gòu)的L1數(shù)據(jù)緩存從32KB升級為48KB,通常當(dāng)緩存容量增大時,緩存未命中的概率將以平方根的比例降低,因此Sunny Cove架構(gòu)的L1緩存未命中率理論上可減少22%。同時Sunny Cove架構(gòu)Core和Xeon處理器的L2緩存也將分別比目前的256KB和1MB有所增加,具體容量尚未可知。
- 此外,微操作緩存和二級TLB雖然不屬于后端,但其容量也都相比目前有所增加,這將有助于機器地址轉(zhuǎn)換。圖中還可以看到一些其他更改,例如執(zhí)行端口從8增加到10,允許一次從調(diào)度程序中獲得更多指令;重排序緩沖區(qū)的調(diào)度也從每個周期4條指令增加到5條指令;端口4和端口9鏈接到了一個循環(huán)數(shù)據(jù)存儲,使帶寬加倍,但AGU存儲功能也增加了一倍,這將有助于增加L1-D大小。
- Sunny Cove架構(gòu)的執(zhí)行端口也發(fā)生了重大變化,詳情見下圖:
- 我們看到Intel為核心的整數(shù)部分配備了更多LEA單元,以幫助進行內(nèi)存尋址計算,可能有助于通過需要頻繁內(nèi)存計算的安全緩解來幫助改善性能損失,或者幫助提供具有恒定偏移的高性能陣列代碼。端口1從Skylake端口5獲取MUL單元,可能用于重新平衡,但此處還有一個整數(shù)分頻器單元。這是一個小小的調(diào)整,Cannon Lake在其設(shè)計中也有一個64位IDIV單元,在這種情況下,它將64位整數(shù)除法從97個時鐘降低到18個時鐘,Sunny Cove可能與之類似。
- 在整數(shù)運算單元方面,端口5的乘法單元已成為“MulHi”單元,在其他架構(gòu)中,它會在寄存器中留下最重要的半字節(jié)以便進一步使用,但目前不能確定它在Sunny Cove核心中的位置究竟是什么。
- 在浮點運算單元方面,Intel增加了洗牌資源,這是出于消除代碼中瓶頸的考慮。Intel沒有在核心的浮點運算部分說明FMA的功能,但既然核心內(nèi)有一個AVX-512單元,這些FMA中就應(yīng)至少有一個與之交互。Cannon Lake只有一個512位的FMA,這個FMA很可能在這里,而Xeon的可擴展版本可能會有兩個FMA。
- Intel列出的其他更新包括分支預(yù)測器的改進,以及由TLB和L1-D帶來的有效負載延遲降低。不過雷鋒網(wǎng)獲悉,有人指出這些改進無法幫助到所有用戶,可能只有全新的算法才能使用這些特定部分的核心能力。
- 除了架構(gòu)上的差異,Sunny Cove還增加了新的指令以幫助加快專業(yè)計算任務(wù)。隨著AVX-512單元的出現(xiàn),新架構(gòu)將支持用于大算術(shù)計算的IFMA指令,這些指令在密碼學(xué)中非常有用。Sunny Cove還支持Vector-AES、Vector Carryless Multiply、SHA、SHA-NI以及Galois Field指令,這些指令也是密碼學(xué)的一些元素中的基本構(gòu)建塊。
- Sunny Cove支持更大的內(nèi)存容量,其主存儲器分頁表從4層增加到了5層,支持最多57bit線性地址空間和最多52bit物理地址空間,這意味著服務(wù)器處理器理論上可支持單插槽4TB內(nèi)存。
- 根據(jù)Intel之前的Xeon路線圖,Sunny Cove將在2020年與Ice Lake-SP一起在服務(wù)器領(lǐng)域上市。為了安全起見,Sunny Cove具有多密鑰全內(nèi)存加密和用戶模式指令預(yù)防功能。
- Gen11核心顯卡
- 2015年,Intel推出了采用Gen9核心顯卡的Skylake處理器,不過隨后Kaby Lake和Coffee Lake的核心顯卡都只是Gen9.5而非Gen10。實際上,Intel 10nm Cannon Lake處理器本該對應(yīng)Gen10,但Intel從未發(fā)布過帶核心顯卡的PC端Cannon Lake處理器。
- 今天,Intel首席架構(gòu)師、核心與視覺計算集團高級副總裁兼邊緣計算解決方案總經(jīng)理Raja Koduri直接公布了全新的Gen11核心顯卡,并重申了在2020年推出獨立圖形處理器的計劃。
- 根據(jù)路線圖,Gen11核心顯卡將于2019年開始隨10nm處理器一同面世,配備64個EUs,運算規(guī)模是此前Gen 9核心顯卡的2倍,浮點運算性能超過1TFlops。這64個EUs被分成4個切片,每個切片由2個8EUs的子切片組成,每個子切片均擁有指令緩存和3D采樣器,而較大的4個切片則擁有2個媒體采樣器、1個PixelFE以及額外的加載/存儲硬件。
- Intel并沒有透露太多關(guān)于如何提高EU性能的詳情,但表示EU內(nèi)部的浮點運算單元接口是重新設(shè)計,支持快速FP16性能。每個EU均像以前一樣支持7個線程,這意味著整個GPU有512個并發(fā)管道,Intel表示已經(jīng)重新設(shè)計了內(nèi)存接口,并將GPU的L3緩存增加到3MB,相比Gen9.5增加了4倍。
- Gen11核心顯卡的一項重大改進是終于支持了瓦片式渲染,這讓Intel成為繼2014年的NVIDIA和2017年的AMD之后,最后一個實現(xiàn)這一特性的PC GPU供應(yīng)商。雖然瓦片式渲染不是解決GPU性能問題的靈丹妙藥,但是優(yōu)化良好的瓦片式渲染可以很好的適應(yīng)核心顯卡的帶寬限制。
- 與此同時,Intel的無損內(nèi)存壓縮技術(shù)也有所改善,在最佳情況下性能可提高10%,平均可提高4%。GTI接口現(xiàn)在支持每個時鐘讀寫64字節(jié)以增加吞吐量,以與重新設(shè)計的內(nèi)存接口相配合。
- Gen11核心顯卡還支持Intel全新的多速率著色技術(shù)Coarse Pixel Shading,這與NVIDIA的可變像素著色很相似,能讓GPU減少陰影部分像素所需的渲染操作量。Intel為CPS展示了兩個演示,其中像素陰影分別作為與相機距離和屏幕中心相關(guān)的一個函數(shù),當(dāng)物體離相機或屏幕中心較遠時渲染量減少,其設(shè)計目的是幫助VR實現(xiàn)注視點渲染等功能,Intel表示游戲在支持這一技術(shù)后可提高約30%的幀率。
- Raja Koduri宣布了Intel獨立顯卡業(yè)務(wù)的新產(chǎn)品品牌:Xe,目前仍被非正式的稱為“Gen12”系列,將從2020年開始覆蓋從客戶端到數(shù)據(jù)中心的所有領(lǐng)域,也涵蓋了未來的核心顯卡解決方案,Intel希望Xe從入門到中檔,再到發(fā)燒友以及AI,都能向競爭對手最好的產(chǎn)品發(fā)起競爭。
- Xe將從10nm節(jié)點開始,為未來幾代圖形奠定基礎(chǔ),并將遵循Intel的單一堆棧軟件哲學(xué),即希望軟件開發(fā)人員能夠利用CPU、GPU、FPGA和AI,所有這些都使用同一套API,這表明Intel已經(jīng)準備好圍繞一個品牌向前發(fā)展。
- 作為架構(gòu)日活動的一部分,Intel在現(xiàn)場進行了大量芯片演示,據(jù)稱這些演示均是基于新的Sunny Cove核心和Gen11核心顯卡,目前的演示涉及項目包括7-Zip應(yīng)用和鐵拳7游戲兩部分。
- 7-Zip項目相對直接,演示機的同頻性能相較于SkyLake平臺提高了75%,展示了Sunny Cove架構(gòu)的Vector-AES和SHA-NI等新指令所帶來的特殊用途性能提升。而在鐵拳7中,Sunny Cove+Gen11的演示機與SkyLake+Gen9相比更順暢,完全超出30fps的最低要求。
- 改變芯片制造方式的Foveros 3D封裝
- 關(guān)注過半導(dǎo)體芯片設(shè)計的人都應(yīng)該清楚,目前生產(chǎn)的大多數(shù)CPU和SoC都是基于單片芯片的模具,即在封裝和進入系統(tǒng)之前,單片硅片內(nèi)就已經(jīng)具備了所需的一切。此外,還有一些帶有共享連接的多芯片封裝,以及將不同芯片通過高速互連連接在一起的載板或嵌入式橋產(chǎn)品。
- 在現(xiàn)代芯片設(shè)計中,最大的挑戰(zhàn)之一是盡量減少芯片面積,這樣可以降低成本和功耗,并且可以使其更容易在系統(tǒng)中實施。不過,當(dāng)涉及到提升性能時,大型單芯片或多芯片封裝的缺點之一是與內(nèi)存距離太遠,因此Intel準備將3D堆疊引入大眾市場。
- Raja介紹稱,Intel數(shù)十年來一直專注于高性能工藝節(jié)點,試圖盡可能多的釋放其內(nèi)核性能。除此之外,Intel還以類似的節(jié)奏運行IO優(yōu)化工藝節(jié)點,但更適合PCH或SoC類型的功能。
- 126x和127x是Intel進程節(jié)點技術(shù)的內(nèi)部編號系統(tǒng),不過圖上并沒有區(qū)分出帶“+”后綴的節(jié)點變體。Raja展示了現(xiàn)有的2019年工藝技術(shù),計算核心方面有10nm的1274工藝,IO方面有14nm的1273工藝,而本次介紹的Foveros 3D堆疊技術(shù)工藝代號是P1222。展望未來,Intel將擴大其節(jié)點基礎(chǔ),以便它可以覆蓋更多的功率和性能點。
- 為了實現(xiàn)這一目的,一種方法是通過貼片和封裝,為每種情況下的工作選擇最佳晶體管,無論是CPU、GPU、IO、FPGA、RF還是其他東西,只要使用正確的封裝,就可以將它們放在一起以獲得最佳的優(yōu)化。
- 這正是Foveros的用武之地。Foveros是英特爾新推出的有源載板技術(shù),其設(shè)計相比2018年推出EMIB2D封裝技術(shù),更適用于小尺寸產(chǎn)品或?qū)?nèi)存帶寬要求極高的產(chǎn)品。在這些設(shè)計中,每比特傳輸?shù)臄?shù)據(jù)的功率非常低,而封裝技術(shù)要處理的是凹凸間距減小、凹凸密度增大以及芯片堆疊技術(shù)。Intel表示Foveros已經(jīng)準備就緒,可以大規(guī)模生產(chǎn)。
- 這個技術(shù)的第一次迭代不像上面的幻燈片那么復(fù)雜,只是使用了一組連接到下面PCH的CPU核心,但Intel可以在不同的芯片上使用不同的晶體管類型,比如在一塊使用22FFL制程的載板上放置一組10nm的CPU。
- Intel在架構(gòu)日現(xiàn)場展示了Foveros芯片,其采用22FFL IO芯片作為有源載板,并用TSV連接了一顆10nm芯片,其中包含1個Sunny Cove內(nèi)核和4個Atom內(nèi)核。這款微型芯片尺寸為12*12,待機功率僅為2mW,看起來似乎是面向移動設(shè)備。
- 在Intel的幻燈片上可以看到,Sunny Cove內(nèi)核的“Big CPU”帶有0.5 MB獨享L2緩存,4個小型Atom內(nèi)核則有1.5MB共享L2緩存,兩組核心共享4MB L3緩存。芯片還集成了64EUs的Gen11核心顯卡、四通道LPDDR4內(nèi)存控制器,以及支持DisplayPort 1.4的MIPI。
- Jim Keller表示,Intel正在嘗試使用Foveros技術(shù)制造許多新玩意兒,看看哪些可能成為一個好產(chǎn)品,因此在2019年和2020年業(yè)內(nèi)應(yīng)該能看到更多Foveros產(chǎn)品。
- 一些周邊消息
- 在本次架構(gòu)日活動中,最“沒激情”的部分應(yīng)該是有關(guān)數(shù)據(jù)中心產(chǎn)品的討論。Intel之前已經(jīng)公布了企業(yè)市場接下來的兩款產(chǎn)品是Cascade Lake和Cooper Lake,均以14nm為基礎(chǔ),專注于增強安全性以及幫助加速的AI指令,隨后還會有10nm的Ice Lake Scalable,但也僅此而已。
- 不過在活動中Intel還是證實了Ice Lake將基于Sunny Cove架構(gòu)打造構(gòu)建,并展示了Ice Lake Xeon 10nm處理器的封裝,算是一點安慰性的新消息吧。
- 此外,Intel還在活動上介紹了傲騰技術(shù)、One API軟件以及深度學(xué)習(xí)參考堆棧等內(nèi)容。
-
One API軟件
:Intel宣布推出“One API”項目,以簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。該項目包括一個全面、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上。公開發(fā)行版本預(yù)計將于2019年發(fā)布。-
傲騰技術(shù)
:Intel傲騰數(shù)據(jù)中心級持久內(nèi)存作為一款新產(chǎn)品,集成了內(nèi)存般的性能以及數(shù)據(jù)的持久性和存儲的大容量。這項技術(shù)通過將更多數(shù)據(jù)放到更接近CPU的位置,使應(yīng)用在人工智能和大型數(shù)據(jù)庫中的更大量的數(shù)據(jù)集能夠獲得更快的處理速度。其大容量和數(shù)據(jù)的持久性減少了對存儲進行訪問時的時延損失,從而提高工作負載的性能。- Intel傲騰數(shù)據(jù)中心級持久內(nèi)存為CPU提供緩存行讀取。一般來說,當(dāng)應(yīng)用把讀取操作定向到傲騰持久內(nèi)存或請求的數(shù)據(jù)不在DRAM中緩存時,傲騰持久內(nèi)存的平均空閑讀取延遲大約為350ns。如果實現(xiàn)規(guī)模化,傲騰數(shù)據(jù)中心級固態(tài)盤的平均空閑讀取延遲約為10000ns,這將是顯著的改進。在某些情況下,當(dāng)請求的數(shù)據(jù)在DRAM中時,不管是通過CPU的內(nèi)存控制器進行緩存還是由應(yīng)用所引導(dǎo),內(nèi)存子系統(tǒng)的響應(yīng)速度預(yù)計與DRAM相同。
- Intel還展示了傲騰與QLC固態(tài)硬盤的結(jié)合,將降低對最常用數(shù)據(jù)的訪問延遲。總體來說,這些對平臺和內(nèi)存的改進重塑了內(nèi)存和存儲層次結(jié)構(gòu),從而為系統(tǒng)和應(yīng)用提供了完善的選擇組合。
-
深度學(xué)習(xí)參考堆棧
:這是一個集成、高性能的開源堆棧,基于Intel至強可擴展平臺進行了優(yōu)化。該開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問Intel平臺的所有特性和功能。深度學(xué)習(xí)參考堆棧經(jīng)過高度調(diào)優(yōu),專為云原生環(huán)境而構(gòu)建。該版本可以降低集成多個軟件組件所帶來的復(fù)雜性,幫助開發(fā)人員快速進行原型開發(fā),同時讓用戶有足夠的靈活度打造定制化的解決方案。- 操作系統(tǒng):Clear Linux 操作系統(tǒng)可根據(jù)個人開發(fā)需求進行定制,針對Intel平臺以及深度學(xué)習(xí)等特定用例進行了調(diào)優(yōu);
- 編排:Kubernetes可基于對Intel平臺的感知,管理和編排面向多節(jié)點集群的容器化應(yīng)用;
- 容器:Docker容器和Kata容器利用Intel虛擬化技術(shù)來幫助保護容器;
- 函數(shù)庫:Intel深度神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)核心函數(shù)庫是Intel高度優(yōu)化、面向數(shù)學(xué)函數(shù)性能的數(shù)學(xué)庫;
- 運行時:Python針對Intel架構(gòu)進行了高度調(diào)優(yōu)和優(yōu)化,提供應(yīng)用和服務(wù)執(zhí)行運行時支持;
- 框架:TensorFlow是一個領(lǐng)先的深度學(xué)習(xí)和機器學(xué)習(xí)框架;
- 部署:KubeFlow是一個開源、行業(yè)驅(qū)動型部署工具,在Intel架構(gòu)上提供快速體驗,易于安裝和使用。
原標題:Intel 2018架構(gòu)日詳解:新CPU&新GPU齊公布,牙膏時代有望明年結(jié)束1.《cpu架構(gòu) intel2019最新cpu 英特爾揭開未來cpu顯卡等架構(gòu)路線圖》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《cpu架構(gòu) intel2019最新cpu 英特爾揭開未來cpu顯卡等架構(gòu)路線圖》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/shehui/187799.html