你聽說過最近市場上發(fā)布的幾款新CPU嗎?他們的表現(xiàn)很厲害!沒錯,ARM Cortex-A75和Cortex-A55是第一款基于最新發(fā)布的DynamIQ技術(shù)的Cortex-A系列處理器。關(guān)于Cortex-A75的更多信息,戳這里→。這一次,我們將討論Cortex-A55,為什么它是未來數(shù)字世界的重要處理器。
出生于貴族家庭,經(jīng)過了考驗
更高的性能可以滿足人工智能任務(wù)的需求,這是當前和未來ARM IP的主要關(guān)注點
要了解Cortex-A55的真正潛力,我們先簡單回顧一下它的上一代:ARM Cortex-A53。使用這款CPU的設(shè)備超過15億臺,依然是當今業(yè)界出貨量最高的64位Cortex-A系列CPU。Cortex-A53于2012年發(fā)布。其獨特的設(shè)計結(jié)合了性能、低功耗和可擴展性,并具有一系列的多用途特性,因此可以用于很多市場,包括高端智能手機、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、汽車信息娛樂、高級駕駛員輔助系統(tǒng)、數(shù)字電視、入門級移動設(shè)備、消費類設(shè)備甚至衛(wèi)星。
然而,自2012年以來,我們周圍的世界發(fā)生了許多變化。我們現(xiàn)在看到的新興趨勢表明,在所有事情上都相互聯(lián)系和智能的數(shù)字世界具有巨大的發(fā)展?jié)摿ΑH斯ぶ悄芎蜋C器學習將真正融入我們的日常生活,從完全自主的自動駕駛汽車到各種設(shè)備上的智能應(yīng)用,這已經(jīng)是定局。物聯(lián)網(wǎng)的普及意味著“物”的爆炸式增長,越來越多的“物”繼續(xù)產(chǎn)生數(shù)據(jù)、消費數(shù)據(jù)、與數(shù)據(jù)互動。增強現(xiàn)實、虛擬現(xiàn)實、混合現(xiàn)實注定要徹底改變?nèi)伺c人、人與機器的互動,將現(xiàn)實世界與數(shù)字世界融為一體。
在過去的兩年里,ARM工程師致力于研究Cortex-A53的后續(xù)產(chǎn)品,以滿足這一新技術(shù)的需求。我們的目標是構(gòu)建一個性能、效率和可擴展性都有很大提高的CPU,而這個CPU也需要很多先進的特性來滿足未來從端到云的各種應(yīng)用需求。幸運的是,我們做到了。
整體性能提升
Cortex-A55實現(xiàn)了全面的性能提升
Cortex-A55采用最新的ARMv8.2架構(gòu),基于其前身產(chǎn)品。它在性能方面已經(jīng)超過了極限,同時仍然保持著與Cortex-A53相同的功耗水平。我們盡一切努力改進Cortex-A53,并賦予其以下特性:
在相同的頻率和工藝條件下,內(nèi)存性能可達Cortex-A53的兩倍
在相同的頻率和工藝條件下,性能比Cortex-A53高15%
可擴展性比Cortex-A53高十倍以上
這是因為我們專注于Cortex-A53的現(xiàn)有設(shè)計理念,以及我們對這些理念的挑戰(zhàn):
一個
分支預(yù)測器被完全修改,并且神經(jīng)網(wǎng)絡(luò)元件被結(jié)合到其算法中以改進預(yù)測。此外,還增加了零周期分支預(yù)測器,以進一步減少管道中的泡沫。這樣,空指令之間的空閑時間越來越短。
2
我們的設(shè)計使L2緩存專用于每個CPU,與Cortex-A53相比,L2緩存的訪問時間縮短了50%以上。我們還將L2緩存的工作頻率設(shè)計為與中央處理器相同。通過減少延遲,大大提高各種基準測試工具中的CPU性能。
三
引入L3緩存,集群中所有Cortex-A55 CPU都可以共享。這使DynamIQ集群能夠受益于CPU附近增加的內(nèi)存容量,從而提高性能并降低系統(tǒng)功耗。L3緩存是動態(tài)共享單元的一部分,動態(tài)共享單元是動態(tài)處理器中的一個新功能單元。
四
8位整數(shù)矩陣乘法對神經(jīng)網(wǎng)絡(luò)性能的影響超過85%。Cortex-A55 NEON流水線增加了一條新的架構(gòu)指令,使其能夠在每個周期執(zhí)行16個8位整數(shù)運算。這些新指令還使CPU能夠執(zhí)行8個16位浮點運算,每個周期對兩條MAC指令進行舍入,有利于顏色空之間的轉(zhuǎn)換。
與Cortex-A53相比,性能大幅提升
Cortex-A55在功率和熱效率方面繼續(xù)領(lǐng)先
對分支預(yù)測器、NEON和FP單元的上述改進以及內(nèi)存延遲的減少只是Cortex-A55性能大幅提高的一些原因。Cortex-A55不僅實現(xiàn)了顯著的性能提升,而且保持了與Cortex-A53相似的功耗。總之,Cortex-A55在節(jié)能方面取得了15%的進步。與性能相比,功率在產(chǎn)品設(shè)計中更為重要。同樣的性能,Cortex-A55的功耗比Cortex-A53低30%!
Cortex-A55提供的持續(xù)性能比今天的Cortex-A53解決方案要長得多。這對未來有望主導(dǎo)移動市場的AR、VR、MR中的用戶體驗非常重要。這些應(yīng)用程序都是高度線程化的,并且對延遲有嚴格的要求。后者指的是運動時間延遲。根據(jù)行業(yè)研究,這種延遲需要保持在20毫秒以內(nèi),以免引起惡心和頭暈。雖然現(xiàn)在的CPU已經(jīng)達到了達到20ms延遲所需的性能水平,但是熱量限制意味著這些CPU無法長時間保持這個性能水平。借助Cortex-A55,我們可以為未來延長VR設(shè)備的連續(xù)性能時間提供解決方案。
先進的功能和更高的性能可以滿足基礎(chǔ)架構(gòu)市場的需求
行業(yè)領(lǐng)先的效率使Cortex-A55在基礎(chǔ)設(shè)施市場脫穎而出。以太網(wǎng)供電無線接入點和后視鏡安裝有限加熱的汽車解決方案等應(yīng)用可以使用高熱效率的Cortex-A55,在特定的加熱范圍內(nèi)提供最高的性能。在5G遠程無線電前端,Cortex-A55 CPU也可以在特定的功率范圍內(nèi)最大化網(wǎng)絡(luò)吞吐量。
從一端擴展到云
合適的尺寸和計算性能可以滿足各種要求
除了性能和效率,Cortex-A55的物理芯片尺寸和計算性能也極具擴展性。因此,它包括多個RTL配置選項,這使得可配置的容量是Cortex-A53的十倍。事實上,它有3000多種獨特的配置,使其成為歷史上最具可擴展性的Cortex-A CPU。
Cortex-A55延續(xù)了Cortex-A53的靈活性,有NEON、Crypto、ECC等選項,但也采用了新的實用配置選項。例如,專用L2緩存的可配置容量從64KB到256KB不等,這可以帶來約10%的性能提升。專用L2緩存可以提高性能,無疑會成為很多市場的默認選擇。它還被設(shè)計為一種選項,用于在物聯(lián)網(wǎng)等對尺寸敏感的市場中進一步縮小芯片尺寸。
DynamIQ共享單元新功能的詳細說明
DSU常見于Cortex-A55和Cortex-A75。它包含更多的配置選項,可以根據(jù)用戶自己的應(yīng)用進行定制。例如,CPU之間共享的L3緩存可以從0KB擴展到最大4MB。它還支持通過AMBA 5 ACE或CHI的多用途接口選項,可用于更廣泛的系統(tǒng)。加速器相干端口和低延遲外圍端口也集成到DSU中,這使得緊密耦合的加速器能夠連接到Cortex-A55以處理通用計算。這些特性,加上Cortex-A55的機器學習功能,使得更多的計算能夠在更接近物聯(lián)網(wǎng)網(wǎng)關(guān)的應(yīng)用“端”進行。
它包括許多高級功能,可用于各種新興應(yīng)用
加快人工智能在各個領(lǐng)域的應(yīng)用
人工智能會越來越普及,這不是什么新鮮事。推而廣之,我們的設(shè)備執(zhí)行機器學習任務(wù)將變得非常普遍。片上實現(xiàn)機器學習的方法有很多,但CPU在這方面有獨特的優(yōu)勢。CPU可以進行通用計算,所以可以運行到人工智能應(yīng)用的芯片中。目前機器學習和人工智能不斷被取代,功能固定的硬件不僅價格昂貴,而且對于機器學習來說很容易過時。
Cortex-A55 NEON流水線的改進和新的機器學習指令意味著Cortex-A55在矩陣乘法上的機器學習性能比Cortex-A53高得多。最近發(fā)布的ARM計算庫是針對ARM Cortex-A NEON和Mali GPU IP優(yōu)化的入門級軟件功能集。也可以應(yīng)用到Cortex-A55 NEON上,進一步提高其機器學習性能!
Cortex-A55可以創(chuàng)造一個更安全的自主系統(tǒng)
Cortex-A55還具有高可靠性、可用性和可維護性特性,使其能夠服務(wù)于基礎(chǔ)設(shè)施和汽車等各個領(lǐng)域。對于汽車市場,Cortex-A55的安全性有所提升。它在每一級緩存上提供可選的糾錯碼和奇偶校驗功能,還支持“數(shù)據(jù)中毒”,這可以延遲檢測到的和不可糾正的錯誤,并適用于更靈活的系統(tǒng)。也是第一款Cortex-A系列CPU采用新的設(shè)計工藝,避免系統(tǒng)故障,因此搭配Cortex-R52非常適合ASIL D應(yīng)用。
深度嵌入式高級電源管理功能
高級電源管理功能提高了能效
Cortex-A55有許多新的電源特性,例如,硬件控制的狀態(tài)轉(zhuǎn)換可以更快地從開切換到關(guān)。Cortex-A55還可以根據(jù)當前運行的應(yīng)用自主關(guān)閉L3緩存。對于需要更多內(nèi)存的重型應(yīng)用,如VR,L3緩存將完全打開。但是,對于完全駐留在一級和二級緩存中的輕負載應(yīng)用程序,如音樂播放,三級緩存將被關(guān)閉。此外,對于重負載和輕負載之間的應(yīng)用,有兩種電源模式。
現(xiàn)在還可以創(chuàng)建單個CPU或CPU組,其中每個CPU都位于集群內(nèi)自己獨立的電壓域中,因此可以更精細地動態(tài)增加電壓和頻率。這有兩個主要優(yōu)點:首先,它允許設(shè)計人員進一步調(diào)整系統(tǒng),以實現(xiàn)最佳性能和節(jié)能。其次,這也意味著DynamIQ系統(tǒng)可以更容易、更緊密地匹配設(shè)備多變的加熱極限,從而使其性能最大化。
大的新時代。小加工
大。自2011年問世以來,LITTLE技術(shù)一直是異構(gòu)處理的代名詞。所以現(xiàn)在市面上的安卓ARMv8設(shè)備,三分之二都是靠大的。優(yōu)化功率和性能的小技術(shù)。DynamIQ大。LITTLE是DynamIQ系統(tǒng)中的新一代異構(gòu)計算技術(shù)。
它允許設(shè)計人員創(chuàng)建與Cortex-A75“大型”CPU和Cortex-A55“小型”CPU完全集成的解決方案,這兩種CPU在物理上位于單個CPU集群中。所有軟件線程遷移和由此產(chǎn)生的大小CPU之間的高速緩存窺探現(xiàn)在都發(fā)生在集群中。與Cortex-A73相比,Cortex-A75 CPU可以用于更高頻率的應(yīng)用,同時與Cortex-A55保持連續(xù)的DVFS曲線。這是大的重要設(shè)計要求。小系統(tǒng)。這些特性結(jié)合在一起,與上一代big相比,可以大大提高峰值性能、連續(xù)性能和智能功能。小科技。
DynamIQ大。LITTLE可以帶來更豐富的用戶體驗
如今的中端移動和消費市場通常采用基于Cortex-A53的4核和8核解決方案。但是隨著人工智能、虛擬現(xiàn)實等高級應(yīng)用從高端市場向中端市場滲透,廠商需要以更低的成本提供更高的性能和智能功能。DynamIQ大。LITTLE通過引入新的異構(gòu)CPU配置滿足了這一需求,例如1個Cortex-A75 +3個Cortex-A55 和1個Cortex-A75 +7個Cortex-A55 。這些新的配置可以與4核和8核芯片尺寸相近的Cortex-A55設(shè)計相媲美,可以實現(xiàn)2倍以上的單線程性能。
基礎(chǔ)設(shè)施和移動片上系統(tǒng)設(shè)計指南已經(jīng)發(fā)布
ARM長期以來一直在驗證我們在樣本SoC設(shè)計方面的知識產(chǎn)權(quán)方面投入巨資。隨著ARM的知識產(chǎn)權(quán)組合日益增多,這些樣本系統(tǒng)的復(fù)雜度和范圍也在不斷增加。從SoC架構(gòu)到詳細的產(chǎn)前分析,這項工作涵蓋了所有方面。ARM將以“系統(tǒng)指南”的形式提供這樣的知識。
除了全新的CPU,ARM還提供了各種新的系統(tǒng)指南,涵蓋移動系統(tǒng)和基礎(chǔ)設(shè)施系統(tǒng):
CoreLink SGM-775移動系統(tǒng)系統(tǒng)指南是為Cortex-A75、Cortex-A55和Mali-G72設(shè)計和優(yōu)化的
SGM-775包括文件、模型和軟件,可由ARM合作伙伴免費使用。
基于Cortex-A55的設(shè)備預(yù)計何時上市?
Cortex-A55的最終發(fā)布令人興奮。Cortex-A55在性能、節(jié)能和可擴展性方面的巨大進步,將使其成為ARM出貨量最大的下一代Cortex-A系列CPU。然而,興奮并不止于此。這個生態(tài)系統(tǒng)中的大量ARM合作伙伴已經(jīng)獲得了Cortex-A55的相關(guān)許可。讓我們期待他們將在未來幾個月發(fā)布的新一輪智能計算解決方案。雖然我們無法預(yù)測基于Cortex-A55的設(shè)備將如何呈現(xiàn),但可以肯定的是,從2018年開始,未來將是極其令人興奮的!
聲明:本文轉(zhuǎn)載于網(wǎng)絡(luò),版權(quán)歸原作者所有。如果涉及到作品的版權(quán)問題,請聯(lián)系我們,我們會根據(jù)您提供的版權(quán)證明確認版權(quán)并支付報酬或刪除內(nèi)容。
1.《a55 Cortex-A55,為何它是對未來數(shù)字世界舉足輕重的處理器?》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《a55 Cortex-A55,為何它是對未來數(shù)字世界舉足輕重的處理器?》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/keji/1697635.html