2017年9月,龍芯俱樂部組織團(tuán)購龍芯3A主板。作為關(guān)注龍芯多年的粉絲,我參加了這次團(tuán)購,買了一個(gè)龍芯3A3000主板。鑒于龍芯3A3000處理器即將發(fā)布,對(duì)龍芯3A3000處理器的性能沒有詳細(xì)的評(píng)價(jià),我使用phronix-test-suite對(duì)龍芯3A3000處理器盡可能做出理性、中立、客觀、全面的評(píng)價(jià),不吹毛求疵,不夸大其成就,不避重就輕。
龍芯3A3000主板介紹
首先我們來拍一張照片,回顧一下龍芯3A3000主板的外觀。
圖1:龍芯3A3000主板照片。風(fēng)扇下面是龍芯CPU。另外兩個(gè)散熱器下面是南橋和北橋。
圖2是龍芯3A3000CPU卸下風(fēng)扇后的近照,其中LS3A3000D-LP表示這是龍芯3A3000 CPU的低功耗版本
圖3開機(jī)后BIOS信息,可以看到CPU主頻1400MHZ,一級(jí)指令緩存64KB,一級(jí)數(shù)據(jù)緩存64KB,二級(jí)緩存4MB。
圖4主板上的國(guó)產(chǎn)Unilc (Xi安紫光國(guó)鑫半導(dǎo)體)內(nèi)存條
我得到的龍芯3A3000處理器不是最高性能的1.5GHz主頻版本,而是性能稍低的1.4GHz版本。所以在估計(jì)龍芯3A3000(1.5GHz)的性能時(shí),我應(yīng)該把我的測(cè)試結(jié)果乘以1.07。另外需要注意的是龍芯3A3000筆記本搭載的龍芯3A3000主頻限制在1.2GHZ。
拿到主板后,參考主板手冊(cè)和百度貼吧手冊(cè),在龍芯俱樂部集團(tuán)和龍芯用戶開發(fā)者的幫助下,我安裝了一臺(tái)龍芯3A3000主機(jī),安裝了Debian巴斯特和龍芯操作系統(tǒng)。
作為龍芯的老粉絲,我用過龍符6003和8089D筆記本的龍芯盒,都是用的龍芯2F處理器。從個(gè)人經(jīng)驗(yàn)來看,使用龍芯2F的圖形界面只能說是“可用”,但使用起來還是太慢。相比龍芯2F,龍芯3A3000在性能上有了很大的進(jìn)步,龍芯和德比安在使用上都可以算是真正的流暢。用Firefox瀏覽網(wǎng)頁,看本地高清視頻,非常流暢。從用戶體驗(yàn)來看,龍芯3A3000完全可以滿足辦公、上網(wǎng)、聽音樂、看視頻的基本需求。
龍芯3A3000處理器性能評(píng)估方案
龍芯3A3000與主流x86處理器相比,差距在哪里?從性能上來說,龍芯3A 3000相當(dāng)于哪個(gè)CPU,也就是說3A4000是哪個(gè)處理器要流式傳輸?龍芯3A3000與國(guó)內(nèi)其他處理器相比,性能是高還是低?
為了回答以上問題,我使用了phoronix測(cè)試套件中提供的關(guān)于CPU性能的基準(zhǔn)程序,詳細(xì)對(duì)比了X270筆記本中的i5-7200U處理器和龍芯3A3000處理器。此外,openbenchmarking網(wǎng)站提供了許多不同處理器的性能測(cè)試結(jié)果,可以讓人們更客觀地評(píng)估系統(tǒng)的性能。
我在openbenchmarking網(wǎng)站上找到了騰飛1500A和騰飛2000+處理器的一些評(píng)估結(jié)果,我將在本次測(cè)試中比較這些數(shù)據(jù)。作為參考,我還查找了一些英特爾J1900處理器的性能數(shù)據(jù)。
最近Megacore處理器的性能進(jìn)步很快,已經(jīng)生產(chǎn)了ZX-C、KX-5000、KX-6000等多個(gè)系列的處理器,并在網(wǎng)絡(luò)上進(jìn)行了一些評(píng)測(cè)。但是我在Openbenchmarking網(wǎng)站上沒有找到Megacore最新處理器的任何痕跡,所以本文無法比較Megacore和龍芯的性能。
為了比較同頻兩個(gè)CPU的性能差距,測(cè)試中關(guān)閉了Intel i5-7200U處理器的turbo模式,去掉了自動(dòng)降頻的電源管理,頻率鎖定在2.5GHz,i5-7200U處理器的最大turbo頻率為3.1GHz,因此其實(shí)際峰值性能高于本次測(cè)試的數(shù)據(jù)。
在測(cè)試中,我們同時(shí)關(guān)注處理器的單核性能和多核性能。最近在評(píng)估Megacore KX6000系列處理器時(shí),根據(jù)7等多線程程序的測(cè)試結(jié)果,得出KX6000相當(dāng)于i5-7400處理器,但有意無意忽略了KX6000是8核8線程處理器,而i5-7400是4核4線程處理器。如果看單核性能,KX6000大概是i5-7400的一半。
以下是本次評(píng)測(cè)中幾款處理器基本情況的對(duì)比。
英特爾i5-7200U
https://ark . Intel . com/products/95443/Intel-Core-i5-7200 U-處理器-3M-Cache-高達(dá)-3_10-GHz
英特爾J1900
https://ark . Intel . com/zh-cn/products/78867/Intel-Celeron-Processor-j 1900-2M-Cache-高達(dá)-2_42-GHz
龍芯3A 3000
http://www.loongson.cn/product/cpu/3/3A3000.html
phronix測(cè)試套件的7.8.0版本用于測(cè)試。
http://www.phoronix-test-suite.com/? k =下載
在搭載英特爾i5-7200U處理器的X270筆記本電腦和自組裝龍芯3A3000電腦上進(jìn)行了測(cè)試,龍芯3A3000在Debian測(cè)試系統(tǒng)上進(jìn)行了測(cè)試。測(cè)試環(huán)境如表2所示:
在測(cè)試過程中,我發(fā)現(xiàn)了Loognix系統(tǒng)的一些測(cè)試結(jié)果,懷疑是Loognix實(shí)驗(yàn)室用1.5GHz Loognix 3A 3000處理器進(jìn)行的。所以我不單獨(dú)用Loongnix系統(tǒng)來測(cè)試這個(gè)處理器的性能。
龍芯3A3000使用的編譯器選項(xiàng)請(qǐng)參考此鏈接
對(duì)于某些應(yīng)用,編譯時(shí)采用n32的abi,即加入?yún)?shù)-mabi=n32。
因?yàn)镃PU性能是我最想知道的,所以我主要關(guān)心的是能反映CPU性能的測(cè)試,而不考慮磁盤、顯卡、內(nèi)存等硬件的測(cè)試。
測(cè)試程序介紹和測(cè)試結(jié)果分析
科學(xué)計(jì)算
1.scimark2
本次測(cè)試運(yùn)行的是國(guó)家標(biāo)準(zhǔn)技術(shù)研究院程序員開發(fā)的科學(xué)和數(shù)值計(jì)算基準(zhǔn)SimiMark 2.0的ANSI C版。測(cè)試包括快速傅里葉變換、雅可比連續(xù)過松弛、蒙特卡羅、稀疏矩陣乘法和密集邏輯單元矩陣分解基準(zhǔn)。此測(cè)試是單核性能測(cè)試。
測(cè)試結(jié)果:
單擊此處訪問1
點(diǎn)擊此處訪問2
圖5 sci標(biāo)記2的性能比較
測(cè)試結(jié)果如圖5所示。圖中以龍芯3A3000(紅色)(1.0)的性能為基礎(chǔ),比較i5-7200U(藍(lán)色)和J1900(綠色)與龍芯3A3000的性能,數(shù)值越高性能越好。根據(jù)龍芯發(fā)布的消息,龍芯3A4000同頻性能比3A3000提高30%,主頻將從1.5GHz提高到2.0GHz,另外龍芯3A4000還將增加256位SIMD指令,L3緩存從8MB提高到12MB。SPEC CPU2006的分?jǐn)?shù)會(huì)達(dá)到20分,是龍芯3A3000的兩倍。
http://www . ICT . cas . cn/kycg/cgnb/201709/p 020170926639136974767 . pdf
因此,我們將3A4000的性能設(shè)置為2.0,作為性能預(yù)測(cè)的參考。
從圖5的測(cè)試結(jié)果可以看出,在Scimark的蒙特卡洛測(cè)試中,3A3000的性能非常差,只有i5-7200U的不到10%,甚至還不到J1900的30%。這是很不正常的??赡苡幸环N浮點(diǎn)運(yùn)算是用軟件模擬代替硬件浮點(diǎn)運(yùn)算的。在其他測(cè)試中,3A3000的性能與J1900相當(dāng),有些測(cè)試優(yōu)于J1900。與i5-7200U相比,J1900主頻為1.99GHz,但其單核性能僅為i5-7200U的30%左右。
2.FFTE
FFTE是高橋大輔寫的一個(gè)包,用來計(jì)算序列長(zhǎng)度為(2 p) * (3 q) * (5 r)的1、2、3維離散傅里葉變換。單核性能測(cè)試。
測(cè)試結(jié)果:點(diǎn)擊此處訪問
3.fhourstones
求解Connect-4游戲,測(cè)試處理器的整體性能。單核性能測(cè)試。
測(cè)試結(jié)果:點(diǎn)擊此處訪問
4.gmpbench
用GMP 6.1.2數(shù)學(xué)庫進(jìn)行性能測(cè)試。注意gmpbench只考慮程序的整數(shù)性能,不考慮浮點(diǎn)性能。單核性能測(cè)試。https://gmplib.org/gmpbench.html
測(cè)試結(jié)果:點(diǎn)擊此處訪問
5.隨從
Minion是一個(gè)開源的約束求解器,在設(shè)計(jì)上具有可擴(kuò)展性。單線程性能測(cè)試。
https://constraintmodelling.org/minion/
測(cè)試結(jié)果:點(diǎn)擊此處訪問
6.mpcbench
GNU MPC是復(fù)數(shù)算術(shù)的c庫。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806164-FO-LOONGSON301
多相
這是谷歌多追指針追逐程序的一個(gè)標(biāo)桿。
https://openbenchmarking.org/result/1806120-FO-LS3AMULTI28
圖6 ffte、Fhourstone、Minion、多相性能測(cè)試
在以上測(cè)試中,我們找到了兩個(gè)關(guān)于J1900的測(cè)試數(shù)據(jù),其中ffte性能只有龍芯3A3000的2/3,fhourstone性能是龍芯的1.1倍。從整體性能來看,i5-7200U的上述性能測(cè)試是龍芯3A3000的2倍到4.5倍,集中在2.3倍左右。在這些測(cè)試中,我們預(yù)測(cè)龍芯3A4000的單核性能可以達(dá)到i5-7200U的85%左右。i5-7200U在gmpbench和mpcbench中的性能是龍芯3A3000的4.5倍左右,優(yōu)勢(shì)明顯,可能與數(shù)學(xué)庫或編譯器的優(yōu)化有關(guān)。
8子彈
子彈物理引擎。Bullet是一個(gè)開源物理模擬計(jì)算引擎,世界三大物理模擬引擎之一。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806126-FO-LS3ABULLE82
9.姫野
himeno基準(zhǔn)是壓力泊松的線性解算器,使用點(diǎn)雅可比方法。
https://openbenchmarking.org/result/1806127-FO-LS3A3000H21
10.玩具安全認(rèn)證
這是湯姆·凱瑞甘的簡(jiǎn)單象棋程序TSCP的性能測(cè)試,它有一個(gè)內(nèi)置的性能基準(zhǔn)。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806104-FO-LS3ATSCPD75
圖7子彈,希門諾和TSCP測(cè)試
在這組測(cè)試中,i5-7200U的優(yōu)勢(shì)是明顯的,除了速度是TSCP棋藝測(cè)試3A3000的3.6倍,其他測(cè)試是龍芯3A3000的4倍,甚至是龍芯3A3000子彈碎布測(cè)試的30倍。我們分析了bullet的代碼,發(fā)現(xiàn)X86處理器有很多與SIMD相關(guān)的代碼和匯編語言優(yōu)化。這是bullet在英特爾處理器下運(yùn)行速度快的重要原因。對(duì)于Ragdoll測(cè)試,我們發(fā)現(xiàn)代碼中有很多三角函數(shù),但是龍芯的三角函數(shù)計(jì)算目前是有問題的。它沒有啟用硬件浮點(diǎn),而是使用軟件模擬,因此速度較慢。
11.高性能計(jì)算網(wǎng)關(guān)
由Sandia國(guó)家實(shí)驗(yàn)室開發(fā)的高性能共軛梯度算法是超級(jí)計(jì)算的科學(xué)基準(zhǔn)程序。多線程測(cè)試。
https://openbenchmarking.org/result/1806094-FO-LS3AHPCGD08
https://openbenchmarking.org/result/1806202-FO-LS3AHPCGO04
12.正溴丙烷
NPB,NAS并行基準(zhǔn),是NASA為高端計(jì)算機(jī)系統(tǒng)開發(fā)的基準(zhǔn)。該測(cè)試概要文件目前使用NPB的MPI版本。多線程測(cè)試。
https://openbenchmarking.org/result/1806097-FO-LS3ANPBDE97
13.n皇后區(qū)
N皇后問題求解器的OpenMP版本。問題大小18。多核性能測(cè)試。
https://openbenchmarking.org/result/1806109-FO-LS3ANQUEE29
14.mafft
100個(gè)丙酮酸脫羧酶序列的比較。多線程性能測(cè)試。
https://openbenchmarking.org/result/1806108-FO-LS3AMAFFT56
15.初級(jí)篩
素?cái)?shù)篩選使用高度優(yōu)化的厄拉多塞篩選方法來生成素?cái)?shù)。prime screen基準(zhǔn)測(cè)試CPU L1/L2高速緩存的性能。多線程性能測(cè)試。
https://openbenchmarking.org/result/1806103-FO-LS3APRIME23
圖8 HCCG、NPB、北皇后區(qū)、馬福特和初篩試驗(yàn)
以上測(cè)試為多線程性能測(cè)試,i5-7200U在HPCG測(cè)試中的性能是龍芯3A3000的3.76倍。在NPB測(cè)試中,龍芯在三個(gè)項(xiàng)目上超過了J1900,在另外兩個(gè)項(xiàng)目上不如J1900。在N皇后問題、MAFFT和素?cái)?shù)篩選的測(cè)試中,i5-7200U的性能大約是龍芯3A3000的兩倍。如果龍芯3A4000的性能可以達(dá)到3A3000的兩倍,那么龍芯3A4000在這些測(cè)試中的性能將達(dá)到i5-7200U。還是那句話,這是多線程測(cè)試!
編碼算法
16.博丹
Botan是一個(gè)跨平臺(tái)的C++開源加密庫,支持大部分公共加密算法。(單線程測(cè)試)
https://openbenchmarking.org/result/1806093-FO-LS3ABOTAN50
使用
用GnuPG加密文件,算耗時(shí)。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806105-FO-LS3AGNUPG86
圖9 Botan和Gnupg測(cè)試
在博丹測(cè)試中,龍芯3A3000和i5-7200U在某些項(xiàng)目上的差距約為3倍。在AES的加解密測(cè)試中,AES和i5-7200U的性能相差近80倍!原因是i5-7200U有AES加解密硬件實(shí)現(xiàn),非常高效,而龍芯3A3000沒有這個(gè)功能,或者暫時(shí)用不上。此外,Botan中還有針對(duì)x86的匯編優(yōu)化,在可以使用這些優(yōu)化的測(cè)試中,X86處理器有很大的優(yōu)勢(shì)。
多媒體編碼
18~22.encode-flac,encode-mp3,encode-ogg,encode-opus,encode-wavpack?
將音頻文件轉(zhuǎn)碼為flac、mp3、ogg、opus和wavpack,并計(jì)算所需時(shí)間。
測(cè)試結(jié)果:點(diǎn)擊此處訪問
espeak
在這個(gè)測(cè)試中,用espeak語音合成引擎閱讀《古騰堡科學(xué)大綱》項(xiàng)目并輸出到WAV文件需要多長(zhǎng)時(shí)間?單線程性能測(cè)試。
https://openbenchmarking.org/result/1806148-FO-LS3AESPEA06
24.dcraw
使用DCRAW將多個(gè)高分辨率RAW NEF圖像文件轉(zhuǎn)換為PPM圖像格式,并統(tǒng)計(jì)所需時(shí)間。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806140-FO-LS3ADCRAW96
25.怎樣增添截尾功能
在這次測(cè)試中,mplayer的mencoder編碼器程序和LIVAVCODEC系列用于測(cè)試系統(tǒng)的音頻/視頻編碼。單線程性能測(cè)試。
https://openbenchmarking.org/result/1806145-FO-LS3AMENCO12
26.Vpxenc
這是一個(gè)標(biāo)準(zhǔn)的視頻編碼性能測(cè)試,使用Google的libvpx庫和vpxenc命令實(shí)現(xiàn)VP8/WebM格式編碼。單核性能測(cè)試。
https://openbenchmarking.org/result/1806148-FO-LS3AVPXEN59
圖10多媒體相關(guān)性能測(cè)試
在音視頻壓縮編碼的測(cè)試中,龍芯再次被英特爾處理器擊敗,無論是J1900還是i5-7200U。原因在于優(yōu)化。這些多媒體應(yīng)用已經(jīng)針對(duì)x86處理器進(jìn)行了優(yōu)化,但沒有針對(duì)龍芯處理器。
壓縮算法
27.壓縮-7
用自己的基準(zhǔn)函數(shù)測(cè)試7程序的多線程性能。
https://openbenchmarking.org/result/1806036-FO-LOONGSON337
https://openbenchmarking.org/result/1806230-FO-LS3A7ZIPL48
28.壓縮-g
用tar程序壓縮Linux源碼包,驗(yàn)證g程序的單線程性能。
https://openbenchmarking.org/result/1806039-FO-LS3A3000G15
優(yōu)化的g程序
https://openbenchmarking.org/result/1806056-FO-LS3A3000G52
29.壓縮-pb2
用并行b2算法壓縮Linux內(nèi)核源碼包,統(tǒng)計(jì)所需時(shí)間。多線程程序。
https://openbenchmarking.org/result/1806109-FO-LS3APBZIP29
網(wǎng)絡(luò)應(yīng)用
30.街頭流氓
Apache基準(zhǔn)程序,評(píng)估標(biāo)準(zhǔn)是發(fā)出100萬個(gè)請(qǐng)求和100個(gè)并發(fā)請(qǐng)求,這取決于系統(tǒng)每秒能處理多少。多線程性能測(cè)試。
https://openbenchmarking.org/result/1806159-FO-LS3AAPACH45
31.爵士
模糊測(cè)試。Ebizzy可以生成類似于網(wǎng)絡(luò)服務(wù)器的工作負(fù)載。
https://openbenchmarking.org/result/1806152-FO-LS3AEBIZZ72
32.郵戳
這是NETAPP的一個(gè)基準(zhǔn)測(cè)試,旨在模擬類似于Web和郵件服務(wù)器承擔(dān)的任務(wù)的小文件測(cè)試。這個(gè)測(cè)試配置文件將設(shè)置郵戳為同時(shí)執(zhí)行500個(gè)文件的25,000個(gè)事務(wù),文件大小在5到512千字節(jié)之間。
https://openbenchmarking.org/result/1806151-FO-LS3APOSTM75
圖11壓縮算法和網(wǎng)絡(luò)應(yīng)用測(cè)試
從以上測(cè)試結(jié)果可以看出,龍芯3A3000和J1900在壓縮算法和網(wǎng)絡(luò)應(yīng)用方面性能相近。與i5-7200U處理器相比,差距約為兩倍。需要指出的是,除了g這種單線程測(cè)試外,其他所有測(cè)試都是多線程測(cè)試。
記憶測(cè)試
33.Cachebench
這是Calebench的性能測(cè)試,是LLCBench的一部分。Cachebench用于測(cè)試內(nèi)存和緩存帶寬的性能。
https://openbenchmarking.org/result/1806034-FO-LS3A3000C27
34.流
系統(tǒng)內(nèi)存(RAM)性能基準(zhǔn)測(cè)試。
測(cè)試結(jié)果:點(diǎn)擊此處訪問
圖12內(nèi)存訪問性能測(cè)試
在流測(cè)試和CacheBench測(cè)試中,龍芯3A3000最終實(shí)現(xiàn)了相對(duì)于J1900的整體優(yōu)勢(shì)。另外,除了Cachebench中的兩個(gè)數(shù)據(jù)明顯相當(dāng)于i5-7200U外,龍芯3A3000和i5-7200U的性能在其他測(cè)試內(nèi)容上是相當(dāng)?shù)摹>褪且驗(yàn)辇埿咎幚砥鳉v史上內(nèi)存訪問性能很差,然后花了很大力氣優(yōu)化內(nèi)存訪問??梢灶A(yù)期龍芯3A4000的內(nèi)存訪問性能會(huì)更好。
最后根據(jù)openbenchmarking網(wǎng)站上找到的FT1500A和FT-2000+的數(shù)據(jù),與龍芯3A3000進(jìn)行對(duì)比。
龍芯3A3000的性能基本上優(yōu)于FT1500A,但明顯弱于FT-2000+。與FT1500A相比,F(xiàn)T-2000+的性能有了很大的提高,部分原因是工藝的改進(jìn),從28 nm提高到16nm;部分歸功于建筑的更新。我們預(yù)測(cè)龍芯3A4000在繼續(xù)使用28 nm工藝的前提下,單核性能將能夠媲美甚至超越騰飛2000+處理器。由于騰飛2000+的處理器多達(dá)64核,龍芯在多核性能上要趕上騰飛還有很長(zhǎng)的路要走。
3A3000在蒙特卡洛模擬中出人意料的糟糕表現(xiàn),很可能是因?yàn)槿鄙僖粋€(gè)關(guān)鍵函數(shù)的優(yōu)化。
總結(jié)與展望
縱向看龍芯的發(fā)展,相比龍芯2F,龍芯3A3000的性能進(jìn)步很大。技術(shù)上,從龍芯2F的90納米增加到28納米;龍芯3A3000處理器的。主頻從龍芯2F的800兆赫茲提高到1.5兆赫茲..在用戶的實(shí)際應(yīng)用中,基本可以達(dá)到流暢使用的水平。龍芯3A3000與英特爾處理器相比,綜合性能相當(dāng)于英特爾J1900處理器,單核性能相當(dāng)于英特爾i5-7200U的30%~40%。
通過本文進(jìn)行的34次測(cè)試,我們發(fā)現(xiàn)龍芯3A3000性能不佳的原因如下:
同頻性能弱。從同頻性能來看,龍芯3A3000已經(jīng)超過了J1900,但只有60% ~ 70%的intel i5-7200U。預(yù)計(jì)2019年龍芯3A4000在相同頻率下性能至少提升30%。
主頻太低。這是龍芯處理器不可避免的弱點(diǎn),讓很多粉絲擔(dān)憂。誠(chéng)然,主頻不代表全部性能,但主頻太低是絕對(duì)不可能的。J1900同頻性能弱于龍芯3A3000,但由于其主頻可達(dá)1.99GHz,核心頻率可達(dá)2.4GHz,在多項(xiàng)測(cè)試中已經(jīng)超過龍芯3A3000。Intel i5-7200U基頻達(dá)到2.5GHz,核心頻率可以達(dá)到3.1GHz..騰飛2000+的主頻可以達(dá)到2.2GHz,而Megacore KX-6000的主頻甚至可以達(dá)到3.0GHz,飛信和Megacore處理器在同頻性能上可能弱于龍芯,但在更高的頻率上仍然可以擊敗龍芯3A3000。
龍芯主頻低的原因之一是工藝落后,現(xiàn)在還在用28nm工藝,而Intel,騰飛,Megacore已經(jīng)在用14nm工藝了。根據(jù)龍芯的發(fā)展規(guī)劃,到2020年龍芯將使用14nm工藝拍攝龍芯3C5000,主頻可達(dá)2.5GHz。
系統(tǒng)軟件不夠優(yōu)化。在測(cè)試中發(fā)現(xiàn)三角函數(shù)等數(shù)學(xué)函數(shù)太慢,似乎有些硬件浮點(diǎn)運(yùn)算沒有應(yīng)用,龍芯缺乏優(yōu)化的數(shù)學(xué)函數(shù)庫。AES硬件實(shí)現(xiàn)缺少加密和解密指令。在測(cè)試中,我們發(fā)現(xiàn)使用Debian操作系統(tǒng)、GCC 7.3和1.4GHz龍芯操作系統(tǒng)、GCC 4.9編譯器和1.5GHz龍芯3A3000的測(cè)試基本上是互為優(yōu)的。我們認(rèn)為編譯器優(yōu)化對(duì)于龍芯性能的充分發(fā)揮非常重要。在測(cè)試中,我們還發(fā)現(xiàn)4.14的Linux內(nèi)核相比3.10的Linux內(nèi)核會(huì)有相當(dāng)大的性能提升,龍芯還缺少一個(gè)優(yōu)化的Linux內(nèi)核。
應(yīng)用軟件不夠優(yōu)化。由于MIPS架構(gòu)缺乏軟件生態(tài),各種應(yīng)用軟件缺乏對(duì)MIPS架構(gòu)的優(yōu)化。具體表現(xiàn)就是很多軟件都有針對(duì)X86系統(tǒng)的匯編優(yōu)化。要建立龍芯的生態(tài),充分發(fā)揮龍芯的性能,同等水平的優(yōu)化是不可或缺的。
隨著龍芯未來架構(gòu)的優(yōu)化和主頻的提升,影響龍芯發(fā)展的瓶頸將不再是處理器的性能,而是軟件生態(tài)的構(gòu)建,即系統(tǒng)軟件和應(yīng)用軟件的優(yōu)化。其中各種應(yīng)用軟件的優(yōu)化將是提升龍芯用戶體驗(yàn)的捷徑。其實(shí)龍芯已經(jīng)意識(shí)到了這些問題,并提出向蘋果學(xué)習(xí)“一個(gè)應(yīng)用一個(gè)應(yīng)用,一個(gè)特征一個(gè)特征,一個(gè)像素一個(gè)像素”進(jìn)行優(yōu)化。
目前龍芯3A4000的制膜工作正在進(jìn)行,預(yù)計(jì)2019年初可以看到芯片。在3A4000出現(xiàn)之前,我們預(yù)測(cè)了3A4000的性能。根據(jù)我們的評(píng)估,我們相信3A4000的同頻性能將從i5-7200U的60% ~ 70%提高到80%~90%。2.0GHz的單核性能是i5-7200U的2/3,多線程性能超過i5-7200U。龍芯3A4000和國(guó)內(nèi)其他CPU相比,同頻性能會(huì)超過飛信和Megacore,單核性能也會(huì)超過飛信2000+。但由于3A4000的28 nm技術(shù)落后,且頻率仍然較低(2.0 GHz),龍芯3A4000的綜合性能可能仍無法超過頻率為3.0GHz的兆核KX-6000。如果Megacore KX-6000不能在2019年量產(chǎn)上市,龍芯3A4000可能成為2019年國(guó)內(nèi)能買到的單核性能最強(qiáng)的國(guó)產(chǎn)獨(dú)立處理器。
龍芯處理器與Intel和AMD高性能處理器還有巨大差距,龍芯還有很長(zhǎng)的路要走。我們期待著龍芯在未來采用更好的技術(shù)和優(yōu)化的微架構(gòu),也期待著龍芯在編譯器、數(shù)學(xué)庫、操作系統(tǒng)等系統(tǒng)軟件支持方面有更好的表現(xiàn),構(gòu)建更好的應(yīng)用軟件生態(tài)系統(tǒng),期待著龍芯3A4000、3B 4000和龍芯3C 5000早日成功。
以上評(píng)價(jià)僅由一名普通非計(jì)算機(jī)專業(yè)人員做出,不具有權(quán)威性,水平有限,時(shí)間短,數(shù)據(jù)眾多,難免有錯(cuò)漏。請(qǐng)批評(píng)指正。
用毛主席的話,結(jié)束我的評(píng)價(jià):
“我們正在前進(jìn)。我們正在做一件前人從未做過的極其光榮偉大的事業(yè)。我們的目標(biāo)必須實(shí)現(xiàn)。我們的目標(biāo)一定會(huì)實(shí)現(xiàn)的。”
附錄
各種測(cè)試結(jié)果的總結(jié)
龍芯3A 3000(龍芯):
https://openbenchmarking.org/result/1806113-TR-LSLABSLS380
https://openbenchmarking.org/result/1709288-TR-LOONGSON390
FT1500A:
https://openbenchmarking.org/result/1705187-KH-CPUSCIMAR08
I5-7200u
https://openbenchmarking.org/result/1806175-FO-I57200UDE18
https://openbenchmarking.org/result/1806174-FO-I57200UMU24
https://openbenchmarking.org/result/1806175-FO-I57200URA38
https://openbenchmarking.org/result/1806176-FO-I57200UCO93
https://openbenchmarking.org/result/1806179-FO-I57200UCR30
J1900
https://openbenchmarking.org/result/1404256-PL-1404206PL73
https://openbenchmarking.org/result/1404250-PL-1404206SO61
https://openbenchmarking.org/result/1404268-PL-J1900MULT15
https://openbenchmarking.org/result/1404272-PL-J1900SPEE11
https://openbenchmarking.org/result/1404275-PL-J1900PROC21
1.《a3000 國(guó)產(chǎn)龍芯3A3000處理器性能全面評(píng)測(cè)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請(qǐng)聯(lián)系頁腳下方聯(lián)系方式。
2.《a3000 國(guó)產(chǎn)龍芯3A3000處理器性能全面評(píng)測(cè)》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來源地址,http://f99ss.com/shehui/1624983.html