在龍芯完成3A2000之后,雖然在同主頻性能上已經(jīng)優(yōu)于同時(shí)期的技術(shù)引進(jìn)CPU——龍芯GS464E內(nèi)核設(shè)計(jì)非常成功,就性能來(lái)說(shuō),已經(jīng)優(yōu)于同時(shí)期從境外廠商引進(jìn)的X86和ARM CPU核。但由于技術(shù)引進(jìn)的X86和ARM CPU基本采用了臺(tái)積電28nm工藝,優(yōu)于龍芯采用的中芯國(guó)際40nm工藝,因而在主頻上明顯處于優(yōu)勢(shì)。
為了在技術(shù)上超越技術(shù)引進(jìn)CPU,龍芯基于GS464E內(nèi)核開(kāi)發(fā)了龍芯3A3000。3A3000主要通過(guò)工藝優(yōu)化提升性能,對(duì)龍芯3A2000的CPU核略作修改:
一是結(jié)合3A2000的性能瓶頸分析把定點(diǎn)/浮點(diǎn)發(fā)射隊(duì)列從16/24項(xiàng)增加到32/32項(xiàng);
二是把最后一級(jí)Cache從4MB提高到8MB。
因此,CPU內(nèi)核設(shè)計(jì)的工作量較小,很快就完成了RTL源代碼修改,全面展開(kāi)物理設(shè)計(jì)階段。
3A3000物理設(shè)計(jì)中繼續(xù)需要定制包括HT-PHY、DDR-PHY、鎖相環(huán)、多端口寄存器堆、CAM等全定制模塊。
3A3000物理設(shè)計(jì)中另一個(gè)難點(diǎn)是時(shí)序收斂。3A3000使用的28nm FD SOI工藝晶體管確實(shí)比3A2000使用的40nm LL快60%左右,但連線延遲大,而且互相干擾也大,廢了很多周折。物理組在2016年春節(jié)期間也沒(méi)有休息,終于在2016年2月中旬交付流片。
2016年9月,龍芯3A3000成功流片,很快就運(yùn)行了SPEC CPU2000和SPEC CPU2006等大型程序,均未發(fā)現(xiàn)異常。主頻可以達(dá)到1.5GHz左右。進(jìn)一步的測(cè)試結(jié)果比想象的好:
一是內(nèi)存頻率可以達(dá)到750MHz以上,而且信號(hào)眼圖還非常好,STREAM測(cè)試帶寬達(dá)到13GB/s;
二是雖然主頻只提高了50%,但綜合SPEC CPU2006和SPEC CPU2000分值可以提高60%,其中SPEC CPU2006單核分值為定點(diǎn)11分以上、浮點(diǎn)10分以上,四核分值為定點(diǎn)36分,浮點(diǎn)33分;
三是可以運(yùn)行在很低電壓下,例如運(yùn)行在1.0V電壓下主頻1GHz時(shí)功耗還不到3A2000運(yùn)行1GHz時(shí)的一半。對(duì)于黨政辦公中常見(jiàn)的打開(kāi)幾十MB的大文件,3A3000的用戶體驗(yàn)比3A2000有顯著提高。
3A3000研制成功對(duì)自主CPU來(lái)說(shuō)具有里程碑意義。3A3000的通用處理性能已經(jīng)跨過(guò)了國(guó)際通用處理器性能的第一個(gè)門檻,其單核SPEC CPU2006性能已經(jīng)不低于ARM用于服務(wù)器的高端處理器、Intel的低端系列(凌動(dòng)系列)處理器以及威盛處理器,而且3A3000的訪存帶寬達(dá)到13GB,已經(jīng)與AMD以及Intel的高端酷睿系列持平。這樣的性能玩復(fù)雜的3D游戲可能還有差距,但對(duì)于以黨政辦公為代表的事務(wù)處理應(yīng)用是足夠了。
目前,龍芯3A4000已經(jīng)完成設(shè)計(jì),正在流片中。按照以往的經(jīng)驗(yàn),一般半年后就會(huì)有結(jié)果。
根據(jù)在FPGA上的模擬成績(jī)來(lái)看,龍芯在IPC上有望提升30%—40%,在主頻上相對(duì)于龍芯3A3000提升30%左右,達(dá)到1.8—2G。
非??少F的是,龍芯3A3000與龍芯3A4000同樣使用28nm工藝。龍芯3A4000之所以使用28nm工藝的一個(gè)重要原因就是研發(fā)資金匱乏,畢竟,目前國(guó)家核高基01專項(xiàng)重點(diǎn)扶持的是引進(jìn)X86和ARM技術(shù)的CPU公司,對(duì)龍芯的扶持力度微乎其微,龍芯基本拿不到多少國(guó)家經(jīng)費(fèi)扶持。
此前,當(dāng)技術(shù)引進(jìn)CPU普遍使用28nm工藝時(shí),龍芯3A2000依舊在使用中芯國(guó)際的40nm工藝。在制造工藝上落后技術(shù)引進(jìn)CPU 1至2代已經(jīng)是龍芯的常態(tài)了。
不過(guò),使用28nm工藝也有一個(gè)好處,那就是充分展示了龍芯在CPU設(shè)計(jì)上的實(shí)力。由于制造工藝本身沒(méi)有進(jìn)步,這就導(dǎo)致龍芯在IPC上的提升和在主頻上的提升,完全依靠自身的前端設(shè)計(jì)和后端設(shè)計(jì)來(lái)實(shí)現(xiàn)。這與一些在CPU核升級(jí)上完全依賴從外商購(gòu)買,在制造工藝上高度依賴臺(tái)積電先進(jìn)工藝的廠商形成鮮明對(duì)比。對(duì)于馬甲CPU來(lái)說(shuō),龍芯3A3000和龍芯3A4000對(duì)于馬甲CPU來(lái)說(shuō)堪稱打臉的存在。
1.《龍芯3 龍芯3A3000和龍芯3A4000對(duì)于馬甲CPU來(lái)說(shuō)堪稱打臉的存在》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《龍芯3 龍芯3A3000和龍芯3A4000對(duì)于馬甲CPU來(lái)說(shuō)堪稱打臉的存在》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/guonei/62617.html