就在昨天,騰飛CPU服務器、龍芯CPU服務器、神威CPU服務器進入政府采購名單的消息突然炸了整個網(wǎng)絡。這是國內(nèi)CPU服務器首次進入政府采購名單。業(yè)內(nèi)人士普遍認為,這一條目是國內(nèi)CPU企業(yè)發(fā)展的里程碑。本文重點研究國內(nèi)CPU R&D團隊的“三駕馬車”之一——騰飛。
天津騰飛信息技術有限公司
中國R&D對國產(chǎn)CPU和OS的支持始于20世紀90年代的泰山項目。由于各種原因,這個項目不幸流產(chǎn)了。今天,在各種搜索引擎中找不到關于這個項目的文字。然而,失去的計劃為中國未來的CPU研發(fā)留下了一絲火花,這個小小的火花后來演變成了三支國家隊:騰飛、龍芯、神威。近年來,隨著上述三個團隊的不斷努力,以及洪欣、趙信等民營或合資CPU R&D企業(yè)的成立,中芯的水平正逐漸接近國際水平。其中,“騰飛”最引人注目。他不僅開發(fā)了全球首款基于ARM架構的64核CPU“火星”,也是國內(nèi)唯一一家能夠提供從高性能計算芯片(大型)到桌面和嵌入式芯片(小型)產(chǎn)品的CUP企業(yè)。關于騰飛的故事始于火星,火星使他出名。
01戰(zhàn)神火星
沒想到十五年后,他在攻讀碩士學位時取的英文名張朝陽會在一夜之間風靡芯片界。
2015年8月,在知乎、Leifeng.com、Zhiding.com、藝電等國內(nèi)外網(wǎng)絡平臺上。,業(yè)內(nèi)人士前來討論張朝陽在HotChips 2015上的主旨演講Mars: A 64核ARMv8處理器(“Mars:A 64核ARM8兼容微處理器”)。
熱議的第一個原因是,張朝陽的“騰飛團隊”設計的代號為Mars的CUP芯片是世界上第一個基于ARM架構的64核CPU。這個ARM陣營最厲害的CPU居然是由一個低調(diào)的中國團隊設計的,反正是業(yè)內(nèi)爆料;第二個原因是作為第二個受邀站在HotChips舞臺上的中國CPU團隊——第一個是08年的龍芯,代表了整個中國通用CPU芯片七年來的進步,而張朝陽用來舉報的PPT確實很爛。
HotChips大會在國際CPU界堪稱“華山論劍”。從1989年第一屆開始,大會每年都在硅谷的同一個地方舉行(早年是斯坦福大學,近年來是弗林特中心),從來沒有挪過地方。每年都有CPU巨頭和新興企業(yè)通過它向世界展示芯片架構的最新理念。雖然不是第一個站在HotChips舞臺上的中國團隊,“騰飛”創(chuàng)造了一個會議記錄——hot chips歷史上第一個遠程主題報告。
因為倒霉的張朝陽沒拿到美國簽證。
經(jīng)過總結,張成義認為這是PPT失敗的主要因素。無法拿到簽證,團隊放棄了提前參加會議的想法,向會議申請撤回報告。應HotChips的盛情邀請,直到會議前幾天,張成義才決定以遠程報告的形式參加會議。當時,張成義開始急于修改PPT,會議要求提前幾天完成草案,留給他修改PPT的時間很少。第二個原因是缺乏經(jīng)驗。PPT的內(nèi)容分為三個部分。第一部分重點介紹了騰飛獨立處理器內(nèi)核的設計,第二部分重點介紹了整個芯片的片上存儲和互連設計,最后是芯片的物理指標和性能指標。結果第一部分講得太長,導致后面時間不夠。第三個原因是原本調(diào)試好的視頻會議(Google Hangouts)在會議前半小時到了,突然視頻信號無法顯示,就草草改成了語音報告。于是,全世界的同行看著一個簡單丑陋的PPT,聽著一個可憐的中式英語虎頭蛇尾的介紹世界上第一個基于64核ARM的CPU芯片。各種失誤導致現(xiàn)場反應冷淡,受到國內(nèi)同行的深度批評。
張朝陽的PPT網(wǎng)上還是可以找到的
對于張成義來說,這一重要的歷史時刻寫得有些哭笑不得。2015年8月25日,北京時間上午6點,他完成了當時國內(nèi)最強大的通用CPU芯片發(fā)布會,該芯片由騰飛團隊打造。隔壁房間,小學的兒子在微微打呼嚕。
Hotchips上的不良外觀讓騰飛團隊長期受到國內(nèi)業(yè)界的質(zhì)疑。當時“火星”并沒有消失,有人認為是另一家國內(nèi)研究機構在釋放衛(wèi)星,騙取資金。在壓力下,騰飛團隊反應平靜:沒有任何借口,他們繼續(xù)埋頭工作。不同于國內(nèi)一些經(jīng)常在媒體上發(fā)表言論的CPU團隊,騰飛快到了的風格是內(nèi)斂低調(diào)的——“你說你的,我做我的,到時候我們會遇到真家伙”。
一年后,在2016年的夏天,騰飛團隊展示了火星的樣本和服務器原型,并展示了基于火星的企業(yè)級應用解決方案?;鹦窃隍v飛芯片系統(tǒng)中被命名為FT-2000,性能與英特爾的E5服務器芯片相當。這是國產(chǎn)服務器芯片在性能上第一次和Intel平起平坐。換句話說,2016年火星樣本的水平與2014年英特爾服務器芯片的水平大致相當。此時,一年前,嚴酷的懷疑消失了。
火星的主要性能指標
騰飛團隊參加了Hotchips 2016大會
火星采用的微內(nèi)核結構還有一個昵稱“小米”,是中文“小米”的拼音。業(yè)內(nèi)一度懷疑這里的“小米”和雷軍的小米之間的關系。真相與此無關。騰飛R&D團隊的主要成員都是理工科的,所以他們不擅長命名。有一天,領導突然指著隊里的一個設計師說:“你姑娘的外號是小米嗎?我們這一代的微結構叫小米,下一代就換成他家,成成,誰家叫ViVi?就是這樣。”于是乎,下一代微結構就不叫成成了,現(xiàn)在叫大米(大米)。人們經(jīng)常開玩笑:下一代會被稱為米語嗎?
至于名為火星的FT-2000,是精心設計的。上一代騰飛系列芯片采用的SPARC架構源自美國SUN公司?!疤枴狈g成“太陽”。為了表明它的設計離太陽越來越遠,系列芯片的架構代碼都是以太陽系的行星命名的。最早的架構代碼叫“Mecury”,第二代架構叫“Venus”,轉(zhuǎn)換到ARM兼容,就到了第三代架構叫“Earth”,就是FT-1500A。按道理,下一個新建筑應該叫木星,但是團隊很喜歡火星這個名字。直接命名為火星一號和火星二號。
英文名“Mars”在羅馬神話的意思是“戰(zhàn)神”,大概暗示了騰飛人最深刻的愿景:成為通用CPU領域不可戰(zhàn)勝的戰(zhàn)神。
20年的尋找,不變的中文核心
所有看似偶然的“橫空出生”背后,都有不為人知的艱辛。火星也是。為了這個當之無愧的中國核心,騰飛團隊花了二十年。
20世紀90年代末,懷著“為中國打造核心”的夢想,騰飛組建了一支團隊,開始了“中國核心”的研發(fā)。到2006年,騰飛團隊已經(jīng)成功開發(fā)了兩代國產(chǎn)CPU,并在關鍵領域?qū)崿F(xiàn)了大規(guī)模應用?!笆晃濉逼陂g,在國家“核高基金”科技重大項目的支持下,以FT-1000/FT-1000A和FT1500為代表的第三代騰飛CPU進入商業(yè)應用。第三代騰飛CPU采用SPARC指令集架構,但SPARC脆弱的生態(tài)系統(tǒng)無法支持騰飛CPU的大規(guī)模商用。騰飛真正的跨越式發(fā)展始于第四代騰飛CPU的問世,即與ARM指令集研發(fā)兼容的FT-1500A和FT-2000系列CPU。
2011年秋,騰飛項目組在長沙附近的寧鄉(xiāng)縣舉辦的研討會被視為騰飛發(fā)展史上的“遵義會議”。
在那次會議上,只做了一件事:討論騰飛是繼續(xù)沿著SPARC架構前進,還是轉(zhuǎn)向ARM架構。
當時項目組的人力分為兩種,一種是沿著SPARC架構繼續(xù)升級FT-1500微架構的單核性能,另一種是研究ARM指令集。在會上,兩派進行了激烈的辯論。SPARC路由學校認為,F(xiàn)T-1000和FT-1500可以大規(guī)模應用于超級計算領域,也就是屆時將要量產(chǎn)的FT-1500的性能和工藝已經(jīng)在國內(nèi)領先,整體性能正在接近世界最先進的CPU。雖然單核性能低,但團隊已經(jīng)開始了超標量亂序處理器內(nèi)核的設計,初步評估可以大大提高單核性能。這個時候改變架構意味著部分設計工作需要重新發(fā)明,成本太高。ARM路線學校更關注工業(yè)生態(tài)。雖然FT-1500性能優(yōu)異,但很難推廣。在國內(nèi)外,基于SPARC架構的軟硬件生態(tài)幾乎為零,芯片性能也好不到哪里去,沒有可用的軟件,這和廢金屬沒什么區(qū)別。除了為超級計算制造高性能CPU,騰飛還有一個重要的使命,就是為關鍵行業(yè)和領域的自主可控信息系統(tǒng)提供核心芯片,從而推動國內(nèi)集成電路產(chǎn)業(yè)的發(fā)展。ARM的生態(tài)是目前唯一能與x86抗衡的指令集,軟硬件和人才基礎都是SPARC望塵莫及的。經(jīng)過設計評估,與原SPARC芯片升級計劃相比,推出ARM平臺CPU樣片只需多花一年時間,但產(chǎn)業(yè)化推廣可以節(jié)省寶貴的時間。
與會的大領導幾乎是一臉陰沉地聽完了兩派的爭吵。在最后的閉門會議上,經(jīng)過領導和總工程師組的反復比較,他們決定放棄SPARC架構,采用ARM架構。
2014年10月,第一款兼容ARM指令集的CPU FT-1500 a問世,指標相當漂亮,再一次站在了國產(chǎn)CPU的巔峰。通過改變架構,只用了三年左右的時間就開發(fā)出了國內(nèi)領先的通用CPU芯片,在業(yè)界引起了震動。很多同事懷疑FT-1500A根本不是自主開發(fā)的,而是購買了ARM的IP核心許可證——只有這樣才能大大減少研發(fā)時間。
目前國內(nèi)所有通用CPU廠商采用的產(chǎn)品架構都是西方人發(fā)明的,架構的同一個術語就是“指令集”。用哪個指令集與CPU的“自可控性”沒有直接關系。這只是一個設計規(guī)則。廠商根據(jù)這個規(guī)則自行設計芯片(選擇不同的指令集設計CPU大致相當于你寫文章是英文還是中文,使用過程中不同語言的語法規(guī)則是什么)。而IP核授權是指部分或全部芯片設計代碼由他人編寫,然后出售給廠商。如果中間藏著后門,廠家無法得知。
面對質(zhì)疑,騰飛團隊仍然沒有回復。“一場口水戰(zhàn),就是投入人力和時間!當時騰飛公司成立,工作沒有理順。哪里有精力防守?騰飛在2012年底宣布由ARM指令集授權,但相關工作是在2011年開始的。沒有任何準備怎么能貿(mào)然和ARM通話?FT-1500A的研發(fā)時間是三年,外界看來不少于兩年。天津騰飛每個芯片的處理器核心都是自己設計的!!"三年半后,天津騰飛信息技術有限公司(以下簡稱“天津騰飛”)副總經(jīng)理郭玉峰終于吐出了當年被關押的惡靈。
2015年底,“火星”(FT-2000)剛剛完成模擬測試,在發(fā)布之前,惠普全球首席科學家、全球戰(zhàn)略合作副總裁格雷格(Greg)帶領一個團隊前往天津騰飛討論合作事宜,希望將來能在他們的服務器上使用“火星”。目前,百度、阿里等互聯(lián)網(wǎng)公司與天津騰飛有聯(lián)系,希望對騰飛的CPU進行評估,為其在自己的云和數(shù)據(jù)中心的應用做準備。
騰飛轉(zhuǎn)投ARM的初衷之一是為了推動國內(nèi)集成電路產(chǎn)業(yè)的發(fā)展,最終打破英特爾在高端服務器芯片領域的壟斷地位?!盎鹦恰钡恼Q生,讓挑戰(zhàn)英特爾的曙光出現(xiàn)。
雖然火星已經(jīng)達到了與國際主流CPU媲美的性能,但是一個CPU加八個存儲擴展卡的建設成本非常高,導致火星的產(chǎn)業(yè)化不順利。為了進一步降低成本,2017年,騰飛發(fā)布了優(yōu)化升級后的FT-2000+。這款芯片是目前騰飛最好最劃算的產(chǎn)品。它集成了64個新設計的通用微處理器內(nèi)核,保留了大容量片內(nèi)二級緩存,將內(nèi)存控制器升級到8個DDR4,并從片外集成到片內(nèi)??紤]到芯片面積,放棄了三級緩存,對性能有一定影響,但單片機解決方案大大降低了整機成本,提高了整機可靠性,更符合市場需求。這個芯片的誕生,標志著騰飛完成了從科研思維到市場思維的轉(zhuǎn)變。FT-2000+的工作頻率為2.3GHz,雙精度浮點的峰值性能為588.8 GHz,功耗為96W。spec2006的實測性能已經(jīng)達到2014年英特爾至強E5的主流服務器CPU水平,仍然是國內(nèi)性能最高的服務器CPU。同時,使用FT-2000+的整機建造成本比使用FT-2000低50%。
03 CPU自主控制之爭
“中興事件”后,中國人對一個建立在消費級互聯(lián)網(wǎng)上的大國的信心瞬間被“缺乏核心和靈魂”的現(xiàn)實擊碎,“自主可控的信息系統(tǒng)”成為全民關注的焦點。作為信息系統(tǒng)的核心,CPU是否“可自我控制”對國家信息系統(tǒng)安全和工業(yè)系統(tǒng)安全至關重要。
排除CPU生產(chǎn)R&D單元是否滿足安全保密要求、R&D團隊是否本地化這兩個外部條件后,行業(yè)對CPU的獨立可控標準集中在兩個方面:CPU指令集是否可持續(xù)、獨立;CPU核心源代碼是否獨立編寫。目前第二條已經(jīng)形成了統(tǒng)一的認識。如果不能獨立寫核源代碼,就意味著如果別人在設計中插了后門,CPU廠商無法判斷,完全不符合自主可控的要求。
所以爭論的焦點只是CPU指令集是否可持續(xù),是否自主開發(fā)。
指令集是軟件和硬件之間的一組語言規(guī)范。世界上已經(jīng)有不下十個指令集了。經(jīng)過殘酷的市場競爭,通用領域唯一廣泛使用的指令集是英特爾的X86和英國橡子的ARM。由于知識產(chǎn)權的限制,早期的國產(chǎn)CPU沒有辦法在開放領域使用這兩個指令集。早期國產(chǎn)CPU的三駕馬車騰飛、龍芯、神威,不得不分別選擇SPARC指令集、MIPS指令集、ALPHA指令集。這三個指令集之所以能以極低的價格獲得許可(比如SPARC只給騰飛99美元,ALPHA不需要錢),是因為它們的生態(tài)環(huán)境非常脆弱,需要吸引合作伙伴一起建立生態(tài)才能生存。但是近十年來,由于英特爾和ARM的雙重碾壓,SPARC、MIPS和ALPHA的生態(tài)系統(tǒng)一直在衰退,使得使用上述指令集構建國產(chǎn)CPU的生態(tài)環(huán)境非常困難。
2011年,騰飛堅定地轉(zhuǎn)向ARM,他看到了兩個原因:單純依靠政府輸血無法在CPU戰(zhàn)爭中生存。在信息系統(tǒng)領域,商業(yè)競爭高度發(fā)達。在50年的發(fā)展道路上,英特爾與摩托羅拉血戰(zhàn),與微軟聯(lián)手將SUN、SGI、IBM、DEC、惠普等CPU技術學校壓平。期間還順便摧毀了其IA-64,使其成為當今桌面CPU和高端服務器CPU領域的霸主地位。而CPU R&D是一個資金和技術高度密集的領域。2017年,中國在集成電路R&D的總投資約為45億美元,甚至不到英特爾公司每年在R&D投資的50%(數(shù)據(jù)來源:清華大學微電子研究所所長魏少軍教授在半導體2017上的演講)。作為一家只設計芯片而不生產(chǎn)芯片的企業(yè),ARM 2017年在R&D投資超過5億美元。過分強調(diào)指令集的自主開發(fā),可能會導致一個技術上遠離Intel和ARM的企業(yè),依靠一個奄奄一息的指令集重建一個新的生態(tài)系統(tǒng)來挑戰(zhàn)Wintel和AA(Android+ARM),取勝的難度可想而知。自主控制不代表封閉。歷史無數(shù)次證明,封閉會導致落后,挨打會導致淘汰。只有以開放的態(tài)度融入世界主流技術體系,從運行開始,識別機會,逐步占領產(chǎn)業(yè)鏈中的一個或幾個關鍵節(jié)點,做到你我混合,競爭對手難以替代,才是中國CPU相關企業(yè)的生存之道。
魏少軍教授在半導體2017年的演講
騰飛轉(zhuǎn)向ARM系統(tǒng)后,R&D團隊迅速擴張,R&D速度、芯片性能和生態(tài)建設都有明顯提升。不到7年時間,F(xiàn)T-1500A、FT-2000、FT-2000+等一系列高性能CPU產(chǎn)品相繼推出,400多家企業(yè)聯(lián)合打造以騰飛CPU為核心的全自主生態(tài)系統(tǒng)。它涵蓋了高性能計算、服務器、桌面、嵌入式系統(tǒng)等許多應用領域。,為黨政辦公系統(tǒng)、基礎設施關鍵行業(yè)信息系統(tǒng)、云計算和大數(shù)據(jù)平臺、工業(yè)控制系統(tǒng)等諸多領域的本地化替代提供全面的解決方案。騰飛也成為國內(nèi)唯一能提供從高性能計算芯片(大型)到桌面和嵌入式芯片(小型)產(chǎn)品的CUP企業(yè)。憑借其在國際集成電路設計領域的卓越表現(xiàn),騰飛公司被美國EE時報2017“silicon 60”評選為60家最值得關注的半導體和電子創(chuàng)新科技公司之一,并被評為中國前20家集成電路獨角獸企業(yè)。
騰飛中央處理器家用自主可控開關
騰飛CPU+麒麟OS+400聯(lián)盟生態(tài)
盡管跨越式的進步讓騰飛從“核高基地”專項立項之初的參與者成長為領導者,但現(xiàn)實地講,騰飛公司的發(fā)展道路依然充滿艱辛:一是市場化之路依然艱難,西方巨頭數(shù)十年來難以在通用CPU領域殺出一條血路??梢韵胂螅毁u就無法實現(xiàn)自我造血,在燒錢的IC領域也無法可持續(xù)發(fā)展;其次,趕超之路還很艱難。雖然取得了一些進展,但與國際水平仍有巨大差距;第三,發(fā)展道路依然艱難,本土化替代可以作為大力發(fā)展的基礎,但騰飛的野心應該更大?!膀v飛”這個名字是騰飛第一代李國寬教授取的,本意是希望這個團隊能夠幫助中國的信息產(chǎn)業(yè)隨著國產(chǎn)芯片的發(fā)展而騰飛。只有在開放的市場中磨練企業(yè),在新興市場中發(fā)展和建立自己的體系,才能實現(xiàn)能力的快速增長,推動中國信息產(chǎn)業(yè)的發(fā)展。
還有一個困難讓騰飛隊吃了苦頭。面對強大的國際CPU巨頭,弱小的國內(nèi)企業(yè)應該抱團取暖,但事實是有的企業(yè)一有機會就詆毀、攻擊同行。每次騰飛推出新產(chǎn)品,網(wǎng)上總是有惡意的批評。當面對最終客戶和管理組織時,騰飛團隊經(jīng)?;ㄙM大量精力來解釋被競爭對手歪曲的事實。騰飛從未用過這種降價伎倆,他的慷慨甚至贏得了競爭對手的尊重。2018年4月,郭玉峰在北京上星召開了騰飛中央處理器大學校友內(nèi)部分享會。某競爭對手的產(chǎn)品經(jīng)理也去了現(xiàn)場。聽完之后,他給出了三點評價:一、騰飛該隊有深厚的技術積累;第二,騰飛的商業(yè)模式和市場化還有待加強;第三,騰飛是一個胸懷大志的企業(yè),不會在任何場合詆毀對手。
郭玉峰在夏商館的分享會
結局:一生只有一件事
張成義和郭玉峰是大學同學,都有博士學位,一個專攻CPU核心設計和低功耗設計,一個專攻I/O系統(tǒng)設計和全芯片SOC。進入天津騰飛后,郭玉峰擔任主管R&D的副總經(jīng)理,張成義擔任戰(zhàn)略規(guī)劃部總經(jīng)理。站在40歲門檻上的兩個“油膩中年男人”,有一個共同的特點——都自稱有一顆文藝心。張成義稱郭玉峰為“乳臭未干的人”,因為小果會在他的朋友圈里發(fā)一首“老干部的身體”的原創(chuàng)詩,而平調(diào)從來沒有寫對過。但張成義的行動更大。他在大學對面的商住樓買了一套小公寓,和隔壁同事家開了個小清新獨立書店。還好沒有房租,他的月收入勉強支付唯一一個員工的工資。
雖然都是博士頭銜,但感覺更像工程師而不是學者。吳軍博士的暢銷書《浪潮之巔》提到一個觀點,“一級工程師最多能站10個二流工程師。一流的工程師天生就有責任感和好奇心。大部分都是信心滿滿但頭腦空虛。他們直接但不粗魯。他們不會逃避。他們不在乎工作界限,把目標放在團隊而不是自己的任務上?!惫穹逭J為,騰飛團隊的大部分R&D骨干都具有這一特點,這也是騰飛團隊在前期用二三十人的小團隊策動“大”芯片研發(fā)的關鍵。
近年來,“大國重武器”一詞特別流行,但郭玉峰不知道他所做的是否是“大國重武器”。說不,CPU是信息系統(tǒng)的核心,CPU不可能是安全可控的,整個信息系統(tǒng)建設就像是一座建在沙礫上的建筑,隨時都有傾覆的危險;說白了,這個耗費了他二十年青春的晶圓,只有1/4手掌大小,既不“大”,也不“重”?!安灰催@些不相信對方的國內(nèi)主要R&D球隊。其實大家都不容易。幾代人的愿望都集中在這一小塊上。前段時間,梁寧關于國產(chǎn)CPU發(fā)展的一萬字長的文章非常精彩,很多故事我這個資深CPU從業(yè)者都不知道。與本文的前輩相比,我們只能算是第二代了。但幸運的是,我們抓住了一個好時機,踏上了國家自主和控制的浪潮。技術革命有一波發(fā)展。當我們有幸趕上這樣的浪潮,為國家做些有意義的事情時,這是我們研究人員所不能要求的幸福?!?/p>
就在昨天,全網(wǎng)突然打開一條消息:龍芯CPU服務器、騰飛CPU服務器、神威CPU服務器進入政府采購名單。這是國產(chǎn)CPU服務器首次進入政府采購名單,具有里程碑意義。
政府采購和國產(chǎn)芯片相關報告
也許,正如郭玉峰所說,自主可控CPU的上升浪潮即將興起。
1.《飛騰cpu 飛騰,最強中國芯》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《飛騰cpu 飛騰,最強中國芯》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/fangchan/672537.html