低調(diào)的中國自主處理器申威:媲美Intel
相對于從誕生之初就處于輿論風口浪尖的龍芯,國內(nèi)另一款走全自主道路的芯片——申威,相比之下就低調(diào)得多。
無論是傳統(tǒng)紙媒還是網(wǎng)絡媒體,申威的曝光率比起龍芯、海思、展訊等國產(chǎn)芯片都要低得多,而且相比于嘲諷天賦技能被點滿的龍芯,申威極少成為網(wǎng)媒和充滿虐氣的網(wǎng)民的攻擊對象。申威的軍方背景更是給它帶一縷神秘的色彩。下面,讓我們一起走進申威,解密申威的“芯”路歷程。
1、申威的誕生
上世紀60-70年代末,中國在高性能計算機領域也曾有過自己的輝煌——哈軍工曾經(jīng)制造出具有分時操作系統(tǒng)和匯編語言、FORTRAN語言及標準程序庫的441B系列計算機。北京大學、北京有線電廠等單位聯(lián)合研制150計算機。清華大學、北京無線電三廠研制生產(chǎn)了130、131、132、135、140、152、153系列計算機近千臺。國防科大成功研制出151計算機,華東計算技術研究所成功研制1001中型集成電路計算機和HDS-9計算機,其中HDS-9計算機每秒運算達500萬次,更為難能可貴的是,這些計算機的軟件和硬件是中國人自己編譯和制造的。
但在80年代因迷信“造不如買、買不如租”、“市場換技術”等理論,放棄了自主芯片的研發(fā)轉(zhuǎn)而大量外購國外芯片。從80年代的銀河1超算開始,到90年代的銀河2、銀河3,曙光系列超級計算機都沒有中國“芯”,在技術上始終受制于人。即使是在幾年前的天河2號上,也只有4096片飛騰1500作為計算節(jié)點前端處理器,而飛騰1500是在SUN的UltraSPARC T2基礎上做的改進版本。
為解決在超算和國防、信息安全無“芯”可用的困境??倕⒅\部第五十六研究所(無錫江南計算技術研究所)于2003年開始著手設計中國人自己的高性能芯片。申威從此踏上了征途。
2、申威的娘家
申威由總參謀部第五十六研究所(無錫江南計算技術研究所)設計,上海高性能集成電路設計中心是56所的馬甲。
該研究所創(chuàng)建于1951年6月,坐落于無錫。主要研究方向有計算機系統(tǒng)結構、并行/分布處理與智能計算機系統(tǒng)、計算機軟件、人工智能與智能控制、計算機與通信、計算機信息處理與應用。八十年代以來,在計算機、通信及機電一體化等領域共榮獲國家、軍隊科學技術成果獎300多項,其中國家科學技術進步特等獎3項,軍隊科學技術進步一等獎35項。1987、2000年,中央軍委兩次為56所榮記集體一等功。1993年中央軍委授予56所“勇攀科技高峰先進研究所”榮譽稱號。
3、申威的指令集和技術淵源
申威屬于Alpha陣營,指令集也是基于Alpha進行擴展。申威的技術來源是于DEC的Alpha 21164。DEC的技術實力很強,Alpha性能更是驚艷,AMD就曾經(jīng)購買了Alpha 21264的技術資料,挖走了部分DEC的技術人員后,開發(fā)出自己的K7微結構。
DEC是技術實力比人強,但商業(yè)模式不如人而失敗的典型例子,Alpha也被幾經(jīng)轉(zhuǎn)手,先被康柏收購,后被惠普雪藏。目前Alpha已經(jīng)被束之高閣,指令集和微結構都已經(jīng)不再更新,技術專利大多已過期或快過期了。申威是目前Alpha陣營中僅存的碩果,擁有自主擴展指令和發(fā)展路線的自主權。
4、自主可控體系構建
申威和龍芯作為國內(nèi)碩果僅存的兩個走自主可控路線的IC設計單位,和龍芯一樣在積極構建自己的軟硬件體系以保障從軟件和硬件兩個方面實現(xiàn)安全可控。申威開發(fā)了自己的神威睿智編譯器,研發(fā)了基于Linux的神威睿思操作系統(tǒng)。加上超算領域不像PC領域那樣存在軟件生態(tài)的掣肘,申威構建自主技術體系的道路可謂一片坦途——于2012年9月投入使用的神威藍光超算使用了8704片申威1600,搭載神威睿思操作系統(tǒng),實現(xiàn)了軟件和硬件全部國產(chǎn)化。
5、申威歷程
56所(江南所)以Alpha指令集為基礎,擴展出自己的指令集,并在2006年設計出具有自主微結構的申威1,申威1是一款130nm制程工藝的單核心CPU,主頻900MHz,集成5700萬晶體管。2008年完成的申威2,是一款130nm制程工藝的雙核CPU,主頻1.4GHz。
如果說申威1和申威2更像是56所磨礪技藝的作品,是對Alpha21164技術的消化吸收,那么2010年研發(fā)的申威1600則是56將國外技術融會貫通后,推陳出新的產(chǎn)品。申威1600是一款65nm制程工藝的16核CPU,主頻1.1G,雙精浮點140G。申威1600被用于神威藍光超算。
也許是因Alpha當年強悍的性能,本人對源自Alpha的申威抱有很高的期望。但根據(jù)國家高性能集成電路設計中心公布的論文顯示,申威1600的SPEC2000測試分數(shù)只能說是差強人意,唯有性能功耗比和LINPACK測試聊以自慰。平心而論,雖然申威1600處理器的單核性能有限,但16核的可擴展性很好,實現(xiàn)了比較理想的多核性能加速比。
2012年,56所研制出申威1610和申威410,申威1610為40nm制程的16核CPU,集成10億晶體管,主頻1.6G,最大功耗50W,雙精浮點運算200G。申威410為40nm制程的4核CPU,集成2.7億晶體管,主頻1.6G。前者用于服務器,后者用于PC,支持中標麒麟操作系統(tǒng)。這兩款產(chǎn)品同樣遭遇了龍芯在PC市場遇到的軟件生態(tài)貧乏和產(chǎn)業(yè)聯(lián)盟弱小導致產(chǎn)品缺乏市場競爭力的困境,加上申威410單核性能太弱,搭載申威410的安全可信PC基本不具備在民用PC市場的競爭力。
2014年底,申威5成功流片。根據(jù)一篇由坐落于無錫的數(shù)字工程與先進技術國家重點實驗室和坐落于北京的國家并行計算機工程技術研究中心聯(lián)合發(fā)布的論文,申威5很有可能是一款集成了4個管理核心和256個運算核心的高性能眾核CPU,雙精浮點運算超過1T,核內(nèi) linpack效率93%,并有很高的性能功耗比。
6、神威藍光超算
神威藍光超算總投資6億元,于2012年9月投入使用。神威藍光超級計算機使用了8704片申威1600,搭載神威睿思操作系統(tǒng),實現(xiàn)了軟件和硬件全部國產(chǎn)化。神威藍光超算峰值計算性能1PFlops(一千萬億次每秒),持續(xù)性能為0.796PFlops,性能功耗比超過741MFlops/W(百萬次浮點運算/秒?瓦),LINPACK效率為74%。
神威藍光超算有以下特點:
一是全部使用申威1600芯片,搭載神威睿思操作系統(tǒng),實現(xiàn)軟件和硬件全部國產(chǎn)化;
二是穩(wěn)定性較好,測試Linpack 全過程9個多小時無故障;
三是液冷系統(tǒng)高效可靠,冷卻劑在冷板內(nèi)部的封閉水循環(huán)帶走主板熱量,環(huán)保且無噪音;
四是高密度封裝,一個機倉可裝入1024個CPU;
五是整機功耗低,性能功耗比高。神威藍光超算性能功耗比超過741MFlops/W,整機功耗1W;天河1號超算性能功耗比431.7 MFlops/ W,整機功耗4W。
六是整機效率高。神威藍光超算LINPACK在不同規(guī)模下的效率:單處理器核80.28%,單CPU 75.20%,單機艙75.07%,整機74.37%。神威藍光超算整機效率與曾經(jīng)是美國最快的計算機美洲虎超級計算機效率相當。
據(jù)統(tǒng)計,“國家超級計算濟南中心”有注冊用戶超過100個,移植優(yōu)化60多道重點應用課題,其中能夠達到上萬核并行規(guī)模的應用課題達16個,有應用成果的課題超過15個,系統(tǒng)利用率已超過60%。目前主要面向氣象氣候、海洋環(huán)境、生物醫(yī)藥、信息安全、航空航天、材料物理、金融分析、工業(yè)設計、石油物探等應用領域。
新一代神威超算
無錫市人民政府于2013年就成立了以市長為組長,副市長為副組長的國家超級計算無錫中心建設領導小組,積極籌備新一代神威超算建設。2015年4月,官方成立了無錫恒鼎超級計算中心有限公司作為國家超級計算(無錫)中心的建設和運營主體,56所成立了項目指揮組及總師組負責解決超算建設過程中的技術問題。
目前,新一代神威超算主機系統(tǒng)軟件正在調(diào)試中,整機系統(tǒng)設計計劃于2015年年底公布。新超算總投資18億元,計劃在 2017-2018年建成,運算能力將達到100PFlops,計算性能有望沖擊世界第一。
神威MPP機
神威MPP機是國家并行計算機工程技術研究中心研制的面向千萬億級以上規(guī)模的高性能計算機,能通過虛擬化技術、網(wǎng)格計算技術和云存儲技術在服務層虛擬出多種計算和存儲服務形態(tài)。
神威MPP機硬件系統(tǒng)由高速運算系統(tǒng)、互連網(wǎng)絡系統(tǒng)、海量存儲系統(tǒng)、維護監(jiān)控系統(tǒng)、電源系統(tǒng)、冷卻系統(tǒng)和結構組裝設計等部分組成。軟件系統(tǒng)主要包括“神威睿思”操作系統(tǒng)、“神威睿智”編譯器、基礎庫等。
系統(tǒng)投入使用以來,已經(jīng)成功移植了包括氣候氣象、海洋科學、新藥研制、生物信息、航空航天、工業(yè)設計、金融分析等重點應用領域的近二十道萬核以上并行規(guī)模的實際應用課題,取得若干重大應用成果。
6神威Cluster是在匯集神威MPP機的技術優(yōu)點基礎上,專門為科學和工程計算領域設計開發(fā)的高性能計算平臺。在氣候氣象、海洋環(huán)境、數(shù)值風洞、碰撞仿真、蛋白質(zhì)折疊、基因研究、新藥研發(fā)、分子動力學模擬、量子化學計算、材料科學、芯片設計、動漫設計、工業(yè)設計等方面用途廣泛。神威Cluster系統(tǒng)的通用結構如下圖:
7、安全可信PC
神威安全可信PC是搭載申威410,針對有較高安全需求的黨政軍單位,元器件實現(xiàn)100%國產(chǎn)化。內(nèi)嵌的國產(chǎn)外圍套片,集成了符合國家標準的可信密碼模塊,實現(xiàn)系統(tǒng)內(nèi)嵌式可信引導和軟件系統(tǒng)的可信度量,保證系統(tǒng)的安全可信。
因申威410單核性能太弱,軟件生態(tài)極度貧乏,僅限于滿足特殊部門使用。如果說龍芯還是在從安全市場往民用市場方向發(fā)展的話,申威從頭到尾壓根就沒考慮過民用市場,完全是自己關起門來自己玩。
神威云是國家并行計算機工程技術研究中心研發(fā)的云產(chǎn)品,能夠提供豐富的云產(chǎn)品套件、開放的API接口、全面的資源管理平臺和運維監(jiān)視平臺,具有強大的虛擬資源池管理能力。神威云平臺采用商用服務器、高速網(wǎng)絡、高性能存儲設備,結合神威云平臺系列軟件搭建。具有功能強大、性能穩(wěn)定、安全可靠、簡單好用的特點。
9、小結
雖然申威和龍芯一樣是走獨立自主路線,但申威的道路要比龍芯平坦得多:首先,國家對龍芯的投入非常有限,而且龍芯自2010年市場化運營后完全自主經(jīng)營,自負盈虧。申威是軍方項目,不僅不用面對IC設計公司最頭痛的技術人才流失問題,還能在人力物力財力可以得到軍方充足保障。
其次,申威專注于超算領域,不存在龍芯在PC市場遇到的軟件生態(tài)貧乏和產(chǎn)業(yè)聯(lián)盟弱小導致產(chǎn)品缺乏市場競爭力的困境。申威有自己的指令集、微結構、CPU、編譯器、操作系統(tǒng)就足以在超算領域立足。而龍芯則被軟件生態(tài)貧乏和產(chǎn)業(yè)聯(lián)盟弱小掣肘。但申威專注于超算領域也帶來一個缺憾,就是在和人民群眾最息息相關的民用PC市場,我們可能永遠看不到申威的產(chǎn)品了。
最后,申威是軍方項目,而神威超算更是國家級工程,申威的軟件和硬件產(chǎn)品完全可以在體制內(nèi)完成內(nèi)部循環(huán)。而龍芯的很多產(chǎn)品必須到商業(yè)市場上去拼殺。
申威自2003年誕生以來,基于Alpha自主擴展了指令集,共設計了申威1、申威2、申威1600、申威1610、申威5五款芯片,自主研發(fā)了神威睿智編譯器和神威睿思操作系統(tǒng),推出了搭載申威芯片的PC、服務器、高性能計算機、超算、防火墻、機架式存儲服務器、大規(guī)模集群存儲系統(tǒng)、瘦客戶端、QDR HCA卡、神威云等產(chǎn)品,為國家信息安全和超算建設竭盡所能,圓滿完成了國家交付的任務。
下一篇:沒有了!