當前位置: 華文問答 > 數碼

華為有什麽黑科技?

2015-09-21數碼

看了群裏大部份的回答,文不對題。

本來是一個技術貼,變成了黑粉和挺粉的水貼了。在2012年之前,雖然華為已經從事了接近10年的終端手機業務,但是如果就華為公司本身的知名度還是沒有跳出通訊的圈子。終端的異軍突起,不僅僅帶來了大量的現金流(做營運商或者大行業客戶的童鞋都知道,原來通訊行業客戶的應收賬款確實是一個頭疼的問題:金額大,周期長,回款慢,而且往往在簽訂合約的時候還有很多苛刻的條件,因此終端業務的崛起對華為的現金流管理是一個非常大的改善),同時確實也大大提高了華為在社會上的品牌度和美譽度,讓華為從一個專業的通訊器材制造商轉變為了一個大眾公司,從以前的幕後走到了前台。

在華為從事研發超過了5年的時間,由於主要從事數通產品的研發,因此我就從自己開發的產品說一下我了解的華為在數通上的黑科技。由於離開華為已經超過了5年的時間了,同時這些技術在華為的宣傳資料上也是可以查閱,因此也不算是有泄密的嫌疑。

在大家不太熟悉的核心骨幹網數通器材上,大家了解的情況一直都是Cisco是名副其實的老大哥,它基本制定了整個數通行業的標準或者是事實標準,包括從協定、器材形態,使用者介面界面、文件標準、測試標準等。目前國內從事數通行業的公司,往往接近80%的公司的命令列形式都是抄襲Cisco的命令列格式,而如果要開發一個協定,基本的開發流程也是:研讀Cisco的產品或者使用者手冊,根據Cisco的技術白皮書梳理業務邏輯,然後結合自己產品的架構特點,再編碼完成的功能。在數通領域還有一個以技術見長的公司叫Juniper,國內公司叫瞻博網絡,研發中心設立在北京,以前在網絡上和瞻博網絡的中國負責人還有過一些交流。Juniper的創始人也是來自於Cisco,至少在營運商的核心網路由器材和交換機器材上,Juniper與Cisco有的一拼。不過後來Juniper收購了Netscreen,在防火墻上的技術實力得到了加強。Netscreen的創業史也是一個神話,幾個華人成立的公司,短短幾年時間做到在美國上市,最終以40億美元的價格,被Juniper收購,一時被傳為佳話。以前Juniper的創始人鄧鋒成立了北極光創投,順利從碼農轉型為投資人,實作了屌絲的逆襲。

交代這些行業背景,其實只是讓讀者了解一下在數通這個江湖上的故事。華為作為在數通行業的追趕者,其實早在1998年的時候,就開始了核心路由器的研發工作。當然采用的模式就是大家熟悉的逆向工程。華為在數通領域知名度的提升還要感謝Cisco的錢伯斯,在2003年的時候,Cisco一紙訴狀,以產品專利侵權之名將華為告上了美國的聯邦法庭,讓當時名不見經轉的華為一時間登上了美國的各個報紙的頭版頭條。當時號稱的世紀大戰,最終以戲劇性的結尾收場。如果做過數通產品研發的童鞋應該都知道,Cisco作為數通產品事實標準的制定者,後來者對其產品技術是否侵權這點本身就是非常難於界定的事情。當然這場戰爭的一個結果,就是華為和3COM的合作,成立了現在在國內數通企業市場非常知名的華三。記得以前剛剛進入公司的時候參加大隊培訓,我們當時還將華三的兄弟看作一家人,大家一起培訓,一起吃飯,一起參加「洗腦」,最後大家離開的時候在抱頭痛哭,分道揚鑣。

華為和Cisco的戰爭的另外一個結果,就是華為按照當時和解的要求,全面修改了華為數通產品的使用者介面,包括了路由器,交換機一些列的產品,做運維的兄弟對這些差別應該很清楚,比如大家都熟悉的Cisco的Show命令,華為就全面修改為了Display命令。後來在工作中又遇到過幾次國外的公司告華為侵權的事情,每次貼心的華為知識產權的MM們(從發文的語氣猜想的)都會大張旗鼓的群發郵件,要求大家把開發的相關的資料進行整理,便於後續如果要應對官司的時候,能夠提供更多的證據。不過基本每次都是雷聲大雨點小,這個漏鬥還沒有機會傳遞到後端的研發部門。

Cisco、Juniper和華為在核心的數通器材領域的競爭一直都很激烈。

Cisco的CRS系列核心路由器

Juniper的Tx系列的核心路由器

華為的Quideway NE系列核心路由器

在IP Core領域,一直以來,各個廠家的升級競爭方式無外乎如下幾種:

1、不斷增強機框硬件平台的背板頻寬能力。

由於核心網器材一般比較昂貴,同時它位於核心網的核心節點上,一旦部署後,出於保護使用者投資或者擴容升級對現網業務影響最小化的考慮,機框硬件平台的轉發效能往往都會超過當前實際的轉發需要一個量級。其中的核心技術是背板的高速總線技術,就是如何透過有限的背板面積,部署更密集的總線,同時克服總線間的時鐘同步,以及高密總線間的訊號影響,從而實作更高的傳輸頻寬。從最高的240G平台,到後來的680G,1T,2T,5T甚至10T平台。硬件平台的背板轉發能力是一個公司硬件硬能力之爭,代表了這個公司在硬件層面上對數碼訊號處理,電氣傳輸特性,布線功力等方面影能力的綜合體現。一般機框硬件平台的更新周期幾本都是以5年甚至更長的時間周期來計算,在我做研發的時候,華為的機框硬件平台能力也就升級過一次。從原來的NE平台升級為了NE-X平台。

從目前華為官網的產品目錄來看,目前主流采用的還是NE-X平台,比如NE40E-8X,16X等。

2、不斷提升業務線卡的轉發能力;

往往核心路由器產品都是框式產品。機框的硬件平台的背板頻寬只是確定了整個硬件平台轉發能力的上限。但是往往當前產品具備的轉發能力則是由線卡的轉發能力確定的。線卡一般分為三部份:介面卡單元、業務處理單元和交換單元。

介面卡單元主要是為了提供更加豐富和多樣的介面能力,在下一個部份我們會介紹。業務處理單元則出要負責進行tcp/ip協定棧報文處理。不過為了保證足夠的處理能力,目前普遍在IP Core都是使用的硬件處理的方式。硬件處理方式也往往采用兩種反式:一種是純硬件處理的方式,比如Cisco的QFP,以及Juniper采用的ASIC芯片。另外一種是偽硬件處理的方式,比如采用早期Intel的IXP系列的可編程處理器或透過可編程邏輯的方式。不過隨著業務處理效能的戰爭的升級,采用偽硬件處理的產品基本已經被更高處理效能的硬件方式完全取代了。交換單元透過背板的接外掛程式,與其他業務單板實作了跨板通訊;這個單元往往負責了報文傳輸中的切片,流量工程,和轉發排程的功能。當然在IP Core器材中,往往采用的交換架構都是采用了CLOS結構,實作每個轉發鏈路的全聯接。

交換套片(為什麽稱為套片,是由於往往交換芯片分為兩個部份,一部份是部署在業務處理板的交換單元,一部份則部署在交換板上,兩部份協同工作以實作高效能的數據交換)是整個交換單元的核心,目前在世界上能夠做出高效能的交換套片的公司還真沒幾家,早起華為在最高端的核心產品上,采用的也是第三方的商業套片,還記得每次開發新產品,和供應商一起測試新的交換套片,踩過多少坑,流過多少血!不過隨著後續華為的芯片能力的提升,後續的產品逐步采用了自研套片後,華為的IP Core產品才算走上了康莊大道。華為在這場戰爭中能夠緊緊跟隨這些數通領域的先鋒,而沒有掉隊,海思的崛起功不可沒;當然海思的崛起,也是由於早期華為采用產品線反哺芯片的戰略密不可分。

華為2拖8集群系統的交換原理

集群系統中使用的交換板:

這些技術,其實哪一項拿出來,都可以算作是真正的黑科技,比起某米總是宣傳的黑科技有技術含量的多。

3、更加豐富和多樣的介面能力;

IP Core器材需要和各種個樣的匯聚層器材對接,同時多種業務均會匯聚到核心器材上,因此核心路由器產品的業務能力就體現在了介面能力的數量、種類的豐富程度和多樣程度上。目前介面卡的技術正在網更高密度的介面卡,以及更大容量的單埠演進的趨勢。

然而無論如何單台器材的能力是有上限的,因此在除了提高單台器材的效能外,另外一種技術方向則是考慮對多台器材的集群。透過在在邏輯上將多台物理器材集群為邏輯上單一的器材,從而實作對介面、業務處理和報文轉發的統一管理,以及效能上的提升,隨著核心網絡組網的扁平化,營運商更高,更強的單一器材的需求越來越強,而如果這是透過單台器材效能的提升,周期太長了。

最早在集群上進行研究的還是Cisco,最早Cisco在CRS實作了1拖4;Juniper則開發了Tx Matrix,支持1拖2的集群。華為在核心路由器集群技術的研究上,其實也並不晚於Cisco和Juniper,很早就實作了1+1的背靠背系統,1+1的背靠背系統雖然實作了控制層面的統一,以及跨框的數據交換,但是其實這種方式還並非是真正的系統集群。為了滿足更高的集群能力的要求,華為啟動了支持背靠背,1拖4,2拖8的核心路由器集群專案,並且最終在2008年的山西太原,實作了2+8集群系統的第一次正式商用。

華為NE5000E的背靠背和1拖4集群系統

華為NE5000E的2拖8集群系統

如果你有機會看到在一個房間裏,擺放的整齊的集群系統,插滿了業務單板,LED燈隨機閃爍,你一定會覺得熱血沸騰,而如果你聽到目錄報價(滿配的2拖8系統目錄報價接近1個億),你肯定也會瞠目結舌,當然實際售價是沒有這麽高的。透過核心路由器的集群,也使得單台器材的轉發效能邁入了10T級別(2009年的水平,現在肯定是更高了)。

到這裏也應該說一下我會提到的華為核心路由器集群技術的黑科技了。

==========================我是黑科技的分界線=====================

大家可能聽說過單機器材的ISSU功能,然而在集群系統上,如何做到帶業務的平滑擴容和升級?這個技術面對四個非常困難的事實:

1、核心路由器位於核心節點,對於帶業務平滑擴容的穩定性和可靠性的要求非常之高;

2、華為的集群系統形態非常多,背靠背、1拖4,2拖8,如果實作各個系統間的平滑升級,尤其是當從單框到背靠背,從背靠背到1拖4或者2拖8,連線方式變化了(單框只需框內數據轉發,而集群系統需要實作跨框數據轉發),交換結構也發生變化了(原來的兩級的轉發架構需要升級為三級的轉發架構)等等。

3、如果升級失敗,如何做到系統回滾,以盡快恢復營運商業務?

4、還需要考慮原有的不支持NE5000E單框系統的平滑擴容問題。

單框擴容為背靠背系統:

這些問題,就我有限知識的了解,不論時Cisco或者Juniper都是沒有設計和解決的。

華為獨創的ISHE(In-service Hardware Expansion)技術,實作了在網的硬件平滑升級。

背靠背擴容為2拖2:

控制層面的連線:

轉發層面的連線:

不過雖然這個技術夠黑,但是由於在真正的在網環境中,升級成功或者失敗直接與某些人的烏紗帽掛鉤,因此這個技術是否會在真實場景中是否使用,還真是一個未知數,但是想大家為了我那些為了這個技術熬夜通宵加班的兄弟們付出的汗水,希望能夠點個贊。

其實經歷了很多的專案,真正的技術黑科技都是大家用腦漿和體力砸出來的。以前我記得自己最喜歡說的一句話就是產品的核心競爭力其實並不是大的架構設計或者某某高明的技術,反而就是大家看似不經意解決的bug,只有踩過了多少坑才曉得一個穩定和優秀的產品的來之不易,所以不論產品如何,希望大家都能對認真做產品的人或者團隊以更多的寬容。