一、FSB正離我們遠(yuǎn)去
眾所周之,前端總線(Front Side Bus,簡(jiǎn)稱FSB)是將CPU中央處理器連接到北橋芯片的系統(tǒng)總線,它是CPU和外界交換數(shù)據(jù)的主要通道。前端總線的數(shù)據(jù)傳輸能力對(duì)計(jì)算機(jī)整體性能影響很大,如果沒有足夠帶寬的前端總線,即使配備再強(qiáng)勁的CPU,用戶也不會(huì)感覺到計(jì)算機(jī)整體速度的明顯提升。
目前intel處理器主流的前端總線頻率有800MHz、1066MHz、1333MHz幾種,而就在2007年11月,intel再度將處理器的前端總線頻率提升至1600MHz(默認(rèn)外頻400MHz),這比2003年最高的800MHzFSB總線頻率整整提升了一倍。這樣高的前端總線頻率,其帶寬多大呢?前端總線為1333MHz時(shí),處理器與北橋之間的帶寬為10.67GB/s,而提升到1600MHz能達(dá)到12.8GB/s,增加了20%。
雖然intel處理器的前端總線頻率看起來已經(jīng)很高,但與同時(shí)不斷提升的內(nèi)存頻率、高性能顯卡(特別是雙或多顯卡系統(tǒng))相比,CPU與芯片組存在的前端總線瓶頸仍未根本改變。例如1333MHz的FSB所提供的內(nèi)存帶寬是1333MHz×64bit/8=10667MB/s=10.67GB/s,與雙通道的DDR2-667內(nèi)存剛好匹配,但如果使用雙通道的DDR2-800、DDR2-1066的內(nèi)存,這時(shí)FSB的帶寬就小于內(nèi)存的帶寬。更不用說和未來的三通道和更高頻率的DDR3內(nèi)存搭配了(Nehalem平臺(tái)三通道DDR3-1333內(nèi)存的帶寬可達(dá)32GB/s)。
與AMD的HyperTransport(HT)總線技術(shù)相比,F(xiàn)SB的帶寬瓶頸也很明顯。HT作為AMD CPU上廣為應(yīng)用的一種端到端的總線技術(shù),它可在內(nèi)存控制器、磁盤控制器以及PCI-E總線控制器之間提供更高的數(shù)據(jù)傳輸帶寬。HT1.0在雙向32bit模式的總線帶寬為12.8GB/s,其帶寬便可匹敵目前最新的FSB帶寬。2004年AMD推出的HT2.0規(guī)格,最大帶寬又由1.0的12.8GB/s提升到了22.4GB/s。而最新的HT3.0又將工作頻率從HT2.0最高的1.4GHz提高到了2.6GHz,提升幅度幾乎又達(dá)到了一倍。這樣,HT3.0在2.6GHz高頻率32bit高位寬運(yùn)行模式下,即可提供高達(dá)41.6GB/s的總線帶寬(即使在16bit的位寬下也能提供20.8GB/s 帶寬),相比FSB優(yōu)勢(shì)明顯,應(yīng)付未來兩年內(nèi)內(nèi)存、顯卡和處理器的升級(jí)需要也沒有問題。
面對(duì)這種帶寬上的劣勢(shì),雖然intel通過對(duì)市場(chǎng)的準(zhǔn)確把握,以及其他優(yōu)勢(shì)技術(shù)上的彌補(bǔ)(如指令集優(yōu)勢(shì)、如CPU效率上intel的酷睿2雙核共享二級(jí)緩存互聯(lián)架構(gòu)要明顯優(yōu)于AMD HT互聯(lián)下的的雙核架構(gòu)等等),讓AMD的帶寬優(yōu)勢(shì)并沒有因此轉(zhuǎn)化為勝勢(shì),但intel要想改變這種處理器和北橋設(shè)備之間帶寬捉襟見肘的情況,縱使在現(xiàn)可在技術(shù)上將FSB頻率進(jìn)一步提高到2133MHz,也難以應(yīng)付未來DDR3內(nèi)存及多顯卡系統(tǒng)所帶來的帶寬需求。Intel推出新的總線技術(shù)勢(shì)在必行。 二、當(dāng)世界失去FSB我們還有QPI
Intel自身也清醒的認(rèn)識(shí)到,要想在通過單純提高處理器的外頻和FSB,也難以像以前那樣帶來更好的性能提升。采用全新的Nehalem架構(gòu)的intel下一代CPU讓我們看到了英特爾變革的決心。目前已經(jīng)正式發(fā)布,基于該架構(gòu)的代號(hào)為Boomfield第一款處理器,我們可以看見很多很多技術(shù)的細(xì)節(jié)——該處理器擁有全新的規(guī)格和性能,采用全新的LGA 1366接口,45nm制程,集成三通道DDR3內(nèi)存控制器(支持DDR3 800/1066/1333/1600內(nèi)存規(guī)格),使用新總線QPI與處理器進(jìn)行連接,支持SMT(Simultaneous Muti-hreading,單顆處理器就可以支持8線程并行技術(shù))多線程技術(shù),支持SSE4.2指令集(增加了7條新的SSE4指令),是intel第一款原生四核處理器……
當(dāng)然,在其擁有的眾多技術(shù)中,最引人注目的應(yīng)該還是QPI(原先宣傳的CSI總線)總線技術(shù),他是全新的Nahalem架構(gòu)之所以能在架構(gòu)、功能和性能上取得大突破的關(guān)鍵性技術(shù)。
三、QPI能給我們帶來什么
QPI(Quick Path Interconnect)——"快速通道互聯(lián)",取代前端總線(FSB)的一種點(diǎn)到點(diǎn)連接技術(shù),20位寬的QPI連接其帶寬可達(dá)驚人的每秒25.6GB,遠(yuǎn)非FSB可比。QPI最初能夠發(fā)放異彩的是支持多個(gè)處理器的服務(wù)器平臺(tái),QPI可以用于多處理器之間的互聯(lián)。
1. QPI是通信更加方便
QPI是在處理器中集成內(nèi)存控制器的體系架構(gòu),主要用于處理器之間和系統(tǒng)組件之間的互聯(lián)通信(諸如I/O)。他拋棄了沿用多年的的FSB,CPU可直接通過內(nèi)存控制器訪問內(nèi)存資源,而不是以前繁雜的“前端總線——北橋——內(nèi)存控制器”模式。并且,與AMD在主流的多核處理器上采用的4HT3(4根傳輸線路,兩根用于數(shù)據(jù)發(fā)送,兩個(gè)用于數(shù)據(jù)接收)連接方式不同,英特爾采用了4+1 QPI互聯(lián)方式(4針對(duì)處理器,1針對(duì)I/O設(shè)計(jì)),這樣多處理器的每個(gè)處理器都能直接與物理內(nèi)存相連,每個(gè)處理器之間也能彼此互聯(lián)來充分利用不同的內(nèi)存,可以讓多處理器的等待時(shí)間變短(訪問延遲可以下降50%以上),只用一個(gè)內(nèi)存插槽就能實(shí)現(xiàn)與四路AMD皓龍?zhí)幚砥鳎ˋMD在服務(wù)器領(lǐng)域的處理器,與intel至強(qiáng)同等產(chǎn)品定位)同等帶寬。
2. QPI、處理器間峰值帶寬可達(dá)96GB/s
在intel高端的安騰處理器系統(tǒng)中,QPI高速互聯(lián)方式使得CPU與CPU之間的峰值帶寬可達(dá)96GB/s,峰值內(nèi)存帶寬可達(dá)34GB/s。這主要在于QPI采用了與PCI-E類似的點(diǎn)對(duì)點(diǎn)設(shè)計(jì),包括一對(duì)線路,分別負(fù)責(zé)數(shù)據(jù)發(fā)送和接收,每一條通路可傳送20bit數(shù)據(jù)。這就意味著即便是最早的QPI標(biāo)準(zhǔn),其傳輸速度也能達(dá)到6.4GB/s——總計(jì)帶寬可達(dá)到25.6GB/s(為FSB 1600MHz的12.8GB/S的兩倍)。這樣的帶寬已可媲美AMD目前的總線解決方案,能滿足未來CPU與CPU、CPU與芯片的數(shù)據(jù)傳輸要求。
3. 多核間互傳資料不用經(jīng)過芯片組
QPI總線可實(shí)現(xiàn)多核處理器內(nèi)部的直接互聯(lián),而無須像以前那樣還要再經(jīng)過FSB進(jìn)行連接。例如,針對(duì)服務(wù)器的Nehalem架構(gòu)的處理器擁有至少4組QPI傳輸,可至少組成包括4顆處理器的4路高端服務(wù)器系統(tǒng)(也就是16顆運(yùn)算內(nèi)核至少32線程并行運(yùn)作)。而且在多處理器作業(yè)下,每顆處理器可以互相傳送資料,并不需要經(jīng)過芯片組,從而大幅提升整體系統(tǒng)性能。隨著未來Nehalem架構(gòu)的處理器集成內(nèi)存控制器、PCI-E 2.0圖形接口乃至圖形核心的出現(xiàn),QPI架構(gòu)的優(yōu)勢(shì)見進(jìn)一步發(fā)揮出來。
4. QPI互聯(lián)架構(gòu)本身具有升級(jí)性
QPI采用串聯(lián)方式作為訊號(hào)的傳送,采用了LVDS(低電壓差分信號(hào)技術(shù),主要用于高速數(shù)字信號(hào)互聯(lián),使信號(hào)能以幾百M(fèi)bps以上的速率傳輸)信號(hào)技術(shù),可保證在高頻率下仍能保持穩(wěn)定性。QPI擁有更低的延遲及更好的架構(gòu),將包括集成的存儲(chǔ)器控制器以及系統(tǒng)組件間的通信鏈路。
5. QPI總線架構(gòu)具備可靠性和性能
可靠性、實(shí)用性和適用性特點(diǎn)為QPI的高可用性提供了保證。比如鏈接級(jí)循環(huán)冗余碼驗(yàn)證(CRC)。出現(xiàn)時(shí)鐘密碼故障時(shí),時(shí)鐘能自動(dòng)改路發(fā)送到數(shù)據(jù)信道。QPI還具備熱插拔。深度改良的微架構(gòu)、集成內(nèi)存控制器設(shè)計(jì)以及QPI直接技術(shù),令Nehalem擁有更出色的執(zhí)行效率,在單線程同頻率下,Nehalem擁有更為出色的執(zhí)行效率,在單線程同頻率條件下,Nehalem的運(yùn)算能力在相同功耗下比現(xiàn)行的Penryn架構(gòu)的效能可能提高30%。