問(wèn):能解釋一下什么是雙機(jī)熱備嗎?
答:所謂雙機(jī)熱備,就是將中心服務(wù)器安裝成互為備份的兩臺(tái)服務(wù)器,并且在同一時(shí)間內(nèi)只有一臺(tái)服務(wù)器運(yùn)行。當(dāng)其中運(yùn)行著的一臺(tái)服務(wù)器出現(xiàn)故障無(wú)法啟動(dòng)時(shí),另一臺(tái)備份服務(wù)器會(huì)迅速的自動(dòng)啟動(dòng)并運(yùn)行(一般為2分鐘左右),從而保證整個(gè)網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)行!雙機(jī)熱備的工作機(jī)制實(shí)際上是為整個(gè)網(wǎng)絡(luò)系統(tǒng)的中心服務(wù)器提供了一種故障自動(dòng)恢復(fù)能力。
問(wèn):什么時(shí)候需要雙機(jī)熱備呢?
答:這個(gè)問(wèn)題其實(shí)比較簡(jiǎn)單,一般服務(wù)器要長(zhǎng)年累月的工作,其備份工作就絕對(duì)少不了。所以,決定是否使用雙機(jī)熱備,筆者覺(jué)得應(yīng)首先對(duì)系統(tǒng)的重要性,以及終端用戶對(duì)服務(wù)中斷的容忍程度進(jìn)行考慮,然后再來(lái)決定是否使用雙機(jī)熱備。比如網(wǎng)絡(luò)中的用戶最多能容忍多長(zhǎng)時(shí)間恢復(fù)服務(wù)?如果服務(wù)不能很快恢復(fù)會(huì)造成什么樣的后果等等。
問(wèn):已經(jīng)采取了RAID技術(shù)和數(shù)據(jù)備份技術(shù),還有必要做雙機(jī)熱備嗎?
答:這其實(shí)沒(méi)有個(gè)明確的區(qū)分,RAID和數(shù)據(jù)備份都同等重要!數(shù)據(jù)備份只能解決系統(tǒng)出現(xiàn)問(wèn)題后的恢復(fù);而RAID技術(shù),以筆者的使用經(jīng)驗(yàn)來(lái)看又只能解決硬盤(pán)的問(wèn)題。我們知道,當(dāng)服務(wù)器本身出現(xiàn)問(wèn)題時(shí),不論是設(shè)備的硬件問(wèn)題還是軟件系統(tǒng)的問(wèn)題,都會(huì)造成服務(wù)的中斷,而RAID及數(shù)據(jù)備份技術(shù)恰恰就不能解決避免服務(wù)中斷的問(wèn)題。所以,對(duì)于高安全需求、持續(xù)可靠的提供應(yīng)用服務(wù)的網(wǎng)絡(luò)系統(tǒng)來(lái)說(shuō),雙機(jī)熱備還是非常重要的。其實(shí)我們可以這樣想:如果你的服務(wù)器壞了,你要用多少時(shí)間將其恢復(fù)到能正常工作?這樣你就能理解雙機(jī)熱備的重要性了!
問(wèn):雙機(jī)熱備方案與集群的區(qū)別?
答:從概念上來(lái)講,雙機(jī)熱備屬于集群中的一種。集群一般包括兩類:一類是純應(yīng)用服務(wù)器的集群,即各個(gè)應(yīng)用服務(wù)器都訪問(wèn)統(tǒng)一的數(shù)據(jù)庫(kù)服務(wù)器,但彼些并不需要文件共享存儲(chǔ)等,這種集群是比較簡(jiǎn)單的。另一類是數(shù)據(jù)庫(kù)服務(wù)器的雙機(jī)熱備,這種雙機(jī)熱備實(shí)現(xiàn),一般是兩臺(tái)服務(wù)器同時(shí)使用共享的存儲(chǔ)設(shè)備,并且在普遍的情況下,均采取主、備的方式(也有高端的系統(tǒng)采用并行的方式,即兩臺(tái)服務(wù)器同時(shí)提供服務(wù))。
問(wèn):數(shù)據(jù)庫(kù)服務(wù)如何使用雙機(jī)熱備?
答:通過(guò)軟件方式實(shí)現(xiàn)雙機(jī)熱備。即不采用共享的存儲(chǔ)設(shè)備,而是本機(jī)數(shù)據(jù)可以直接在多臺(tái)主機(jī)間流動(dòng)。顯而易見(jiàn),此種方式最大的優(yōu)點(diǎn)就是節(jié)約了昂貴的存儲(chǔ)設(shè)備投資,而其缺點(diǎn)也不難發(fā)現(xiàn):會(huì)產(chǎn)生數(shù)據(jù)的前后不一致、或者會(huì)影響數(shù)據(jù)庫(kù)讀取的速度。我們看看這樣一個(gè)例子:如果在服務(wù)中斷時(shí)切換到備份服務(wù)器,則可能有少量已經(jīng)在主機(jī)完成的事務(wù)在備機(jī)上尚未實(shí)現(xiàn)。而與備份數(shù)據(jù)的恢復(fù)不同,備機(jī)啟動(dòng)后,后面的操作已經(jīng)進(jìn)行,因此丟失的數(shù)據(jù)包要找回就相當(dāng)難。故此種方式適用于對(duì)于丟失少量數(shù)據(jù)不是非常敏感的系統(tǒng)。
在這兒提一下標(biāo)準(zhǔn)的解決方法,即基于共享存儲(chǔ)設(shè)備和雙機(jī)軟件實(shí)現(xiàn)雙機(jī)熱備。它可以在無(wú)人值守的情況下提供快速的切換,并且不會(huì)有數(shù)據(jù)丟失現(xiàn)象,而購(gòu)買存儲(chǔ)設(shè)備等投資也會(huì)比較高。
問(wèn):如何選擇與實(shí)施雙機(jī)熱備的配置方案?
答:1. 以應(yīng)用為主導(dǎo),進(jìn)行認(rèn)真的分析。以高可用性為宗旨。
2. 考慮是采用數(shù)據(jù)庫(kù)雙機(jī)熱備還是應(yīng)用服務(wù)器集群、還是軟件備份方式。
3. 選擇確定具體的設(shè)備、軟件的型號(hào)等。筆者在這里提醒大家,不同的軟件或是硬盤(pán)等存儲(chǔ)設(shè)備,他們之間存在兼容性的問(wèn)題,因此在購(gòu)買之前應(yīng)咨詢專業(yè)人員,不要出現(xiàn)采購(gòu)了雙機(jī)軟件對(duì)相關(guān)的存儲(chǔ)設(shè)備存在不兼容等現(xiàn)象。
4. 在實(shí)施完成后,一定要進(jìn)行測(cè)試,以確保工作正常,而且應(yīng)注意在運(yùn)行過(guò)程中定期的對(duì)系統(tǒng)是否能夠正常切換進(jìn)行測(cè)試。