部署一個(gè)應(yīng)用交付控制器(ADC)的主要任務(wù)就是為了滿足用戶的需求:在95%的情況下,他們需要保證越來越多且越來越嚴(yán)格的應(yīng)用服務(wù)水平(SLA)。為此,我們必須要考慮提高應(yīng)用的可用性。我們不僅利用本地服務(wù)負(fù)載均衡來保證本地服務(wù)器的暢通,還用全局負(fù)載均衡(GSLB)結(jié)合災(zāi)難恢復(fù)站點(diǎn)來縮短全球范圍的故障時(shí)間。另外,提升性能也尤為重要,一些技術(shù)手段可以合理安排由服務(wù)器下達(dá)給ADC的CPU密度級任務(wù)來降低負(fù)載,比如SSL、壓縮和智能緩存。
但即使是在部署最好的ADC解決方案之后,我們?nèi)皂毭鎸ΡO(jiān)控既定SLA的挑戰(zhàn)。檢測某個(gè)應(yīng)用程序的不可用事件看似簡單:觀察其是否有反應(yīng),若無反應(yīng)則發(fā)送一個(gè)錯(cuò)誤消息。一些ADC在應(yīng)用不可用時(shí)會發(fā)出提醒,但為時(shí)已晚。
從另一個(gè)角度而言,應(yīng)用減速很難被檢測到。因?yàn)橛脩舨粫?jīng)常檢測應(yīng)用程序,甚至不知道多長的無反應(yīng)時(shí)間是不正常的,等注意到時(shí)已落后許久。帶來的結(jié)果往往是對業(yè)務(wù)執(zhí)行的嚴(yán)重?fù)p害,甚至降低員工的生產(chǎn)效率,同時(shí)也會影響客戶的滿意度和忠誠度。
為了填補(bǔ)應(yīng)用減速的監(jiān)控盲區(qū),我們需要確定對哪個(gè)節(jié)點(diǎn)進(jìn)行實(shí)時(shí)流量監(jiān)控,對哪個(gè)節(jié)點(diǎn)制定自動執(zhí)行監(jiān)控任務(wù),并且時(shí)刻準(zhǔn)備執(zhí)行。
在接收到應(yīng)用減速提醒,并認(rèn)識維護(hù)用戶體驗(yàn)的重要性后,最痛苦的事情莫過于尋找引起應(yīng)用減速的癥結(jié)所在,而這需要更高級的解決方案。
應(yīng)用性能監(jiān)測系統(tǒng)(APM)是一套精良可視化的工具,它幫助IT管理員們獲取程序的性能指數(shù),并實(shí)時(shí)維護(hù)應(yīng)用的SLA活躍度。它的重要性體現(xiàn)在可為潛在的問題或者是在問題出現(xiàn)的第一時(shí)間訂制積極的解決方案,因?yàn)閱栴}存在之后的被動反應(yīng)會造成嚴(yán)重的經(jīng)濟(jì)損失。
一般說來,制定APM方案可以從以下兩方面考慮:
1.利用運(yùn)行預(yù)置的腳本的綜合工具來瀏覽web應(yīng)用程序并衡量其反應(yīng)時(shí)長或可用性。
2.在每個(gè)應(yīng)用程序服務(wù)器里安裝專用軟件客戶端,收集每個(gè)用戶和服務(wù)器中處理事務(wù)的數(shù)據(jù),并以此衡量性能。
第一個(gè)選擇是廉價(jià)的,要求應(yīng)用的集成度相對較低,只需為每個(gè)應(yīng)用程序運(yùn)行一個(gè)非入侵性的腳本。然而這種方法有很強(qiáng)的局限性:一方面,它只能獲取應(yīng)用程序的狀態(tài),且不是實(shí)時(shí)的;另一方面,它無法改寫數(shù)據(jù)來解決問題。對應(yīng)用程序的實(shí)時(shí)狀況(包括實(shí)際應(yīng)用交易及用戶體驗(yàn))覆蓋度明顯不足。
第二個(gè)選擇提供高端的解決方案,它能夠以每個(gè)實(shí)際用戶或業(yè)務(wù)為單位細(xì)致拆解,進(jìn)行精確的根源分析。它要求前期較高的成本投入,同時(shí)需要和服務(wù)器操作系統(tǒng)的深度整合也會給生產(chǎn)環(huán)境帶來一定的風(fēng)險(xiǎn)。
想像一下,如果你有第三個(gè)選擇會怎樣。它提供的監(jiān)控方案既便捷又經(jīng)濟(jì),同時(shí)更綜合了前兩個(gè)選擇的優(yōu)勢,你的應(yīng)用交付設(shè)備將由這樣的APM工具所支持,它具備如下特性:
•可監(jiān)控各服務(wù)的性能;
•可監(jiān)控用戶與數(shù)據(jù)中心之間的網(wǎng)絡(luò)性能;
•可監(jiān)控實(shí)際用戶體驗(yàn),如響應(yīng)時(shí)間,錯(cuò)誤類型等;
•可識別多用戶,多業(yè)務(wù),以及應(yīng)用裝載之間的關(guān)系映射;
•提供一個(gè)中心APM控制臺,可從多個(gè)數(shù)據(jù)中心的各項(xiàng)應(yīng)用中收集數(shù)據(jù),并將處理過的信息顯示出來;
•可為某個(gè)業(yè)務(wù)或某一組業(yè)務(wù)設(shè)置監(jiān)控策略,一旦超過既定SLA就能給你提醒;
•可提供根源分析的所有相關(guān)信息;
Radware的APM系統(tǒng)是業(yè)內(nèi)領(lǐng)先的。其狀態(tài)收集功能被整合在ADC中,它可以從這個(gè)絕佳位置來監(jiān)督所有服務(wù)和用戶。它還具備先進(jìn)的報(bào)告引擎來生成和傳遞符合人們閱讀習(xí)慣的報(bào)告,在該系統(tǒng)全權(quán)監(jiān)控下,一旦任何應(yīng)用的SLA有誤差,就會發(fā)出警告。
當(dāng)IT管理員捧著扔過來的性能數(shù)據(jù),被要求去查明是否存在問題、問題的癥結(jié)何在時(shí),不會再手足無措。Radware的APM系統(tǒng)可將縱向挖掘的數(shù)據(jù),與應(yīng)用裝載狀態(tài),數(shù)據(jù)中心、網(wǎng)絡(luò)和用戶之間的延時(shí)曲線等橫向數(shù)據(jù)相結(jié)合,有效分析并定位影響相關(guān)SLA的根源所在。
因此,網(wǎng)絡(luò)管理員不會再聽到應(yīng)用管理員的抱怨,說網(wǎng)絡(luò)有問題再次造成應(yīng)用減速;而應(yīng)用團(tuán)隊(duì)也不會被告知說網(wǎng)絡(luò)是正常的,問題出在應(yīng)用本身。Radware的APM系統(tǒng)提供透明的監(jiān)控方案,讓雙方都可以輕易地發(fā)現(xiàn)在應(yīng)用交付的哪個(gè)環(huán)節(jié)出現(xiàn)問題,哪個(gè)環(huán)節(jié)造成了延時(shí),哪個(gè)環(huán)節(jié)的工作需要完善等,讓各應(yīng)用的SLA和響應(yīng)時(shí)間回歸正常。
Radware的ADC解決方案用全新的且具有歷史意義的途徑來保證各項(xiàng)應(yīng)用的SLA:它提供的工具既支持應(yīng)用的可用性又滿足其加速需求,同時(shí),一個(gè)被整合或嵌入的APM系統(tǒng)可以孵化出最佳的方案,可支持重要應(yīng)用性能監(jiān)控的可視化功能,從而成為應(yīng)用性能持續(xù)優(yōu)化的有力保障。