提起電信運營商,人們會很自然地想到這樣的一些企業(yè):它們制定電信發(fā)展規(guī)劃,采購網(wǎng)絡和電信設備,鋪設通信管線,調(diào)試開通網(wǎng)絡,為企業(yè)或者個人用戶提供通信服務。傳統(tǒng)意義上,建什么樣的網(wǎng)絡很明顯是和提供什么樣的業(yè)務緊密相關的,比如固網(wǎng)運營商主要提供PSTN、固定寬帶接入以及企業(yè)級的VPN或者專線租用等服務,移動運營商主要提供2G或者3G的移動接入服務。總的來說這些業(yè)務是和特定的網(wǎng)絡相綁定的,而網(wǎng)絡更多的只是一個可靠的管道,它可以用來提供基本的通信服務,并不能靈活地提供增值服務(即業(yè)務)以及相應的加速能力。
在智能終端大行其道的今天,業(yè)務和應用日益復雜繁多,基于網(wǎng)絡提供的連接和通信能力,各種增值服務不斷出現(xiàn)。運營商也只有致力于全業(yè)務的管理和運營,才能滿足未來用戶的直接需求從而獲得商業(yè)上的成功。
觀念的轉(zhuǎn)變
業(yè)務管理的首要環(huán)節(jié)是業(yè)務定制和開通。傳統(tǒng)的業(yè)務支撐系統(tǒng)(BSS)和運維支撐系統(tǒng)(OSS)具備分散的、相對固定的業(yè)務定制和開通能力,由于缺乏體系化的開通支撐,傳統(tǒng)系統(tǒng)的資源管理能力較弱,缺乏客戶/業(yè)務/資源關聯(lián)信息,還不具備全業(yè)務、長流程的自動開通能力。
對于已經(jīng)開通的業(yè)務,傳統(tǒng)OSS的管控以保障網(wǎng)絡資產(chǎn)的穩(wěn)定運行為出發(fā)點。比如,設備和管線能不能工作、有沒有退服或者明顯的性能指標下降是主要關注的方面,但對于網(wǎng)絡上面承載的不同業(yè)務表現(xiàn)的好壞,以及最終使用者的感受和體驗,則沒有精細化和定量的監(jiān)控及保障。此外,傳統(tǒng)OSS側重事后管理,不支持業(yè)務的全生命周期管理。
愛立信參與了全球140多個國家和地區(qū)運營商的電信運營系統(tǒng)的規(guī)劃和改造,認為從網(wǎng)絡管理到業(yè)務管理轉(zhuǎn)變的關鍵在于運維信息化能力的提升,而BSS/OSS必須同步改造,才能實現(xiàn)從業(yè)務定制、開通到客戶業(yè)務保障和投訴處理的全方位業(yè)務管理的協(xié)調(diào)統(tǒng)一。具體來說,下一代OSS(NGOSS)需要達到以下改造目標:第一,支持融合網(wǎng)絡,支撐全業(yè)務開通和變更;第二,支持對業(yè)務的端到端實時綜合監(jiān)控,保障客戶體驗;第三,支持事前維護和端到端分析,主動優(yōu)化業(yè)務質(zhì)量。
支撐全業(yè)務開通和變更
全業(yè)務開通要求OSS具有全面準確的綜合資源管理能力,提供客戶/業(yè)務/資源關聯(lián)信息,支持業(yè)務準確、快速開通,實現(xiàn)網(wǎng)絡資源高效調(diào)度以及網(wǎng)絡數(shù)據(jù)最優(yōu)配置。
傳統(tǒng)的煙囪式OSS服務于專業(yè)網(wǎng)絡,比如無線網(wǎng)、傳輸網(wǎng)、數(shù)據(jù)網(wǎng)等,網(wǎng)絡資源獨立管理。全業(yè)務開通則要求所有與業(yè)務相關的網(wǎng)絡資源能夠統(tǒng)一管理,建立跨專業(yè)資源關聯(lián)關系,實現(xiàn)資源變更的統(tǒng)一管理,支持網(wǎng)絡資源的快速調(diào)度和調(diào)整。這其實也是融合網(wǎng)絡管理的目標之一。有兩種實現(xiàn)資源統(tǒng)一管理的手段:一種是將專業(yè)網(wǎng)絡的資源模型適配到公共模型上,比如采用TMF的共享信息模型(SID),另一種是保留目前的資源模型,同時建立跨專業(yè)關聯(lián)關系,具體實施需要考慮已有設施的類型及廠商的狀況。
全業(yè)務開通還要求實現(xiàn)集團客戶業(yè)務、家庭客戶業(yè)務開通的長流程支撐,實現(xiàn)業(yè)務開通從接收到報竣的全程管理。業(yè)務開通系統(tǒng)在收到客戶的業(yè)務定制請求后,首先會向綜合資源管理系統(tǒng)進行資源申請和查詢,如果網(wǎng)絡資源符合業(yè)務開通要求,業(yè)務開通系統(tǒng)就會生成業(yè)務定制數(shù)據(jù),并下發(fā)到用戶數(shù)據(jù)中心(UDC)或者HSS等。對于需要配置網(wǎng)絡的業(yè)務,業(yè)務開通系統(tǒng)會生成資源調(diào)度單和激活配置單等,OSS會通過設備商的OMC配置網(wǎng)絡資源。業(yè)務和網(wǎng)絡需要具備自動激活能力,實現(xiàn)自動化、批處理的網(wǎng)絡數(shù)據(jù)自動制作和核查,提高業(yè)務實現(xiàn)的時效性。
此外,體系化的業(yè)務開通支撐也是未來OSS發(fā)展的重點。采用統(tǒng)一的開放業(yè)務平臺來提供的業(yè)務可以根據(jù)網(wǎng)絡特點開通在無線或有線甚至多媒體網(wǎng)絡之上,用戶可通過多種接入方式來獲得所需業(yè)務。
業(yè)務定制和部署完成后,在業(yè)務使用過程中,業(yè)務端到端的質(zhì)量保障成為重中之重。這是因為現(xiàn)有的OSS在管理能力上缺少從客戶和業(yè)務視角的自上而下的監(jiān)控和分析,缺少客戶業(yè)務SLA質(zhì)量保障支撐體系,端到端的業(yè)務質(zhì)量管理能力不足。
對業(yè)務的端到端實時監(jiān)控
從業(yè)務和客戶的視角需要監(jiān)控什么信息以及如何監(jiān)控呢?由于這里強調(diào)的是實時業(yè)務質(zhì)量和客戶體驗保障,而不是統(tǒng)計意義上的業(yè)務質(zhì)量水平,因此除了普通的大粒度網(wǎng)絡性能指標監(jiān)控外,特別需要的是實時高效的網(wǎng)絡事件監(jiān)控,比如細粒度(5分鐘以內(nèi))的業(yè)務質(zhì)量和關鍵性能指標監(jiān)控,以及重要客戶、重要業(yè)務的重點跟蹤。這些數(shù)據(jù)可以采自終端、網(wǎng)絡甚至應用服務器,全面深入反映了業(yè)務相關的各部分設施的狀態(tài)和行為。
不過這樣還不能做到端到端的監(jiān)控。比如移動視頻業(yè)務涉及終端、無線接入網(wǎng)、核心網(wǎng)、IP網(wǎng)、傳輸網(wǎng)、數(shù)據(jù)網(wǎng)和ISP,目前各個網(wǎng)絡由專業(yè)OSS管理,多源數(shù)據(jù)難以共享,跨專業(yè)業(yè)務流程難以關聯(lián),一個部分出問題,其他部分并不了解,很難準確找到故障關系并定位根原因發(fā)生點,并采取手段加以解決或優(yōu)化。因此,未來OSS需要集中數(shù)據(jù)管理,以統(tǒng)一、標準的方式實現(xiàn)全專業(yè)、全信息監(jiān)控以及關聯(lián)。
在未來的運維過程中,一旦發(fā)生客戶投訴,那么客服打開客戶終端監(jiān)控系統(tǒng),該系統(tǒng)可以顯示某個客戶已開通的業(yè)務和使用情況,包括使用中涉及的信令觸發(fā)事件和告警信息、細粒度準實時的業(yè)務質(zhì)量和關鍵性能指標信息,以及其他參考信息(比如用戶的終端類型、活動區(qū)域和業(yè)務使用歷史等)。同時,與該用戶業(yè)務使用相關的各部分網(wǎng)絡的運行狀況指標及控制面信息也一并顯示。對于比較嚴重的問題,一般有告警或故障事件產(chǎn)生;如果沒有告警產(chǎn)生,但出現(xiàn)實時性能下降的情況,OSS可根據(jù)準實時性能指標推算哪部分網(wǎng)絡資源運行不正常,從而改變該用戶設置來避免業(yè)務受到影響。圖1是GPRS網(wǎng)絡的客戶投訴和監(jiān)控系統(tǒng)的示意。
現(xiàn)在的客戶投訴只能得到事后補救措施,那么我們可否在客戶進行投訴之前預判潛在業(yè)務風險,盡早調(diào)整用戶業(yè)務使用的策略或方式,以減少投訴的發(fā)生?答案是肯定的,我們可以看下面關于在高負荷網(wǎng)絡狀態(tài)下進行智能業(yè)務推送的案例分析。
在美國,Verizon和at&t這兩年先后開始大規(guī)模部署和商用LTE,但都在iPhone、Blackberry等智能終端大量使用后遇到了帶寬瓶頸(at&t最近兩年連接數(shù)的增長如圖2所示)。很多用戶同時在一個無線小區(qū)內(nèi)使用業(yè)務造成小區(qū)過于擁塞,但仍有新的用戶試圖接入該小區(qū)。如果OSS具備實時性能監(jiān)控能力和跨專業(yè)關聯(lián)能力,就可以從接入網(wǎng)中獲得某小區(qū)業(yè)務接入成功率、掉線率、活躍用戶數(shù)和流量使用等監(jiān)控數(shù)據(jù),進行分析后,核心網(wǎng)的PCC可以結合此信息以及客戶訂購的業(yè)務等級來調(diào)整用戶業(yè)務推送策略等,避免在熱點地區(qū)高峰時段盲目推送造成無謂的資源占用和服務質(zhì)量下降。此外,還可幫助運營商確定哪些是熱點小區(qū)、哪里需要擴容,對運營商未來的宏觀決策提供參考。這對于中國的運營商同樣具有參考價值,盡管目前中國在網(wǎng)的智能終端比例還不大,高流量數(shù)據(jù)業(yè)務使用還不算廣泛,但這種壓力很快就會到來,并有可能成為客戶投訴的重點,提前做好技術上的準備無疑是明智的。
圖2 at&t遭遇帶寬瓶頸
愛立信OSS產(chǎn)品線中的ENIQ就是一個實時的業(yè)務、網(wǎng)絡、終端監(jiān)控系統(tǒng),并且支持跨專業(yè)監(jiān)控。該系統(tǒng)可以根據(jù)運營需求定制智能化的業(yè)務管控功能,滿足不同類型用戶的業(yè)務跟蹤和保障需求。圖3是目前ENIQ實時監(jiān)控3G網(wǎng)絡的示意。
業(yè)務質(zhì)量保障
實時業(yè)務監(jiān)控可以及時發(fā)現(xiàn)客戶業(yè)務使用問題,追溯問題根源。對于嚴重故障立即采取補救措施以恢復業(yè)務正常,對于因性能、容量等瓶頸造成的業(yè)務質(zhì)量下降,則應調(diào)整用戶的使用策略或設置來規(guī)避不佳的服務狀態(tài)。但實時監(jiān)控獲得的用戶行為或者網(wǎng)絡狀態(tài)不具有持續(xù)性,在一個時段具有的異常狀態(tài),另一時段可能就消失了,如果根據(jù)某個時段的監(jiān)控結果貿(mào)然判斷網(wǎng)絡欠佳而采取調(diào)整措施,可能會破壞網(wǎng)絡的穩(wěn)定性,雖然解決了眼前的問題,但新的問題會馬上出現(xiàn)。因此,需要綜合分析實時的監(jiān)控數(shù)據(jù)、撥測數(shù)據(jù)和統(tǒng)計監(jiān)控數(shù)據(jù)等,來發(fā)現(xiàn)因網(wǎng)絡可能存在的固定缺陷所導致的業(yè)務質(zhì)量問題。這里涉及的數(shù)據(jù)來源如下:
1.實時監(jiān)控數(shù)據(jù):來自于網(wǎng)絡、終端實時信令、事件監(jiān)控和細密度性能指標上報;
2.撥測數(shù)據(jù):來自于主動定向的撥測行為;
3.計監(jiān)控數(shù)據(jù):來自于常規(guī)的性能指標KPI報告。
圖4為WAP業(yè)務對應的綜合監(jiān)控示意。
對以上數(shù)據(jù)分析處理的目的是要對網(wǎng)絡質(zhì)量和工作效率做全面分析,涉及到網(wǎng)絡容量、網(wǎng)絡質(zhì)量、業(yè)務量、運維效率等。此外,以上分析也可同時支持歷史數(shù)據(jù)分析、應急保障分析、網(wǎng)絡規(guī)劃擴容預測分析和網(wǎng)絡優(yōu)化分析。
對于某個業(yè)務的質(zhì)量評估,則需要建立業(yè)務到上述監(jiān)控數(shù)據(jù)的映射關系,也就是KQI-KPI的映射,根據(jù)各項網(wǎng)絡指標加權結果的高低來判斷業(yè)務運行的好壞,當把實時、撥測、性能報告三種測量都考慮進來,就可以得到一個全面、客觀的評價結果。
具備了強大的分析能力后,系統(tǒng)就可以采取事前的網(wǎng)絡優(yōu)化手段以規(guī)避可能發(fā)生問題的風險。愛立信認為,不管運營商是否部署自組網(wǎng)(SON)系統(tǒng),網(wǎng)絡自主優(yōu)化都是未來運維必須具備的能力。當然,自動化程度高低、優(yōu)化的重點、優(yōu)化的流程和評估方法,則需要根據(jù)運營網(wǎng)絡的階段和需求來周密規(guī)劃和考慮。這里可以提出的OSS建設目標包括以下內(nèi)容:
1.支撐無線網(wǎng)絡自主優(yōu)化;
2.實現(xiàn)參數(shù)自動配置、場景自動核查與生成、頻率自動優(yōu)化、網(wǎng)優(yōu)向?qū)А⒑邳c管理、問題小區(qū)識別和恢復;
3.為無線網(wǎng)絡分析、優(yōu)化方案制定、優(yōu)化方案實施及優(yōu)化效果綜合評估提供支持。
從實際網(wǎng)絡部署經(jīng)驗來看,有些運營商由于剛剛贏得某個客戶或者在客戶挽留中勝出,就急于向這些大量新進或升級的客戶開通高流量業(yè)務,業(yè)務質(zhì)量往往會隨著客戶的迅速增加而急劇下降。因此,提前做好商業(yè)模型的分析,對網(wǎng)絡能力和容量做出合理的優(yōu)化甚至擴容是十分必要的。美國一些運營商由于沒有做到事前評估和優(yōu)化,在LTE部署初期遭到了服務瓶頸而被迫強行限流,對中國運營商不能不說是一個警示。
全面改造OSS
全業(yè)務、長流程、端到端、注重客戶體驗,這些管理要求都在強調(diào)一點,就是高度的運維信息化。任何出現(xiàn)的異常情況或者特定狀態(tài),都可以在深度上進行挖掘,在廣度上進行關聯(lián)和追溯。這些要求OSS的架構向著更加融合與集中的方向發(fā)展。資源管理、網(wǎng)絡監(jiān)控、數(shù)據(jù)收集、信息分析、自動優(yōu)化,這些部分組成了完整的OSS體系,將是運營商進行下一代OSS改造的主要領域。一旦改造成功,運營商就真正具有了業(yè)務運營的實力,可以徹底擺脫管道和基本業(yè)務提供者的不利處境。