基于網管性能數據的KPI優化方法_第1頁
基于網管性能數據的KPI優化方法_第2頁
基于網管性能數據的KPI優化方法_第3頁
基于網管性能數據的KPI優化方法_第4頁
基于網管性能數據的KPI優化方法_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

13/13基于網管性能數據的KPI優化方法摘要:

結合中興通訊在全球商用網的優化案例,討論基于網管性能統計數據對網絡KPI進行優化的思路和具體方法。對網絡日常優化所需關注的要緊KPI進行了介紹。概述隨著商用網絡規模的不斷擴大,單純采納路測優化方式差不多不能滿足工作需求。在網絡成熟期,更多的情況是首先通過后臺網管的海量數據統計和分析,初步找出異常指標,繼而確定是RNC級的問題依舊個不小區問題,再結合具體的優化手段進行詳細分析。本文對基于后臺網管性能統計數據的KPI優化手段進行初步的分析。在傳統的基于DT和CQT數據的優化過程中,數據的采集是一個比較費時的過程。為了復現某個問題,可能需要進行大量的路測,之后在對長時刻的路測數據進行回放分析的過程中,定位到具體需要分析的問題點,然后從不同的角度進行分析,最終找到問題的解決方案。盡管在一些智能化的工具支持下,問題的定位與分析能在一定程度上簡化,但這仍然屬于對個案問題進行優化的范疇,缺乏全網級的綜合信息加以支撐。而基于后臺網管性能數據的優化則與之相反,這種優化方法基于大量的性能統計數據,強調各KPI指標之間的關聯性以及KPI指標與各種外在因素的緊密聯系。工程師需要做的,是在相應工具的支持下,從性能數據與配置數據、告警數據、地理信息、時刻信息等入手,深入挖掘數據之間的聯系,從而定位KPI相關問題發生的緣故,提出相應的解決方案。常用KPI簡介依照各類計數器,可定義專門多種性能指標。其中一部分是一般性能指標,可稱為GPI(GeneralPerformanceIndicator)。一部分是常用的用于評價網絡質量的指標,可認為是網絡關鍵指標。KPI通常分為路測部分和后臺部分,本文中專門討論后臺部分的指標。后臺網管統計可分為RNC級統計和Cell級統計,針對不同的指標采納不同的統計范圍和粒度。從實際應用的角度,通常有以下幾類KPI,分為接入類、切換類、掉話類、資源類、速率類、質量類等,其中專門多指標能夠進一步按業務等條件進行細分,構成復雜的KPI體系。但在日常的KPI監控和優化的過程中,通常選取最重要的幾項指標,反映網絡的總體性能。當有必要時,才對描述細節性能的指標進行考察。這體現了問題分解、逐步求精的分析思路。從用戶的使用感受角度考慮,最重要的KPI指標應該是掉話率,包括語音、可視電話、PSR99業務以及HSPA業務的掉話率,而CS業務的掉話相對PS業務來講帶來的負面體驗更嚴峻。其次一個重要的KPI類不是接入類指標,這反映了用戶是否能在任何時刻、任何地點及時地獵取高質量的移動通信服務。接下來的重要指標包括質量類指標、速率類指標等,這些是用戶直接能感受到并關懷的。切換類、資源類指標則更多地為運營商所關注。需要講明的是,在基于網管的KPI體系中,部分KPI指標比較難于體現,典型的如呼叫建立時延,其信令點涉及對核心網消息的解碼,通常不在RNC內完成,因此更多的是從路測途徑對時延KPI進行測試評估。在基于網管數據的KPI優化方式中,典型的KPI如下圖1所示。圖1典型網管KPI示意圖網管KPI優化網管KPI優化流程網管KPI優化是通過對OMC統計數據的分析來定位異常KPI的過程。異常KPI是指日常網絡運行監控中網絡質量報告輸出的KPI不滿足項,如接入成功率、掉話率、異系統切換成功率等。不同的KPI的分析方法可能有所不同,但總體流程是存在共性的,其分析思路是:從面到點進行問題定位和分析,即從RNC級性能到小區級(Cell)性能,結合KPI之間的橫向分析,以及從KPI到相關PI的縱向分析。從RNC入手,能夠了解整個WCDMA網絡的整體性能。假如RNC級的指標有異常,則要分不對每個小區的指標進行分析,確認指標異常是普遍現象依舊個不現象:假如是普遍現象,需要從覆蓋、容量、干擾、傳輸、設備軟硬件、無線參數等方面進行分析;假如是個不小區異常,應從相應的小區性能統計項進行詳細分析。需要注意的是,在查看百分比類相對性指標時,還需要同時查看指標中的絕對次數,因為百分比指標有時會掩蓋部分小區的問題。分兩種情況:一是百分比指標差,但采樣點少,不具備統計意義;二是失敗次數(分子)多,但由于總體樣本點(分母)更多,其百分比指標會專門好,容易掩蓋一些問題,需要特不注意。在網管KPI優化過程中,純粹的OMC統計數據可能還不夠,這時就需要多元化的數據作為分析的輸入,如設備告警/設備日志數據、小區跟蹤數據。假如仍然無法定位問題,則進行相關小區的DT/CQT專項測試,結合UE側數據進行分析,直至問題的定位解決。圖2是網管KPI優化流程,解析如下。(1)后臺統計指標有RNC級的不合格指標時,明確是否突發性、可自愈性的異常。這類異常包括大風、大雨、冰雹等氣候變化,假日、集會、體育競賽等用戶集散變化,傳輸瞬斷現象,電源故障等,通常持續時刻不長,然而對統計指標可能有專門大阻礙,需記錄具體緣故和提出相應的改進建議;(2)若不是突發、可自愈的指標異常,要做的第一件事是檢查設備告警信息,排除可能的設備告警,這點專門重要。若設備無告警或告警消除后指標沒有恢復正常,進行下一步;(3)將統計指標和話務量聯合起來進行過濾,列出所有指標不滿足的小區,并進行地理化顯示;收集網絡當前的傳輸配置表、軟硬件版本和無線參數配置信息,分析篩選出的異常小區是否存在某些共性,如有則針對其共性進行專題分析。典型的共性特征包括:CN/RNC側重點檢查近期有無版本升級、CPU負荷、鏈路資源占用情況等;傳輸側檢查是否有傳輸節點中斷、傳輸誤碼率過高等;檢查硬件更新情況;檢查無線側網元有無軟件升級;查看小區上行接收功率指標,看是否存在上行干擾;檢查異常小區的幾個最常調整的無線參數,看參數是否異常;查看異常小區統計指標惡化發生的時刻段,查找有無規律;其他暫沒有列出的共性情況;圖2網管KPI優化流程圖(4)若異常小區沒有找到共性,或優化后仍有不滿足指標的小區,則進行單小區的異常指標分析。要緊關注無線接通率、掉話率、軟切換成功率、2/3G互操作指標、PS業務速率等幾方面。(5)上面所有步驟處理完畢后,若仍然有小區異常,同時確認是設備Bug或是系統實現問題,需要設備廠商相關技術人員解決。無線接通率優化阻礙無線接通率的緣故分析如下:(1)覆蓋弱區發起接入使得信令流程無法完成導致接入失敗;(2)接入時被叫手機發起位置更新使得尋呼不到手機導致接入失敗;(3)小區重選不及時使得UE未在最優小區發起接入導致接入失敗;(4)隨機接入參數(前導功率、小區搜索窗長度等)設置不當使得RRC建立不成功導致接入失敗;(5)LAC區交界處發起接入,由于小區更新導致的接入失敗;(6)RAB建立失敗導致的接入失敗。RAB指派建立過程有兩個制約,一是RB建立,這是對UE的參數配置過程,一般可不能發生問題;二是無線鏈路重配過程,要緊完成對NodeB鏈路參數配置,相對容易發生失敗。常見的失敗緣故有:無線鏈路重配預備失敗(當NodeB的資源出現問題,如發生實例吊死);無線鏈路重配取消(當RNC內部資源或流程出現問題)。還有一種情況會導致RAB失敗,即小區負荷較高時RNC通過接納操縱發出拒絕指令。無線掉話率優化無線掉話率優化的思路如下:(1)分析RNC的掉話率指標,要緊從整個RNC的整體掉話率指標上推斷掉話率指標是否正常。(2)分析小區的掉話率指標。要緊需要分析小區“AMR掉話率”、“VP掉話率”、“PS掉話率”、“硬切換掉話率”、“系統間切換掉話率”,對所有小區分不用以上的指標進行排序,選擇指標特不差的小區或者最差的一些小區,進一步分析掉話緣故。(3)檢查小區是否異常。檢查小區告警,排除小區異常方面的緣故。(4)分析掉話緣故,從覆蓋、切換、干擾幾方面考慮。假如失敗信令顯示用戶面或無線鏈路失敗,同時緣故是“RLC不可恢復錯誤”的話,可能是覆蓋導致的掉話問題;分析該小區相關的切換指標(分析小區的切入成功率和切出成功率),確認是否由于切換失敗導致的掉話;通過分析小區總帶寬接收功率相關指標,分析在掉話率高的時段,是否相應的上行干擾指標也專門高,進一步確認是否上行干擾導致的掉話問題。(5)通過路測重現問題。當通過后臺網管數據分析無法進一步解決掉話問題的時候,需要針對小區進行路測,跟蹤手機側和RNC的信令流程進行分析。切換成功率優化阻礙切換成功率要緊有以下幾個因素:切換區過小,切換參數設置不當,鄰區漏配。(1)切換區過小。切換區過小會使UE沒有足夠的時刻完成切換;(2)切換參數設置不當。會導致鄰區增加/刪除不及時,或乒乓切換;(3)鄰區漏配。這種情況是最常見的導致切換失敗的緣故,而且對網絡性能阻礙較大。漏配的鄰區不但會直接造成掉話,還會給網絡帶來額外干擾,降低網絡容量。其他指標下面的這些指標不是優化最關懷的,但有時也需要結合它們對具體問題進行分析。尤其是當網絡用戶數達到一定程度后,會更經常用到這些指標的統計。(1)話務量與掉話率單純從掉話率統計的絕對值無法準確推斷小區是否存在問題,必須結合小區話務量指標。只有小區話務量(呼叫次數)足夠多時統計結果才有參考價值。(2)RTWP基站空載時,RTWP(ReceivedTotalWidebandPower,寬帶接收總功率)均值在-106~-104dBm之間屬正常;按照50%負載對應3dB噪聲抬升,可知RTWP小于-100dBm差不多屬于正常范圍。分析那個指標需要結合話務量。若在話務量正常的情況下出現RTWP異常抬升,則有可能是存在較嚴峻的外部干擾,這是提示干擾存在的重要手段之一。(3)碼資源利用率碼資源利用率太高或太低都不行,現實中常見的是邊緣站點的碼資源利用率較低,而密集社區、寫字樓、商業區等地域的站點碼資源利用率專門高,需要保持關注,防止因碼資源受限發生的網絡問題。地理化分析方法隨著GoogleEarth等現代GIS工具的廣泛普及,越來越多的優化工具從中受益,使得優化過程中能盡最大可能地利用地理化信息,輔助優化方案的制訂。在KPI優化的過程中,常見的地理化分析方法包括:(1)利用各小區的關鍵KPI值對小區顏色進行渲染,直觀表達全網的KPI分布情況。統計指標的圖形化顯示對大規模網絡優化分析的好處顯而易見,圖形化的分析結果直觀、清晰,且能夠表示出站點的相對位置,能夠從宏觀層面來分析問題,便于分層次實施優化。如圖3所示是某網絡中各小區的掉話率分布情況,不同顏色代表不同的掉話率等級。圖3小區掉話率分布圖(2)對TopN問題小區的地理化關聯分析,確實是將有問題的小區重點集中呈現,以便發覺地理上的共性。如此不但有助于整理優化思路,也有助于對一些隱藏問題的推斷,如潛在干擾的發覺、傳輸問題的發覺等。圖4是一個典型案例。黃色區域中包含的是12個掉話率最高的站點,紅色區域中的3個站點則是掉話率在前三位的,這表明這些站點在拓撲結構上的專門強的關聯性。后經查實,這些站點是通過共同的傳輸接口板接入RNC的,接

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論