




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、WLAN網絡維護優化指導手冊(V1.0)湖南公司 網優中心2011年8月目 錄 TOC o 1-3 h z u HYPERLINK l _Toc300875044 第一章 設備維護篇 PAGEREF _Toc300875044 h 3 HYPERLINK l _Toc300875045 1. AC故障問題 PAGEREF _Toc300875045 h 3 HYPERLINK l _Toc300875046 1.1 上線bas錯誤問題 PAGEREF _Toc300875046 h 3 HYPERLINK l _Toc300875047 1.2 發生上線bas錯誤的原因及案例分析 PAGERE
2、F _Toc300875047 h 5 HYPERLINK l _Toc300875048 1.3 錯誤話單問題 PAGEREF _Toc300875048 h 10 HYPERLINK l _Toc300875049 1.4 發生錯誤話單的原因及案例分析 PAGEREF _Toc300875049 h 11 HYPERLINK l _Toc300875050 1.5 錯誤話單問題小結 PAGEREF _Toc300875050 h 14 HYPERLINK l _Toc300875051 其他AC設備故障 PAGEREF _Toc300875051 h 15 HYPERLINK l _Toc
3、300875052 2. AP故障問題 PAGEREF _Toc300875052 h 18 HYPERLINK l _Toc300875053 2.1 AP設備問題 PAGEREF _Toc300875053 h 20 HYPERLINK l _Toc300875054 2.2 POE交換機問題 PAGEREF _Toc300875054 h 22 HYPERLINK l _Toc300875055 2.3 斷電問題 PAGEREF _Toc300875055 h 24 HYPERLINK l _Toc300875056 2.4 傳輸問題 PAGEREF _Toc300875056 h 25
4、 HYPERLINK l _Toc300875057 2.5 數據配置問題 PAGEREF _Toc300875057 h 26 HYPERLINK l _Toc300875058 第二章 網絡優化篇 PAGEREF _Toc300875058 h 30 HYPERLINK l _Toc300875059 1.無法搜索到移動信號問題 PAGEREF _Toc300875059 h 30 HYPERLINK l _Toc300875060 無法搜索到網絡問題排障流程 PAGEREF _Toc300875060 h 31 HYPERLINK l _Toc300875061 無法搜索到網絡問題案例
5、PAGEREF _Toc300875061 h 32 HYPERLINK l _Toc300875062 2.無法關聯問題 PAGEREF _Toc300875062 h 42 HYPERLINK l _Toc300875063 無法關聯問題排障流程 PAGEREF _Toc300875063 h 43 HYPERLINK l _Toc300875064 無法關聯問題案例 PAGEREF _Toc300875064 h 43 HYPERLINK l _Toc300875065 3.無法上網問題 PAGEREF _Toc300875065 h 50 HYPERLINK l _Toc3008750
6、66 無法上網問題排障流程 PAGEREF _Toc300875066 h 50 HYPERLINK l _Toc300875067 無法上網問題案例 PAGEREF _Toc300875067 h 51 HYPERLINK l _Toc300875068 4.速度慢問題 PAGEREF _Toc300875068 h 63 HYPERLINK l _Toc300875069 速度慢問題排障流程 PAGEREF _Toc300875069 h 63 HYPERLINK l _Toc300875070 速度慢問題案例 PAGEREF _Toc300875070 h 64 HYPERLINK l
7、_Toc300875071 5.掉線率高問題 PAGEREF _Toc300875071 h 90 HYPERLINK l _Toc300875072 掉線率高問題排障流程 PAGEREF _Toc300875072 h 90 HYPERLINK l _Toc300875073 掉線率高問題案例 PAGEREF _Toc300875073 h 91 HYPERLINK l _Toc300875074 6.用戶不能正常登錄問題 PAGEREF _Toc300875074 h 99 HYPERLINK l _Toc300875075 用戶不能正常登錄問題處理流程 PAGEREF _Toc30087
8、5075 h 100 HYPERLINK l _Toc300875076 用戶不能正常登錄問題案例 PAGEREF _Toc300875076 h 101第一章 設備維護篇1. AC故障問題1.1 上線bas錯誤問題上線bas錯誤產生原因分析:上線bas錯誤的定義:在認證過程中ac返回了網絡錯誤的錯誤碼(4),或者返回未知錯誤碼,或者接收ACK-CHALLENGE或ACK_AUTH包超時15秒失敗,一般認為是網絡或設備原因。在用戶上線流程圖中,和發生上線bas相關的交互步驟:如果查詢成功,Portal Server向AC請求Challenge;AC分配Challenge給Portal Serv
9、er;Portal Server向AC發起認證請求;而后AC進行Radius認證,獲得Radius認證結果;AC向Portal Server送認證結果; 用戶上線Chap認證流程圖上線bas錯誤包括以下四種情況:(1)AC未發送Ack_challenge、Ack_auth或者發往Portal服務器的Ack_challenge、Ack_auth丟失。(2)Portal服務器接收Ack_challenge、Ack_auth超時15秒。(3)AC發往Portal服務器的Ack_challenge或者Ack_auth的報文帶有errcode 4信息。以下2種情況AC將發送帶有錯誤碼4的報文:AC 在準
10、備發送 Ack_challenge時, 發現Req_challenge報文中的保留字段不為 0 或者AC 沒有能產生16 位的挑戰值,此時AC 將發送攜帶錯誤碼為4的Ack_challenge報文到Portal,表示AC設備告訴Portal Server此用戶請求Challenge失敗。 AC在收到REQ_AUTH時, 發現該報文中的REQ_ID 和之前Req_challenge中的REQ_ID 不相等,從而認為該用戶登錄操作出現異常,發送攜帶有錯誤碼4的AUTH_ACK報文到Portal,表示AC設備告訴Portal Server此用戶認證失敗。(4)AC設備設計缺陷,在發往Portal服務
11、器的Ack_challenge或者Ack_auth的報文中帶有其他未知errcode值信息。上線bas錯誤產生的主要原因:AC設備問題參數設置問題設備性能問題網絡丟包問題1.2 發生上線bas錯誤的原因及案例分析1.2.1 AC設備問題主要原因:(1)AC因設計缺陷,在發往Portal服務器的Ack_challenge、Ack_auth的報文中帶有其他未知errcode值信息。(2)AC內進程發生錯誤導致無法響應Portal服務器的請求,導致Portal服務器無法接收到響應報文,記錄為上線bas錯誤。(3)AC和Portal之間通過UDP報文進行交互,在交互過程中UDP端口學習錯誤,將導致Po
12、rtal無法接收到正確的響應報文,發生上線bas錯誤。(4)網絡丟包導致AC和Portal之間的數據包丟失重傳,因丟包重傳引發超時,發生上線bas錯誤。相關案例分析:案例一:AC響應Portal服務器的認證報文中攜帶有未知errcode值,發生上線bas錯誤。故障描述:某廠家現網AC發生認證接通率低的問題,通過抓包分析發現,在AC相應Portal的報文中存在errcode 10。AC設備版本設計缺陷導致在發往Portal服務器的Ack_challenge、Ack_auth的報文中存在錯誤代碼errcode 10,此代碼不符合移動集團規范,Portal將帶有errcode 10消息的響應報文記錄
13、為上線bas錯誤。導致用戶認證失敗。解決方案:依據中國移動WLAN用戶接入流程技術規范(WEB)V3.0.0要求,在AC版本中,將errcode 10值修改為符合規范的errcode值,解決因未知errcode值導致的上線bas錯誤。案例二: AC內認證模塊異常退出,導致發生上線bas錯誤。故障描述:某廠家設備出現大量上線BAS錯誤通過AC日志分析發現AC認證模塊發生重啟的現象。進一步根據AC調試信息進行定位:分析認證代碼后發現認證模塊在發送停止計費時有空指針的現象。如果進程發生空指針那就會出現異常,從而引起進程退出。分析認證邏輯后發現在認證模塊啟用了STOP機制,也就是防止用戶吊死在Radi
14、us Server的功能情況下發送STOP停止計費報文就會有空指針的風險,這就會導致認證模塊異常退出。在認證模塊退出情況下,如果發起認證請求,則AC無法響應報文challenge或Auth報文導致認證,就會造成上線bas錯誤。解決方案:通過升級新版本,修改認證模塊代碼,解決因認證模塊異常退出而發生上線bas錯誤的問題。案例三:交互過程中AC學習UDP端口號錯誤,導致發生上線bas錯誤。故障描述:AC和Portal之間通過UDP報文進行交互。通過抓包發現AC存在UDP端口號學習錯誤的問題。在交互過程中,如果期間有其他用戶進行認證交互,AC會學習到其他用戶的端口號。以這個端口號給Portal回應確
15、認報文,AC無法識別該確認消息,發生上線bas錯誤。用戶將顯示認證失敗,不能正常登錄使用。 2011-03-02 11:18:53.251408 igw8021x2248: P STA(5) Receive REQ_AUTH from Portal Server(40), port:39777 size:472011-03-02 11:18:53.291442 igw8021x2248: P STA(38) Receive REQ_LOGOUT from Portal Server(40), port:54555 size:162011-03-02 11:18:53.370251 igw802
16、1x2248: P STA(5) Send ACK_AUTH with Errcode 0 to Portal Server(40), dest port:54555 size:16 解決方案:在認證模塊中增加代碼,記錄下每一用戶Portal請求報文的端口號,以該端口號響應Portal的請求,解決UDP端口學習錯誤的問題。1.2.2 參數設置問題AC內關于認證計費的參數設置不當,增加AC內認證模塊出現異常的機率,導致上線bas錯誤的發生。相關案例分析:案例一:記賬間隔時間設置太短,導致出現認證接通率低的問題。故障描述:AC內認證計費參數有一項記賬間隔時間,該值作用為每隔一個記賬間隔時間AC對所
17、有用戶進行一次檢測其是否在線,如果在線則針對每用戶給Radius發送一條續費報文。表明該用戶在線,對用戶計費信息進行更新,確保計費的準確性。如果記賬間隔時間設置太短,將導致AC頻繁對在線用戶進行檢測并向Radius發送續費報文。當用戶量大時,AC內認證模塊將出現繁忙。無法及時響應Portal服務器發出的請求報文,產生上線bas錯誤,導致用戶登錄失敗。 抓包截圖記賬間隔時間設置太短,導致AC和Radius之間進行大量的續費報文交互,從上面的截圖可以看出,截圖中的26個數據報文中僅有一個是AC和Portal服務器交互的報文,其他的25個數據包都是AC和Radius之間的續費報文。占比達到了96%。
18、大量的續費報文導致了AC認證模塊繁忙,消耗大量AC資源,無法AC及時響應Portal發出的認證請求報文。從問題發生的AC和時間來看。該問題發生在業務量較大的AC,且發生的時間點一般發生在上網的高峰期。在5月份發現部分廠家AC內記賬間隔時間采用默認值,且默認值設置太短,設置成了30秒,導致AC認證模塊出現繁忙,無法及時響應Portal服務器發出的請求報文,產生了大量的上線bas錯誤,出現認證接通率低的問題。解決方案:將記賬間隔時間設置為900秒或更長(注:該參數raduis尚未使用,部分可以設置為0的廠家可以關閉該參數),防止認證模塊出現繁忙導致發生大量上線bas錯誤。1.2.3 設備性能問題A
19、C內開啟了某些功能(SNMP/NAT)后,導致AC內資源消耗過大或者功能實現效率不高。從而導致出現上線bas錯誤。相關案例分析:案例一:AC開啟SNMP服務后,出現認證接通率低的問題。故障描述:某廠家AC設備在開啟了SNMP服務后,SNMP進程對AC的CPU資源消耗較大;在業務量大的時候,將會因 CPU利用率高而出現認證模塊異常,出現上線bas錯誤。解決方案:通過優化AC內SNMP進程代碼及資源調度機制,降低SNMP進程對資源的消耗。避免因SNMP進程對資源的消耗,導致AC認證模塊出現異常,導致出現上線bas錯誤。案例二:AC開啟NAT地址轉換功能后,出現接通率低的問題。故障描述:長沙市目前W
20、LAN用戶IP地址分配采取私網IP地址+NAT的實施方案,AC為用戶分配私網IP地址,同時在AC上啟用NAT功能進行地址轉換。AC實施地址轉換需要通過軟件功能實現,在地址轉換時需要通過CPU計算處理。存在地址轉換產生時延和效率不高的問題。地址轉換產生的時延較大,從交互過程中AC收到用戶登錄請求開始計算,收到Ack_challenge、Ack_auth消息時間超過15秒超時將記錄為上線bas錯誤。解決方案:WLAN用戶使用公網地址。通過NAT轉換專業設備進行地址轉換,解決地址轉換存在時延和效率不高問題而產生上線bas錯誤。1.2.4 網絡丟包時延問題網絡因設備兼容性問題或網絡不穩定,而出現丟包和
21、時延大的問題。AC和Portal之間的交互采用不可靠的UDP報文,UDP報文在傳輸過程中如果出現報文丟失,UDP協議層次將不會對其進行重傳,因此在AC內設計了重傳機制,如果AC發送報文后5秒鐘未能收到下一步交互報文,則會對發出的數據進行重傳。雖然設計了重傳機制,但是可能因為重傳而導致超時。 可能導致AC和 Portal之間交互的報文丟失,或者因時延大問題導致導致整個交互過程超時15秒,發生上線bas錯誤。相關案例分析:案例一:網絡設備端口匹配問題導致出現網絡丟包現象,導致出現認證接通率低的問題。故障描述:AC出現了大量的上線bas錯誤。從AC對Portal進行ping測試發現網絡丟包率很高,達
22、到了20%。忙時21:300:00,丟包率為24%,AP出現閃斷掉線。通過分析發現,AC的端口狀態為自適應狀態,而AC的對端設備端口設置為速率強制1000M。把端口屬性改為自適應后:忙時21:300:00,丟包率為3%-6%,AP閃斷掉線的數量減少。因各廠家設備之間兼容匹配問題,導致端口無法相互協商自適應。導致出現網絡丟包。丟包導致AC和Portal之間交互報文丟失、重傳。因交互超時而發生大量的上線bas錯誤。解決方案:將AC對端設備同樣設置為自適應狀態,解決端口協商問題引發丟包導致的上線bas錯誤。1.3 錯誤話單問題錯單產生原因分析:產生錯誤話單原因均為計費報文中未攜帶NAS-ID號或攜帶
23、的NAS-ID錯誤,導致在BOSS系統內因NAS-ID值不合法而無法生成賬單。AC內NAS-ID值的對應關系主要有3中,基于AP、基于業務VLAN和基于用戶IP地址,目前主要采用基于VLAN對應NAS-ID值。Radius計費報文內容:Radius計費報文中包含用戶帳號(user-name)、NAS-ID、上網時長(acct-session-time)、計費報文類型(acct-status-type)等內容。以下3類原因將產生錯誤話單:(1)為當用戶下線時,AC給Radius發送計費結束報文時,無法依據對應關系匹配到NAS-ID,如果無法匹配到NAS-ID,則會自動填入00-00-00-00-
24、00-00到計費報文中。(2)NAS-ID配置錯誤或者格式不正確,導致計費報文中攜帶的NAS-ID值錯誤。(3)AC設備問題導致無法依據匹配關系攜帶正確的NAS-ID信息。1.4 發生錯誤話單的原因及案例分析1.4.1 NAS-ID匹配錯誤AC內沒有正確配置NAS-ID的對應信息,或者因對設備操作導致NAS-ID的配置信息丟失。當有用戶發起下線請求時,將無法攜帶正確的NAS-ID信息,產生NAS-ID為0類型的錯誤話單。相關案例分析:案例一:AC內業務VLAN配置錯誤導致出現錯誤話單。故障描述:AC下出現F150類型的錯誤話單,錯誤話單原因為計費報文中NAS-ID值為00-00-00-00-0
25、0-00,經過對AC的數據檢查發現站點明城公館的6信道模板配置了一個業務VLAN 3792,該VLAN在AC的VLAN列表中存在,但是該業務VLAN所對應的熱點為工程期間熱點,沒有規劃配置NAS-ID。由于APAC之間的業務數據走私有CAPWAP隧道,因此即便VLAN配置錯誤,用戶上網數據仍然可以通過交換機等傳輸設備,用戶可以正常上網。由于業務VLAN配置錯誤,導致出現無法匹配NAS-ID的問題。因此該模板下的用戶計費報文無法攜帶NAS-ID,出現錯誤話單。VLAN配置錯誤解決方案:將瘦AP配置模板中業務VLAN修改正確即可解決問題。案例二:主備備份操作失誤導致出現錯誤話單。故障描述:在對主備
26、AC進行備份時需要定義一個心跳端口。業務VLAN在AC內基于端口進行配置,對AC端口重新定義后,原有VLAN和NAS-ID將會丟失。所有VLAN和NAS-ID需要重新配置。如果在執行此項操作時,未將AC LAN口線纜拔掉。如果此時有用戶發起下線請求,計費報文將無法攜帶NAS-ID號,而產生錯誤話單。解決措施:在進行設備主備配置操作時,選擇在凌晨業務量小的時段進行,并嚴格按照流程執行,先將AC LAN口線纜拔掉,中斷用戶上網業務,再進行配置操作。待全部配置完成后,再連接線纜恢復業務。防止操作器件因AC內無NAS-ID配置信息而產生NAS-ID為0的錯誤話單。1.4.2 NAS-ID格式錯誤AC內
27、NAS-ID值配置錯誤或者格式不正確,比如NAS-ID配置為1200.0731.731.00.46(NAS-ID值多加了點)或者CMCC(不合法NAS-ID),導致計費報文中攜帶的NAS-ID值不合法而無法生成話單。相關案例分析:案例一:NAS-ID配置錯誤導致出現錯誤話單。故障描述:AC(0)在2月份產生一條NAS-ID值為CMCC的錯誤話單,經過對該臺AC的數據檢查發現,有一個熱點的業務VLAN對應的NAS-ID值配置成了CMCC。因此該熱點下用戶上網的產生的計費報文NAS-ID值將為CMCC。該值屬于不合法的NAS-ID,正確的NAS-ID值應該為0460。解決方案:將NAS-ID值修改
28、為正確的NAS-ID值即可解決問題。案例二:NAS-ID配置中包含了”.”導致出現錯誤話單。故障描述:AC產生一條NAS-ID值為1200.0731.731.00,經過對該臺AC的數據檢查發現,有一個熱點的業務VLAN對應的NAS-ID值配置成了1200.0731.731.00.46。由于”.”將占用一個字符,因此該熱點下用戶上網的產生的計費報文NAS-ID值將為1200.0731.731.00。該值屬于不合法的NAS-ID,正確的NAS-ID值應該為0460。解決方案:在配置NAS-ID值是不要把”.”字符配置進去。1.4.3 設備問題AC設備問題導致無法依據匹配關系攜帶正確的NAS-ID信
29、息。相關案例分析:案例一:AC內NAS-ID存儲空間不夠導致出現錯誤話單。故障描述:AC下發現產生NAS-ID值的錯誤話單00460相對應的熱點為柯達名居。通過抓包發現是在AC上報這個熱點的NAS-ID的時候上報的NAS-ID位數不全導致。而導致此現象出現的原因是由于AC上NAS-ID的默認儲存空間不夠導致。解決方案:將NAS-ID值的儲存空間改大,解決NAS-ID存儲空間不夠的問題,即可將問題解決。案例二:AC內CPU利用率持續較高導致出現錯誤話單。故障描述:升級AC時,須將新版本傳到AC業務平臺,業務平臺加載新系統時CPU利用率持續較高在CPU利用率高的情況下AC的radius認證模塊將無
30、法正常工作,在此過程中用戶發起的計費報文將隨機產生一些錯誤信息進行radius報文封裝,認證報文攜帶的錯誤信息將產生錯誤話單。解決方案:新系統裝載成功后,故障恢復。在對AC進行數據割接時,必須在AC上沒有認證用戶的前提下進行,并且在割接期間先把用戶的認證開關關閉,當割接完畢后,立即把認證開關打開。這樣保證了用戶正常上網,也不會產生錯誤話單。1.5 錯誤話單問題小結結合以上分析和我省設備實際情況,導致話單錯誤的原因主要有如下原因:工程開局階段VLAN和熱點配置錯誤導致。主要表現在京信公司和大唐公司,出現問題也不容易被發現,這主要和以上兩廠家的AC機制有關(京信和大唐公司APAC之間的業務數據走私
31、有CAPWAP隧道,因此即便VLAN配置錯誤,用戶上網數據仍然可以通過交換機等傳輸設備,用戶可以正常上網)。防范措施:(1)加強工程開局數據管理,在認證入網時除了對三元組數據進行重點審核外,對工程開局數據也安排專人進行審核核對。(2)工程開局時所有熱點均預配置一個默認NAS-ID,即使在誤開啟認證情況下也不會出現話單錯誤。(3)鑒于京信和大唐公司AC機制的特殊性,后期在入網與計費驗證測試中將針對1、6、11三個模板開展測試,避免因不能模板VLAN對應錯誤導致錯單問題。2、設備自身原因導致,主要表現如下:(1)虹信測試階段出現的話單錯誤(AC上的NASID的默認儲存空間不夠)。(2)弘浩明傳AC
32、的FOA測試階段出現的話單錯誤(業務平臺加載新系統時CPU利用率持續較高,在CPU利用率高的情況下AC的radius認證模塊將無法正常工作導致話單錯誤)。(3)京信公司主備倒換測試階段出現的話單錯誤(如果在執行主備倒換操作時,未將AC LAN口線纜拔掉。若此時有用戶下線,計費報文將無法攜帶NAS-ID號,而產生錯單)。防范措施:此類由于設備自身原因導致的話單錯誤一般比較難以發現,只有在出現問題抓包分析排查問題并盡快匯報。同時譬如日常升級、主備前盡量選擇在用戶閑時,升級或主備操作前制定詳細的方案,避免因設備自身原因或操作原因導致話單出錯。 3、NAS-ID設置錯誤:主要表現在AC因權限管理不嚴,
33、導致部分維護人員進入AC將NAS-ID誤設置為CMCC導致話單錯誤。預防措施:(1)加強AC密碼管理和控制,極少人掌握較高權限,其他僅開放查看權限。(2)工程開局時所有熱點均按照NAS-ID標準格式預配置一個默認NAS-ID,即使在誤開啟認證情況下也不會出現話單錯誤。 其他AC設備故障主要故障原因:(1)AC內業務板卡故障;(2)AC進程異常;(3)AC參數配置問題都可能導致AC工作異常;以上AC故障可能導致AP離線退服、用戶無法獲取IP地址或用戶無法認證上網。1.6.1 常見板卡故障及案例分析常見板卡故障主要有業務板芯片損壞,接口模塊損壞等;發生板卡故障在AC主控板上均會有相應的告警指示。依
34、據告警指示對故障板件進行更換處理。相關案例分析:案例一:AC業務板芯片損壞導致設備無法正常啟動工作。故障描述:AC下的所有熱點網絡都不可用,網管平臺上出現SNMP不通告警。所有熱點網絡均不可用且AC出現告警信息,此種情況很可能為AC出現故障導致。前往機房對AC進行檢查發現,AC出現Out of Service LED指示燈告警,告警含義為設備不可用。同時使用串口不能登錄AC。AC控制板工作正常,未出現告警。此故障可能為業務板芯片損壞導致系統無法啟動。解決方案:將設備斷電后更換AC業務板卡,對AC進行數據配置后工作正常。案例二:AC接口模塊損壞導致網絡不可用。故障描述:AC下帶的所有AP均離線退
35、服,查看AC進程信息發現wltps、DHCP進程工作正常。查看AC端口工作狀態發現AC LAN口處于shutdown狀態,使用no shutdown命令無法將端口打開。前往機房查看發現LAN端口指示燈出現紅燈告警指示。為AC接口模塊損壞導致AP全部離線。解決方案: 設備斷電后,將損壞的接口模塊拔出,插入新的接口模塊。上電后,AC即可正常工作。1.6.2 進程異常故障及案例分析AC內常見進程異常主要有包含如下進程DHCP進程、wltps進程、igw8021x進程工作異常。其中DHCP工作異常將影響AP和用戶獲取IP地址;wltps進程異常將影響AP正常上線;igw8021x模塊異常將影響用戶認證
36、上網。相關案例分析:案例一:DHCP進程異常導致AP無法關聯AC工作。故障描述:AC下的AP全部無法下發配置數據,檢查發現AC的MAC地址表中均能發現AP的MAC地址,但是無法下發配置數據。檢查AC的已分配IP地址列表發現,AP都沒有從AC獲取到IP地址,因此無法同AC進行管理報文的交互。查看進程發現AC的DHCP進程沒有正常啟動,導致無法給AP分配IP地址。解決方案:手動啟動DHCP進程,AP就能正常獲取地址,對AP下發配置數據。案例二:wltps進行異常導致AP全部離線。故障描述:網管平臺顯示AC下的AP全部離線,查看AC內AP在線列表,瘦AP全部顯示為離線狀態。檢查匯聚交換機配置并動態查
37、看AP的MAC地址后,匯聚交換機可以學習到瘦AP的MAC地址,確認熱點側-傳輸資源-匯聚交換機配置沒有問題。對AC的數據配置進行檢查,確認數據配置后,查看AC的工作進程,發現進程中沒有wltps進程沒有起來。導致AC無法和AP進行通信,AP無法在AC上注冊上線。解決方案:手動啟動wltps進程,待進程重啟完成后,AP就能正常上線工作。案例三:igw8021x進程掛死導致用戶認證失敗。故障描述:接到AC下熱點的許多用戶投訴,反映無法認證上網,提示認證失敗。對該臺AC進行Portal、Radius認證局數據檢查發現,數據配置沒問題。在AC內ping Portal服務器發現鏈路可達。排除數據和網絡原
38、因后,對AC進程進行檢查,發現在進程列表中有igw8021x進程,但是進程號異常,可能為進程掛死導致無法正常和Portal服務器交互。導致用戶認證失敗。解決方案: 手動重啟該進程,待進程重啟完成后,用戶就能正常認證上網。案例四:AC所帶熱點沒有CMCC或CMCC-EDU信號解決方案:1、登錄AC查找熱點AP是否在線,并查看其它熱點是否在線。如果AP在線,則檢查熱點AP配置模板數據;如果AP全部離線,檢查AC工作進程是否正常,如進程異常,則重啟異常進程。2、如果AC下部分熱點離線,檢查熱點傳輸鏈路,可從POE交換機ping AC的IP地址確認傳輸,檢查POE交換機數據配置和設備供電情況。針對問題
39、,相應解決。案例五:AC下瘦AP全部離線解決方案:1、登錄AC查看AP在線列表,發現AP全部離線,檢查匯聚交換機配置并動態查看AP的MAC地址后,匯聚交換機可以學習到瘦AP的MAC地址,確認熱點側-傳輸資源-匯聚交換機配置沒有問題。2、檢查AC的數據配置,確認數據配置后,查看AC的工作進程,發現進程中沒有wltps進程以及igw8021x進程。手工啟動wltps,可以起來,但是igw8021x進程手工也啟動不起來。嘗試修改此屬性,執行完之后,沒有報錯,但是mount,依然是RO屬性。3、查看了系統分區信息,/dev/sdb 567三個分區變成了ro(read-only)的屬性。正常情況下應該是
40、rw的。變成ro導致日志寫不進,配置文件保存不了等等一系列問題。嘗試格式化此分區后,mount發現此分區變成rw了。再查看系統進程發現,wltps進程起來了,AP也在線了。但是認證模塊還是沒有起來。一分鐘之后,再查看mount,發現此分區又變成ro了。umount /logfiles分區,發現認證模塊進程起來,有用戶開始認證,業務恢復正常。1.6.3 參數配置故障及案例分析案例一:用戶投訴AC下所帶熱點用戶獲取不到地址解決方案:1、登錄AC查看DHCP服務器配置,確認數據配置正確,有用戶正常使用。2、用戶高峰時段查看DHCP已分配IP列表,如果已分配IP列表值大于業務地址池的最大值。業務地址池
41、擴容后,此問題得到解決。3、檢查熱點業務VLAN是否對應到相應的VIF和DHCP地址池,如果配置錯誤則修正配置。案例二:用戶反映能彈出Portal登錄頁面,但是無法正常登錄上線。解決方案:1、登錄AC查看相關AC中該熱點的瘦AP配置模板配置。2、瘦AP配置模板中profiles的Portal服務器、Radius服務器設置中開啟了認證,配置了Portal服務器,但是未配置Radius服務器。導致AC無法完成整個認證交互流程。3、在Radius服務器中正確添加Radius服務器,即能解決問題。案例三:在對AC端口進行重新定義后,出現用戶無法上網,AC內無VLAN信息。解決方案:1、登錄AC檢查VL
42、AN配置,發現VLAN配置數據不存在。2、VLAN在AC內基于端口進行配置,對AC端口重新定義后,所有VLAN需要重新配置。VLAN丟失后將導致用戶無法正常上網。3、將AC端口定義好之后,將VLAN、NAS-ID重新配置好即解決問題。4、前往熱點進行WLAN業務測試。2. AP故障問題AP設備退服主要表現為AP設備離線導致網絡不可用,導致AP離線退服的原因主要有以下幾類:AP設備故障POE交換機問題斷電故障傳輸故障數據配置問題AP離線退服故障排障流程:AP故障排查流程圖(1)首先登錄AC或OMC查詢AP離線情況,確定為單個、非連續性AP離線還是大面積、非連續性AP離線。(2)對于單個、非連續性
43、AP離線故障,需要前往站點依次對以下幾個問題進行排查:網線連通性故障,POE供電異常,AP設備損壞。依據排查結果給出相應的解決方案。(3)對于大面積、連續性AP離線故障,一般為傳輸故障、斷電問題,數據配置問題導致。采取由下至上的方式進行排查。先登錄POE交換機檢查POE交換機的工作情況及數據配置,排查交換機問題。再登錄OLT設備,查詢ONU工作狀態及數據配置;依據ONU的工作狀態:online/offline/poweroff,確定是否發生傳輸光路中斷或斷電。其次檢查BRAS及AC的數據配置,排查數據問題。可以通過查看設備MAC地址表項是否包含AP的MAC地址的方法來確定中間鏈路的連通性。2.
44、1 AP設備問題因AP設備問題導致AP離線退服的原因主要有以下幾種:AP吊死、AP射頻模塊損壞、AP軟件版本問題。(1)AP吊死:AP設備仍然處于在線工作狀態,AP和AC之間能進行正常的信息交互,但是無射頻信號輸出。此類故障一般因為AP電路或者射頻模塊存在缺陷,在AP業務量較大時容易發生吊死故障。一般通過重啟AP設備的方式解決。(2)AP射頻模塊損壞:AP設備仍然處于在線工作狀態,但是輸出的射頻信號很弱或者不穩定,一般為AP設備發射機故障導致。(3)AP軟件版本問題:AP設備軟件版本文件缺失,或者AP工作在胖AP模式,導致AP不能在AC上注冊上線。AC設備在進行升級后,AC將對AP進行自動升級
45、,升級過程中因網絡不穩定等原因,導致AP升級失敗造成版本文件缺失,AP不能正常上線工作;或者AP工作在胖AP模式下,上電啟動后,不會發出DHCP請求,因此無法在AC注冊上線。一般通過對AP進行版本升級或者將AP工作模式轉換為瘦AP模式即可解決問題。相關案例分析:案例一:AP設備發生吊死故障導致站點網絡不可用。故障描述:站點AP出現退服現象,現場觀察AP指示燈狀態發現,AP電源指示燈和連接指示燈正常,射頻指示燈不亮?,F場測試發現AP無射頻信號發出。在AC內觀察AP的狀態為正常且能正常ping通,由此排除網線連通性故障和供電故障,判定AP發生吊死故障。解決方案:通過重啟AP設備解決。案例二:網線接
46、頭制作不規范導致AP設備離線。故障描述:站點部分AP異常離線,現場檢查發現AP除電源(POWER)指示燈以外其余指示燈(LAN、RF)都不亮。使用測線儀對網線進行測試發現,因網線制作不規范導致網線存在不同的問題。解決方案:按照568B標準重新制作水晶即可解決故障。案例三:站點AP工作在胖AP工作模式,導致AP不能上線。故障描述:華都賓館有一個AP不能在AP上注冊上線,現場檢查AP指示燈發現,AP電源指示燈和連接指示燈都正常。排除網線連通性故障及供電故障。AP射頻指示燈閃爍,AP在未關聯AC的的情況下有射頻信號輸出,說明該AP工作在胖AP模式。解決方案:登錄到AP,將AP工作模式修改為瘦AP,A
47、P即可在AC上注冊上線。案例四:AP版本升級失敗導致不能上線。故障描述:AC(硬件型號為FH-2400)軟件版本升級至版本3.3.8后出現部分AP不能上線的情況。通過現場觀察發現AP電源指示燈常亮,其他指示燈均不亮。使用測線儀測試網線連通性良好。電源指示燈常亮說明供電正常。使用電腦連接到AP發現無法登錄到AP,說明AP版本文件出現丟失損壞。解決方案: 對AP進行版本升級,解決AP因版本文件缺失無法上線的問題。對AC的升級盡量選擇在凌晨業務量少的時段。防止因網絡不穩定而導致AP升級失敗。案例五:AP信號輸出不穩定導致網絡不可用。故障描述:AP出現射頻信號輸出不穩定的情況,在AP連接自帶鞭狀天線的
48、情況下進行測試發現,AP下信號在-30dbm和-85dbm之間波動。AP有射頻信號輸出,說明網線連通性和供電都沒問題。為AP射頻模塊工作不穩定導致。解決方案:更換AP,將AP損壞的射頻模塊送廠返修。案例六:AP信號輸出弱導致網絡不可用。故障描述:站點出現無線信號弱的問題,用戶無法連接無線網絡使用。在AP連接自帶鞭狀天線的情況下進行測試,AP的輸出信號在-90dbm左右,AP輸出信號弱。AP有射頻信號輸出,說明網線連通性和供電都沒問題。為AP射頻模塊中發射機故障導致輸出信號弱。解決方案:更換AP,將AP損壞的射頻模塊送廠返修。2.2 POE交換機問題站點POE交換機直接連接到AP,交換機發生故障
49、將直接導致AP退服。POE交換機主要存在POE供電不足、配置文件丟失、端口工作不穩定的問題。(1)POE供電不足:交換機存在整體供電不足或但端口供電不足、供電電壓不穩定的問題。當交換機下掛AP數量太多或者網線過長時,容易出現因AP供電不足而導致AP退服的故障。一般建議24口POE交換機下掛AP數量不超過15個。(2)配置文件丟失:POE交換機系統數據儲存在內置閃存中,交換機啟動后3秒內完成閃存內相關數據的加載工作,短時間內多次斷電、通電導致交換機無法正常加載數據,導致系統文件或配置數據丟失。AP無法正常上線工作。(3)端口工作不穩定:交換機因雷擊或漏電導致交換機損壞,出現交換機端口燒壞或工作不
50、穩定的問題。登錄到交換機查看端口狀態,端口啟用后無法工作或者不停的打開關閉。一般可以通過對交換機設備接地的方式來降低被燒壞的幾率。相關案例分析:案例一:單端口供電不足,導致AP無法上電工作。故障描述:站點采取與2G合路建設的方式進行WLAN覆蓋建設,站點開通后AP無法上線。檢查AP指示燈狀態,所有AP指示燈全部不亮。使用測線儀測試網線的連通性發現,網線連通性很好。將AP天線口斷開天饋線后,AP電源指示燈和連接指示燈正常。在斷開天饋系統后,AP射頻模塊功耗變小,AP整體功耗降低,交換機端口POE功耗能夠滿足要求,因此AP能夠正常工作。根本原因為交換機單端口供電不足導致AP不能上電工作。解決方案:
51、加裝POE集中供電器對AP進行供電,解決交換機端口供電不足的問題。案例二:交換機整體供電不足,在交換機下連AP數較多時部分AP不能正常工作。故障描述:站點部分AP出現有時上線,有時離線的問題。在AP離線的時間段,對AP檢查發現,AP指示燈均不亮。對網線連通性檢查未發現問題,網線接頭制作工藝良好,不存在接觸不良的問題。對交換機側的網線拔插發現,AP上線一段時間后離線。在檢查交換機時發現,24端口POE交換機連接的AP數達到了20個,AP連接數量太多。當AP下業務量大時,AP的功耗將增大,導致交換機因整體供電不足導致部分AP離線。解決方案:加裝POE集中供電器對AP進行供電,解決交換機整體供電不足
52、的問題。案例三:交換機系統文件丟失,導致無法啟動進入系統。故障描述:交換機上電啟動后,AP無法上電工作。對網線進行測試未發現問題。通過串口登錄交換機發現交換機進程啟動到某一步后,無法繼續啟動。交換機可能在短時間內多次斷電、通電導致交換機在短時間內無法正常加載數據,導致系統文件丟失而無法啟動進入系統的問題。解決方案:對交換機重新刷入版本,交換機即可正常啟動工作。案例四:交換機配置數據丟失,導致AP不能正常上線。故障描述:站點AP全部離線,無法通過遠程登錄的方式登錄到交換機,登錄到ONU發現狀態正常,站點未發生斷電故障。前往站點檢查發現交換機正常上電啟動,AP指示燈正常。使用串口登錄到交換機發現交
53、換機配置數據丟失,恢復了出廠默認配置。在POE交換機上配置的管理VLAN信息丟失,導致在AP和AC之間未能建立二層通道,因此AP無法上線??赡茉驗榻粨Q機短時間內斷電、通電導致配置數據未能加載到閃存中,出現丟失。解決方案:重新對交換機配置數據,AP即可正常注冊上線。案例五:交換機端口工作不穩定,導致AP無法正常工作。故障描述:站點部分AP離線,使用串口登錄到交換機發現,AP對應POE交換機端口不停的打開、關閉。對網線接頭工藝進行檢查發現,水晶頭按照標準568B標準制作,工藝良好不存在接觸不良的問題。將AP連接到其他端口,端口工作狀態穩定,能夠從POE交換機的MAC地址表中查詢到該AP的MAC地
54、址,AP能夠穩定上線。用手觸摸交換機發現交換機外殼帶電,可能原因為交換機漏電,導致交換機端口因短路被燒壞。解決方案:對損壞的交換機設備進行替換,對更換后的交換機重新配置數據。2.3 斷電問題站點因ONU、交換機斷電往往導致整個站點AP離線退服。斷電原因主要有2類:人為因素斷電和工程問題斷電。(1)人為因素斷電:業主因擔心電磁輻射或者用電協調存在問題,導致業主將設備斷電。(2)工程問題斷電:WLAN設備取電未采取集中供電的方式,在民用市電取電,往往導致業主關電后設備被斷電;或因為工程接電不符合要求而出現電源短路跳閘等情況。相關案例分析案例一:業主因擔心電磁輻射將WLAN設備斷電。故障描述:站點出
55、現所有AP離線的故障,遠程無法登錄到交換機,登錄OLT查詢站點ONU狀態為poweroff。表明站點出現的斷電故障。前往站點檢查發現接電線被人拔出。經過了解得知因業主看到移動通信的天線擔心會有電磁輻射因此將設備斷電。解決方案:對業主分發移動通信電磁輻射的知識普及資料,進行宣傳講解,解除業主對于電磁輻射的顧慮。案例二:網絡設備從市電取電,導致用戶關電后網絡不可用。故障描述:某高校宿舍區AP在晚上12點后都會離線。站點的ONU、交換機都出現不可達的情況。前往熱點了解的情況發現,網絡設備從樓層宿舍用電的主干線處取電。晚上12點學校宿舍樓集中關電,導致網絡設備停電。解決方案:進行工程整改,對設備采取集
56、中供電的方式,對每棟樓進行集中單獨供電。2.4 傳輸問題目前WLAN組網絕大部分采取PON組網方式,PON組網部分為OLT光交箱分光器ONU。在整個無源光網絡中,光交箱、分光器都是無源設備,但容易出現因光路中斷、光衰減過大或設備故障而導致整個站點AP全部離線退服的故障。相關案例分析:案例一:站點ONU尾纖過度彎曲導致光衰減太大,致使站點AP全部離線。故障描述:網管平臺上顯示站點AP全部離線,無法遠程登錄到交換機查看交換機工作狀態,登錄到OLT查詢站點ONU工作狀態為offline。因此為光傳輸信號衰減過大或光路中斷導致。前晚站點查看發現ONU尾纖為套保護管,彎曲幅度太大引起光衰減太大,導致ON
57、U離線。尾纖未套保護管,彎曲幅度太大解決方案:替換尾纖,并使用纏繞管對尾纖進行保護,防止尾纖因彎曲幅度過大或彎折導致衰減過大。案例二:ONU接收光強度不夠,導致AP信號時有時無。故障描述:整個站點出現WLAN信號時有時無的現象,站點檢查POEONU之間網線按照標準規范制作,工藝良好,不存在接觸不良的問題。站點發現ONU的LOS指示燈時而閃爍紅燈告警。使用光功率計測試發現,ONU輸入光功率在-40dbm左右,接收光強度太弱,位于ONU光接收強度的靈敏度值附近。導致ONU時而工作不正常,出現幀丟失告警。當光接收強度高于接收靈敏度時,ONU能夠正常工作,AP正常上線。當光接收強度低于接收靈敏度時,出
58、現幀丟失,AP不能上線工作。因此出現信號時有時無的現象。解決方案:使用測試儀測試光衰減過大的部分,重新跳纖,解決光衰減過大的問題。2.5 數據配置問題AP在AC上注冊上線,終端能夠正常連接無線網絡認證上網需要配置的數據有:中間設備配置VLAN透傳、QinQ和在AC上配置AP的無線參數及認證局數據。數據配置錯誤將可能導致AP無法上線,用戶無法關聯及AC工作異常等。WLAN網路設備需要配置的數據:(1)AP:零配置。(2)POE交換機:開啟POE供電功能,同時配置站點管理、業務VLAN。(3)ONU:配置ONU端口為transparent模式,透傳VLAN數據。(4)OLT:需要在OLT上對上線的
59、ONU進行認證,同時啟用QinQ。(5)匯聚交換機:配置VLAN透傳。(6)BRAS:配置QinQ數據。(7) AC:配置DHCP服務,同時配置AP工作所需的參數,同時需要配置Portal、Radius、NAS-ID等參數。數據配置錯誤主要為以下2個方面:(1)中間設備數據配置錯誤:我省WLAN采取二層組網方式,為每一熱點規劃一個管理VLAN和業務VLAN,其中管理VLAN承載AC與AP之間的控制協議等,業務VLAN承載WLAN用戶流量。同時在OLT和AC對端設備上啟用QinQ功能。中間鏈路VLAN透傳或QinQ配置錯誤將導致AP不能上線或者用戶不能上網。(2)AC設備數據配置錯誤:在AC上需
60、要配置DHCP服務,為AP和用戶分配IP地址,同時還需配置AP工作所需的參數,需要配置Portal、Radius、NAS-ID等參數。AC參數配置錯誤將可能導致AP不能正常工作,用戶無法上網等。相關案例分析:案例一:POE交換機業務VLAN配置錯誤導致用戶無法獲取IP地址。故障描述:站點AP正常在線,但是用戶無法關聯無線網絡。通過現場測試發現,站點無線信號較好且周圍無電磁干擾。用戶無法獲取到IP地址,無線網卡地址為169.254.X.X,該地址為當客戶端未能獲取到IP地址,windows系統將為用戶自動分配169.254.X.X網段的地址。檢查AC進程發現DHCP進程正常,AC地址池未出現溢出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論