NGN IP網絡設備維護指導手冊_第1頁
NGN IP網絡設備維護指導手冊_第2頁
NGN IP網絡設備維護指導手冊_第3頁
NGN IP網絡設備維護指導手冊_第4頁
NGN IP網絡設備維護指導手冊_第5頁
已閱讀5頁,還剩39頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 NGN IP網絡設備日常維護指導手冊UTS.610G13.A0作者杭建峰沈柳芃審稿薛京黃江濤日期2004年6月UT斯達康通訊有限公司 項目與技術支持部UT斯達康公司以"客戶成功,我們成功"的價值觀衡量、規范員工的行為,致力于服務創新和服務承諾的兌現,力求為用戶提供超越客戶期望的服務。UT斯達康公司擁有完善的服務體系,技術服務中心擁有一批優秀的專業技術人員,并在全國設有服務分支機構,提供24小時技術服務。本著用戶至上,信守承諾的原則,UT斯達康公司承諾:在24小時之內對用戶的問題給予答復。為客戶提供優質、高效、專業的服務是UT斯達康的追求。UT斯達康通訊有限公司項目與技術支

2、持部聯系地址:浙江省杭州市教工路1號12號樓郵政編碼:310012電話號碼:(057188916789傳真:(057188916789800免費電話:8008571466郵件地址:utsupport客戶支持網站:版權聲明本文檔屬UT斯達康通訊有限公司版權所有,侵權必究。本文檔專供用戶、本公司職員以及經本公司許可的人員使用。未經公司書面同意,任何單位或個人不得以任何方式復制、翻印、改編、摘編、轉載、翻譯、注釋、整理、出版或傳播手冊的全部或部分內容。UTStarcom,PAS,WACOS, iAN, AIRSTAR, WLL, ISP, WICOPS, NGDLC,Intranode, Inter

3、node, Xtr-m-IP, UNITECH,iPATH, !-Volution, mSwitch,小靈通, 為UT斯達康公司或其子公司、關聯公司的注冊商標,受商標法保護,任何個人或團體非法使用以上商標,UT斯達康公司有權追究其法律責任。出版說明內容簡介UT斯達康NGN系統維護指導對網絡維護人員的分工和職責,以及相應的網絡維護流程提出了科學而合理的建議;對網絡的日常維護項目和周期進行了詳細的闡述;對于維護人員如何進行網絡的巡檢、巡檢的項目和周期作了詳盡的描述;維護指導中還匯集了豐富的故障解決案例。為了讀者閱讀,更好的服務于客戶,維護指導共有以下幾部分組成:NGN核心網維護指導:NGN核心網維

4、護建議和日常維護指導NGN核心網巡檢指導NGN核心網故障分析和解決指導NGN接入設備日常維護指導手冊NGN IP網絡設備日常維護指導手冊NGN服務器設備日常維護指導手冊NGN ORACLE數據庫日常維護指導手冊本文檔為其中的NGN IP網絡設備日常維護指導手冊本文將根據現場情況不斷更新,更新后的文檔將及時發布于客戶支持網站(本文檔的讀者范圍UT斯達康NGN系統的維護工程師及其相關人員,讀者要求具備IP網絡的相關知識和豐富的系統維護經驗。維護過程中如遇到困難或有什么建議,非常歡迎你撥打我們的客戶服務中心電話尋求技術支持。我們公司隨機發給客戶的各種手冊資料上也對所有操作維護和技術問題有詳細的說明請

5、參考使用。寫作目的:本手冊描述了例行維護的內容以及正確的操作步驟,為用戶確定本局維護方案提供了IP網絡例行維護的基本方法和參考依據。使用方法說明:IP網絡日常維護指導書的主要作用在于向機房維護人員說明日常維護需要作什么工作,如何做,結果應該怎樣。在維護過程中機房維護人員需要將維護的結果記錄下來,以作為以后檢查設備運行情況調查故障原因的依據,以保證設備的正常運行做到防患未然。目錄第一章網絡維護建議 (11.1維護人員分工與職責 (11.2故障處理流程 (11.3日常維護參考資料 (11.4維護求助途徑 (1第二章維護內容 (22.1日常維護指導 (22.1.1值班日志表 (22.2月度維護 (4

6、2.3突發維護 (62.3.1一級故障 (62.3.2二級故障 (72.3.3突發故障處理記錄 (8第三章網絡巡檢 (93.1網絡巡檢的重要性和目的 (93.2設備運行情況分析 (93.3節點連通及網絡冗余性分析 (123.4網絡性能分析 (123.4.1直接測試 (123.4.2使用工具進行監測 (133.5IP網絡總體運行狀況分析及報告 (213.5.1設備運行情況分析 (213.5.2節點連通及網絡冗余性分析 (213.5.3網絡性能分析 (21第四章常見網絡故障及解決方法,工具使用 (224.1接口故障 (224.1.1以太接口故障排除 (224.1.2路由器廣域口故障排除 (224.

7、2二層故障 (244.3三層路由問題 (244.4檢測工具使用及cisco網絡日志分析 (244.4.1Ping命令 (244.4.2trace命令 (264.4.3理解Cisco錯誤消息 (284.4.4Ethereal 使用 (284.5SBC常見問題解決 (294.5.1Voip穿越SBC通話一段時間后中斷 (294.5.2MGCP IAD 無法通過SBC注冊的問題 (294.5.3SIP話吧通過Cisco2611無法注冊的問題 (304.5.4sip終端釋放以后短時間內不能注冊的問題 (304.5.5UTSMART電話無法撥打外部電話的問題 (31第一章網絡維護建議1.1 維護人員分工

8、與職責維護人員要求具有一定的IP網絡基礎,熟悉掌握相關IP網絡技術理論;清楚網絡的結構設計,包括網絡拓樸、設備連接、系統參數設置及軟件使用;了解網絡正常運行狀況、注意收集網絡正常運行時的各種狀態和報告輸出參數;熟悉常用的診斷工具,準確的描述故障現象。做好日常維護工作,并及時填寫相應記錄.一旦有異常情況發生,在第一時間按照流程通知Call_log及當地工程師.同時,作為維護人員, 定期觀測網絡運行狀態,在故障發生時,能同我們工程師共同確定網絡故障點,恢復網絡的正常運行。1.2 故障處理流程IP網絡設備處理流程同Call_log處理流程類似,維護人員在第一時間內將相關信息反饋給Call_log。具

9、體信息包括:設備機箱序列號,各模塊信息,軟件版本信息,問題描述,相關檢測命令等運行結果。1.3 日常維護參考資料各設備的特性,命令:1.4 維護求助途徑UT斯達康技術支持熱線:0571-*第二章 維護內容IP 網絡建設完成后,搞好網絡的運行管理是避免網絡故障的關鍵.以下描述相關內容希望能作為日常的維護工作的參考,及時掌握當前網絡運行狀況及隱患,保障系統的安全穩定運行。2.1 日常維護指導2.1.1值班日志表交換局名 日期: 年 月 日 值班時間 時 至 時 值班人 接班人 維護類別維護項目及指導檢查結果 備注 操作人系統運行狀態燈 系統各模塊狀況 sh module 系統運行溫度 sh env

10、 temp硬件情況及外部環境檢查系統外部電源情況 sh env power設備各部分運行溫度應該在45度以下,系統狀態燈為紅,不正?;緺顩r檢查: CPU 利用率 內存利用率#show processes cpu #show processes memory #show buffer #show process顯示正常的CPU 使用率 Averange: <10% Peak: < 70% 顯示內存使用率: I/O freememory>2M Process memory>2M系統日志檢查檢查log server上系統的日志無四級及以下告警(0到4級為正常系統運行狀態燈液

11、晶面板顯示網絡連接檢查#Show arp路由檢查#show routesSBC相關狀態檢查HA檢查#show health SBC可以通過telnet其物理端口IP地址登陸,進行相關操作(結束需用exit正常退出,否則會造成下次登陸無法配置。端口直連鏈路中斷時,液晶屏上會有閃爍的英文提示。液晶屏左邊下面的燈應常綠,上面的燈為常滅,或者常紅(做HA時,黃色表示網絡正在切換。Health值應為100 ,當前工作SBC為active,另一臺為Standby。各關鍵節點連通性利用我們提供的trayping軟件,對各關鍵節點進行ping所有節點的時延平均值小于20ms;時延最大值小于100ms;丟包率在

12、1/10000以內故障情況及其處理遺留問題班長核查表 1 值班日志表2.2 月度維護交換局名維護周期年月日至年月日維護時間檢查人維護類別維護項目及指導檢查結果備注操作人IOS,配置文件備份檢查在特定的備份服務器上,檢查配置文件及軟件版本備份是否與運行設備一致,如不一致,利用tftp軟件,下載運行設備的config及到cisco網站下載相應的軟件路由狀況檢查:單播路由組播路由#show ip route summary#show ip route#show ip mroute#show ip mroute act#show ip mroute summary#show ip mroute cou

13、nt有到各節點路由有正確組播路由HSRP狀態檢查:#show standby brief#show standby 主備設備的狀態應相符VLAN狀態檢查:#show vlan#show vlan sum Vlan名稱、標示正常Trunk和Channel #show trunk#show ethernetchannelport n(n與portchannel號對應Trunk工作正常,多條trunk存在時,對應vlan通過范圍應無重疊。OSPF狀態檢查: #showipospf OSPF狀態應正常,包括正常的ospf路由#show ip route ospf#show ip ospf databa

14、se #show ip ospf neighbor #show ip ospf interface 括正常的ospf路由信息,neighbor信息PIM狀態檢查: #showippim#show ip pim summarystp 檢查 #showspantree 應與設計情況相同NTP同步狀態檢查:#show clock#show ntp status檢查端口狀態檢查正在使用的主要端口的狀態為保證數據有效性,建議提前20小時將各端口計數器清零:#clear counter其后執行如下命令:#show controller#sh ip int brief#show interface#show

15、 int port-channeln顯示工作的端口為UP狀態;Interface(除GW-MPU接口沖突、錯誤等非信息小于1/10000。端口名稱正確;GW聯接的Ethernet端口在halfduplex/100M狀態防火墻檢查 #showfailover#show xlate#show conn#Show sipd SBC檢查#Show algd#show memory#show buffer 查看SIP以及MGCP的相關統計信息;參看系統內存使用情況。CDP檢查#show cdp nei 無多余的設備連接其它#Sh tech故障情況及其處理遺留問題班長核查表 2 月度維護表2.3 突發維護

16、2.3.1 一級故障一級故障是指現有的網絡停機或對最終用戶的業務運作有嚴重影響。由于目前我們的系統已經做到所有網絡設備冗余備份,在單個網絡設備(比如某臺核心交換機完全停機的情況下,系統能自行恢復正常,但存在某些特殊情況對最終用戶的業務運作有嚴重影響 ,原因及解決辦法有以下幾方面:1.對于互相備份的兩臺交互機,信令的EtherChannel一旦不通將致使整個系統中主備設備無法通訊,造成業務異常.目前在現有的系統中,大部分系統信令的Etherchannel只有一對光纖連接,光纖損壞,GBIC口損壞,網絡拓樸結構改變STP設置不正確情況下,就導致信令Etherchannel 不通,具體表現在網關等設

17、備主備切換。緊急處理方法:1在網絡拓樸結構沒有改變的情況下,交換機上channel端口的指示燈變為黃色,在嘗試重啟端口等操作無效的情況下,立即重新選擇另外的端口,配置Etherchannel。2如果由于新的二層設備的接入,STP設置的原因造成Etherchannel不通,可以先斷開新接入的二層設備,升高接入設備的Bridge ID,使其大于核心交換設備的Bridge ID,重新連接。2. 網絡環路的影響.在目前的系統中,某些錯誤的操作引起網絡環路的產生,致使系統形成廣播風暴,整個系統中服務器和終端通訊不正常,從而發生通話中斷。具體表現在交換機上端口指示燈快速閃動,交換設備cpu利用率短時間迅速

18、提高。緊急處理方法:(1 檢查log,一般環路形成時在網絡設備的log中可以看到某一MAC地址在兩端口之間flapping,斷開其中一個端口的連接,檢查本交換設備這兩個端口的STP的設置,如果為off,將其打開。如果portfast已經打開,將其關閉。然后再重新連接。同樣的方法檢查其余網絡設備。3.服務器不能與遠端服務器通訊,具體表現在涉及到此類服務器的業務發生異常。緊急處理方法:(1 本地服務器是否可以ping通本地網關,如果不行,檢查所連接的交換機端口狀態是否正常。(2 如果可以ping通本地網關,檢查是否已經設置缺省網關。(3 檢查是否可以ping通遠端路由網關,如果不行,檢查設備間的聯

19、通性。具體方法是檢查本地路由表中是否有遠端網段路由。(4 如果可以ping通遠端路由網關,檢查遠端服務器是否設置了缺省網關。2.3.2 二級故障二級故障是指現有網絡的操作性能嚴重下降,或由于網絡性能明顯下降,使最終用戶的業務運作重要影響。主要表現在某節點或某些節點大量丟包。如果是某節點丟包,檢查此節點的網絡連接,物理連線是否有損,所連接的端口狀態統計情況。緊急處理方法: 對于雙網卡冗余的服務器,可以切換網卡,對于其他單網卡設備,可以更換上聯端口或物理連線.如果是某模塊上的節點都大量丟包,如果是模塊有損引起,可以使整個模快down掉。2.3.3 突發故障處理記錄發生時間:解決時間:值班人:處理人

20、:故障類別:故障來源:故障描述:處理方法及結果:第三章網絡巡檢3.1 網絡巡檢的重要性和目的力求覆蓋當前網絡設備的運行狀態, 發現網絡規劃和配置中欠佳之處,改善和優化網絡的性能;觀察網絡的運行狀況,及時預測網絡通信質量。3.2 設備運行情況分析針對*市的*設備,確認系統設備的運行狀況(由于各版本的IOS命令差異,文中提到的命令只做參考。網絡設備運行狀態序號內容參考命令期待結果1 檢查版本IOS/COS Image及配置文件#show version#show running-config#show conf顯示版本和配置同設計相符.包括端口的速率、全半雙工、portfast等方面2 基本狀況檢

21、查:CPU利用率內存利用率#show processes cpu#show processes memory#show memory#show buffer#show process顯示正常的CPU使用率(20萬用戶時。Averange: <10%Peak: < 70%顯示內存使用率:I/O freememory>2MProcess memory>2M3 路由狀況檢查:單播路由組播路由#show ip route summary#show ip route#show ip mroute#show ip mroute act#show ip mroute summary#

22、show ip mroute count有到各節點路由有正確組播路由包括:*.sourceaddressGroup-address.Source-address和對應轉發端口如:4 HSRP狀態檢查:#show standby brief#show standby 主備設備的狀態應相符, priority 分別為110和105,正常情況下主備狀態在單一設備上應盡為一種。5 VLAN狀態檢查: #showvlan#show vlan sum Vlan名稱、標示符合設計要求,主備交換機vlan設置一致。6 Trunk和Channel #showtrunk#s

23、how ethernetchannel#show ethernetchannel port#show ethernetchannel port-chann Trunk 工作正常,多條trunk存在時,對應vlan通過范圍應無重疊。7 OSPF狀態檢查:#show ip ospf#show ip route ospf#show ip ospf database#show ip ospf neighbor#show ip ospf interfaceOspf協議運行正常8 PIM狀態檢查:#show ip pim#show ip pim summary組播協議運行正常9 SpanningTree狀

24、態:#show spanning-tree brief#show spanning-tree#show spanning-tree postfast根節點指向應唯一,且符合設計要求。端口forwarding和blocking狀態符合設計。10 NTP同步狀態檢查:#show clock#show ntp status時間應統一準確;ntp同步正常11 檢查端口狀態檢查正在使用的主要端口的狀態為保證數據有效性,建議提前20小時將各端口計數器清零:#clear counter其后執行如下命令:#show controller#show ip interface brief#show interfa

25、ce#show port-channel顯示工作的端口為UP狀態;Interface(除GW-MPU接口沖突、錯誤等非信息小于1/10000。端口名稱正確;GW聯接的Ethernet端口工作在half duplex/100M狀態12 系統日志檢查: #showlogging#show logging buffer 1024 無4級以上告警。Logging buffer size >51200013 其它檢查 #showtech14 SBC檢查 #showmemory#show buffer#show sipd#show algd 檢查系統運行情況,查看sip以及mgcp的當前信息以及相關

26、歷史信息。3.3 節點連通及網絡冗余性分析檢查從各節點到核心系統服務器,各網絡設備間的連通性和路由的冗余性,保證指定路由暢通和冗余測試分項目:各節點間連通性及網絡冗余序號測試步驟命令期待結果1 用PING命令檢查與各設備的連通性#ping *.*.*.* 顯示“!”,所發包全部成功2 用traceroute命令觀察所經路由>traceroute ip_address所顯示的路由正確,為設計所定的優先路由3 用PING命令檢查到各組播組所在網段組播路由正常。#ping #ping 有多個應答,且應答方地址應包括各組播組所在網段設備地址。4. 用tra

27、ceroute命令觀察所經路由>traceroute ip_address所顯示的路由表中冗余路由與設計情況相符3.4 網絡性能分析網絡越復雜對網絡性能的要求也越高,特別是語音,圖像等的傳播,對帶寬和時延都有比較苛刻的要求,因此,我們有必要對網絡性能進行分析。其主要包括網絡時延,丟包率和IP網絡系統帶寬兩部分。3.4.1 直接測試測試分項目:網絡時延與丟包率及帶寬檢測序號測試步驟命令期待結果1 用PING擴展命令檢查與各遠端交換機路由器的端口的連通性,測試包數量不小于100000 #pingProtocol ip:Target IP address:1Repeat

28、 count 5:10000Datagram size 100:Timeout in seconds2:Extended commandsn:Sweep range of sizesn:顯示“!”,丟包率小于1/10000;時延平均值小于20ms;時延最大值小于100ms2. 本地接入帶寬測試: 在FTPClient上從本地FTP Server下載* >ftp ip_addressusername: *password:*ftp>get *應大于數據流所經鏈路(E1/10M/100M最小帶寬標稱值的70%。3 遠程(跨E1/10M/100M/1000M接入帶寬測試: 在FTP Cl

29、ient上從遠端FTP Server下載* ftp ip_addressusername: *password:*ftp>get *應大于數據流所經鏈路(E1/10M/100M最小帶寬標稱值的70%。3.4.2 使用工具進行監測目前的網絡監測工具,大致可以分為軟件測試和硬件測試兩個方面。硬件由于其投入較大且使用較為專業,在此不做介紹。在MSwitch系統里??梢酝ㄟ^網管軟件得到一些簡單的網絡統計信息,不過為了得到較為直觀,準確,實時的測試結果,推薦使用專業軟件進行網絡檢測,評估。NGN IP網絡設備日常維護指導手冊 BWMeter BWmeter是一個功能強大的帶寬測試和

30、監視程序,它可以測量并顯示出你的網絡上的所有 流量.對于使用UTsmart軟件的PC來說,可以使用該軟件判斷當前pc的帶寬使用情況,根據實 際情況調整網絡資源分配.該軟件可以在各知名下載站點免費下載,大小幾百k,利用安裝向 導安裝該軟件并重啟pc后,就可以運行. 圖1 圖一是一些基本配置,包括需要監視的端口(每個端口都會生成一個監測窗口.在上 圖中定義了監視兩個端口,點擊"OK"確認后,得到如圖二的兩個檢測窗口. 在窗口里,我們可以看到實時的網絡流量,以及UL(上載和DL(下載的平均值和峰 值. 客戶成功,我們成功 14 NGN IP網絡設備日常維護指導手冊 圖2 在圖三所

31、示的過濾設置當中,我們可以根據源地址,目的地址,協議以及端口進行過 濾,從而可以監視特定的流量. 圖3 客戶成功,我們成功 15 NGN IP網絡設備日常維護指導手冊 在圖4的StopWatch這個選項里面,可以選擇在設定的時間段里檢測特定端口的網絡流 量. 圖4 使用BUmeter,可以讓我們對自己的網絡使用情況有一個清晰,直觀的了解.但是對于語 音數據在特定網絡環境下的檢測,BUmeter力不從心. NetIQ Chariot Chariot軟件由Chariot控制臺,測試腳本以及EndPoint組成,這樣面對不同的網絡環 境,只需要提供不同的腳本, 就可以完成真實數據流的

32、模擬,是業界公認的第三方評測軟 件.該軟件分為console端和客戶端,至少需要兩臺PC才能進行點到點之間的測試(其中一臺 同時運行控制臺和Endpoint.可以到 到下載試用版本,在下載之前,會被要求進行注冊. 客戶成功,我們成功 16 NGN IP網絡設備日常維護指導手冊 運行該軟件,可以看到如下的界面. 圖5 點擊紅色框中的按鈕,彈出如圖6的設置選項,可以進行協議選擇,終端IP選擇等等.點 擊"Run"選項里面的"run"就開始進行兩個終端之間的語音流量檢測. 圖6 運行一段時間后,Chariot生成相應的測試結果. 客戶成功,我們成功 17 NG

33、N IP網絡設備日常維護指導手冊 由下面的Throughput曲線可以看到,IP語音所占用的帶寬大致都在0.008M上下;這個與 我們設置里面的G.729協議標準是相符的. 圖7 同時,該軟件可以看到語音傳輸的MOS值(圖8,時延(圖9等等. 圖8 客戶成功,我們成功 18 圖9上述測試,只是得到了在純語音包傳輸時的網絡情況,而在實際的語音傳輸中,語音包還有相應的一些RTP,IP報頭,報尾等等,我們需要進行進一步的測試。打開一個新的測試窗口,點擊圖10中紅色框中的按鈕,可以得到一個彈出窗口,進行相關設置。 圖10進行相關設置時,我們需要點擊彈出框下方的”Select Script”進行測試腳本

34、的選擇。在圖中,我們選擇了遠距離,文件發送這個腳本來進行測試(如圖11所示。 圖11點擊運行后,就可以看到語音包在實際的傳輸當中加上必要的包頭,包尾后所需要占用的帶寬的測試結果。同時,測試結果里還可以看到時延,丟包率等相關參數。 圖12在實際的網絡環境里,通常是多種數據流在一個物理線路上面傳輸,網絡設計者對網絡進行了相應的QOS,而Chariot軟件也可以根據需求進行在不同的排隊策略下特定的網絡流量傳輸測試。除了對語音流量進行測試外,Chariot還可以對數據流,媒體流,組播,多播等進行模擬評測,需要時請參照Chariot的說明手冊進行相關測試。3.5 IP網絡總體運行狀況分析及報告*市*系統

35、IP網絡系統的巡檢包括設備運行情況,節點連通及網絡冗余情況,網絡性能三個方面,其分析結果如下:3.5.1 設備運行情況分析本部分檢測涉及IOS版本,設備基本狀況等方面,其中*參數符合網絡設計和運行要求,*參數不符合要求,原因有*,改造建議有* .3.5.2 節點連通及網絡冗余性分析本部分檢測涉及節點連通及網絡冗余方面,其中*符合網絡設計要求,*不符合要求,原因有*,改造建議有*.3.5.3 網絡性能分析本部分檢測涉及及網絡冗余方面,其中*符合網絡設計要求,*不符合要求,原因有*,改造建議有*.第四章 常見網絡故障及解決方法,工具使用4.1接口故障4.1.1以太接口故障排除以太接口的典型故障問題

36、是:帶寬的過分利用;碰撞沖突次數頻繁;使用不兼容的幀類型。使用show interface fa mod/num 命令可以查看該接口的吞吐量、碰橦沖突、信息包丟失、和幀類型的有關內容等。1通過查看接口的吞吐量可以檢測網絡的利用。如果網絡廣播信息包的百分比很高,網絡性能開始下降。 可以進一步查明網絡廣播源,是否存在二層環路等.2兩個接口試圖同時傳輸信息包到以太電纜上時,將發生碰撞。以太網要求沖突次數很少,不同的網絡要求是不同的,一般情況發現沖突每秒有3、5次就應該查找沖突的原因了。碰撞沖突產生擁塞,碰橦沖突的原因通常是由于敷設的電纜過長、過分利用,端口全半工不匹配導致.4.1.2 路由器廣域口故

37、障排除端口及線路協議狀態錯誤原因解決方案 Serial x is up, line protocol is up此狀態為正確狀態Serial x is down,line protocol is down路由器未檢測到載波信號1.傳輸線路不通2.路由器的連接線未連接,或未連接正確。3.路由器硬件故障步驟1檢測傳輸線路步驟2檢查你是否使用正確的電纜與端口步驟3改換路由器另外端口,以確認是否為硬件故障Serial x is up, 1.本地或遠程路由器配置錯誤步驟 1設置端口本地自環,再用show interfaces serial command 觀察線line protocol is down

38、錯誤2. 遠程路由器未配置keepalives 參數。3.傳輸線路錯誤:problem-noisy line,or misconfigured or failedswitch4.本地或遠端的CSU/DSU 故障5.路由器硬件故障路協議是否為up若為up 狀態則表明故障原因在于傳輸線路或遠程路由器配置錯誤步驟2確認電纜插在正確的端口,正確的CSU/DSU ,和正確的配線架端口上步驟3如認為路由器硬件故障,更換端口進行測試。Serial x is up, line protocol is up (looped線路中存在自環設置: 1. 硬件自環 2. 軟件自環步驟 1使用show running-

39、config 命令察看端口設置中是否有loopback 設置 步驟2若存在loopback 設置 用no loopback 去掉此設置步驟3若不存在loopback 設置,檢查CSU/DSU 是否存在自環設置Serial x is administratively down, line protocol is down1.路由器端口配置中存在shutdown 命令2.重復的IP 地址 步驟 1檢查路由器配置是否存shutdown 命令步驟2使用 no shutdown 端口命令去掉shutdown 命令步驟3使用show running-config 命令檢查是否存在重疊的IP 地址。步驟4若

40、存在,則改變IP 地址。4.2 二層故障目前對于我們網絡影響較大的是二層環路的影響,由于私自添加HUB等設備,在物理連接導致二層環路.在這種情況下,可以通過sh logging 命令檢查,發現某一mac在兩個port之間flap,通過斷開某一個端口的連接來解決.4.3 三層路由問題路由器中部分或全部ospf路由表現不穩定,路由表中一會加上,一會又沒了,且時間間隔很短,變化很快,可以從以下幾方面考慮.a.網絡中線路狀態不佳,導致線路時通時斷;b.有可能同一AS內,Router ID重復了,ospf協議中規定,一個AS內,Router ID必須唯一,否則協議會出現故障.建議查找cisco設備log

41、,看是否有Router ID重復告警.4.4 檢測工具使用及cisco網絡日志分析4.4.1 Ping命令Ping是最常使用的故障診斷與排除命令。它由一組ICMP回應請求報文組成,如果網絡正常運行將返回一組回應應答報文。ICMP消息以IP數據包傳輸,因此接收到ICMP回應應答消息能夠表明第三層以下的連接都工作正常。Cisco的ping命令不但支持IP協議,而且支持大多數其他的桌面協議,如IPX和AppleTalk 協議的ping命令。我們首先看一下支持IP協議的ping命令以用戶EXEC方式執行的情況,然后再討論在特權模式下,擴展的ping命令包含的許多強大功能。用戶執行模式IP PING 簡

42、單的IP ping既可以在用戶模式下執行,也可以在特權模式下執行。正常情況下,命令會發送回5個回應請求,5個驚嘆號表明所有的請求都成功地接收到了響應。輸出中還包括最大、最小和平均往返時間等信息。每一個“!”表明一個echo響應被成功的接受,如果不是“!”號,則表明echo響應未被接收到的原因:!響應成功接收請求超時U 目的不可達P 協議不可達N 網絡不可達Q 源抑制M 不能分段?不可知報文類型特權執行模式在特權執行模式下,擴展的ping命令適用于任何一種桌面協議。它包含更多的功能屬性,因此可以獲得更為詳細的信息。通過這些信息我們可以分析網絡性能下降的原因而不單單是服務丟失的原因。擴展的ping

43、命令的執行方式也是敲入ping。然后路由器提示各種不同的屬性。EXTENDED IP PING 其使用方法如下所示:YH-Router#pingProtocol ip:Target IP address: 2Repeat count 5: 10Datagram size 100: 1600Timeout in seconds 2:Extended commands n: ySource address or interface: Type of service 0:Set DF bit in IP header? no:Data pattern 0

44、xABCD:Loose, Srict, Record, Timestamp, Verbosenone:Sweep range of sizes n:Type escape sequence to abort.Sending 10, 1600-byte ICMP Echoes to 2, timeout is 2 seconds:!Success rate is 100 percent (10/10, round-trip min/avg/max = 36/39/48 ms首先我們討論特權模式下的ping的各種可用屬性。每種屬性的缺省值在括號中顯示。Protocol 需要

45、測試的協議。Target address 測試的目標地址。Repeat count 如果出現間歇性的失敗或者響應時間過慢,ping重復的次數。Datagram size 如果懷疑報文由于延遲過長或者分段失敗而丟失,則可以提高報文的大小。例如,我們可以使用1600字節的報文來強制分段。Timeout 如果懷疑超時是由于響應過慢而不是報文丟失,則可以提高該值。Extended commands 回答確定以獲得擴展屬性。Source address 必須是路由器接口的地址。Type of service 根據RFC 791 TOS規定的屬性,通常缺省值為0。Set DF bit in IP head

46、er?通過設置DF位禁止分段,即使是報文超過了路由器定義的MTU也禁止分段。Data pattern 0xABCD 通過改變數據模式可以測試線路的噪聲。Loose,Strict,Record,Timestamp,Verbosenone 這些都是IP報文頭的屬性。一般只使用Record屬性和Verbose,其他屬性很少被使用。Record可以用來記錄報文每一跳的地址, Verbose屬性給出每一個回應應答的響應時間。Sweep range of sizes n 該屬性主要用于測試大報文被丟失、處理速度過慢或者分段失敗等故障。4.4.2 trace命令trace命令提供路由器到目的地址的每一跳的信

47、息。它通過控制IP報文的生存期(TTL字段來實現。TTL等于1的ICMP回應請求報文將被首先發送。路徑上的第一個路由器將會丟棄該報文并且發送回標識錯誤消息的報文。錯誤消息通常是ICMP超時消息,表明報文順利到達路徑的下一跳,或者端口不可達消息,表明報文已經被目的地址接收但是不能向上傳送到IP 協議棧。為了獲得往返延遲時間的信息,trace發送三個報文并顯示平均延遲時間。然后將報文的TTL字段加1并發送3個報文。這些報文將到達路徑的第二個路由器上,并返回超時錯誤或者端口不可達消息。反復使用這一方法,不斷增加報文的TTL字段的值,直到接收到目的地址的響應消息。在有些情況下,使用trace命令可能會

48、導致故障。因為IOS中存在與trace命令相關的bug。這些bug的相關信息可以從CCO得到。另外一個問題是,某些目標站點不響應ICMP端口不可達消息。當命令的輸出顯示一系列星號(*時,就可能碰到了此類站點。用戶可以使用Ctrl-Shift-6中斷命令的執行。用戶執行模式下面展示了一個簡單的在用戶執行模式下執行的trace命令的輸出。到達目的地的距離是3跳。TTL值為1的3個報文的響應消息是ICMP超時錯誤,并且返回報文的IP地址有兩個。因為路由器1和路由器2在同一個網段中,并且它們到路由器3的距離都是一跳,因此這些路由器都響應該報文。Router3#trace 9Typ

49、e escape sequence to abort.Tracing the route to Router9 (91 Router2 ( 0 msecRouter2 ( 0 msecRouter1 ( 0 msec2 29 12 msecRouter6 (29 12 msec 12 msec3 Router4 ( 12 msec 12 msecRouter9 (9 12 msec 12 msecRouter3下面列出了

50、IP trace命令的輸出中出現的不同字符及其含義:XY msec 在接收到響應消息之前的往返延遲(以毫秒為單位* 報文超時?報文類型不能識別U 端口不可達P 協議不可達N 網絡不可達H 主機不可達Q ICMP 源抑制特權模式擴展Trace 用于擴展ping命令的許多屬性都可以用來擴展trace命令的功能。擴展trace命令的特殊屬性有:Numeric display 在缺省情況下,trace命令的輸出中既包括IP地址也包括其對應的DNS 域名。如果用戶不需要顯示DNS域名,則可以使用該屬性。Probe count 其缺省值為3,用戶可以根據需要進行調整。TTL 該值可以在最大和最小TTL值之

51、間變化。Port number 這是一個非常有用的屬性,它可以使工程技術人員跟蹤特定的傳輸層端口。因此,不但可以確認源端與目的端之間的IP連通性,而且可以確認高層服務是否可被訪問。與trace命令相關的另外一個問題是,如果存在到達目的地的多條路徑,返回報文的源地址可能不相同。在這種情況下,用戶需要仔細比較不同返回報文的延遲時間。如果仍不能得到明確的結果,可以遠程訪問路徑上的一個或多個路由器,使用trace命令訪問源地址和目的地址。4.4.3 理解Cisco錯誤消息錯誤消息格式系統錯誤消息格式如下:%Facility - subfacility - Severity - Mnemonic : M

52、essage TextFacility 它指出錯誤消息涉及的設備名。該值可以是協議、硬件設備或者系統軟件模塊。Subfacility 它僅與通道接口處理器(CIP卡有關。詳細的信息可以參見Cisco文檔的相關章節。Severity 它是一個范圍在0到7之間的數字。數字的值越小,嚴重程度越高。Mnemonic 唯一標識錯誤消息的單值代碼。該代碼通??梢园凳惧e誤的類型。Message Text 它是錯誤消息的簡短描述,其中包括涉及的路由器硬件和軟件信息。4.4.4 Ethereal 使用Ethereal是一個常用的網絡抓包工具。對VOIP 接入設備進行troubleshooting時,我們可以利用

53、該軟件抓包來跟蹤相關數據,從而確認故障原因。該軟件可以在各大知名下載站點免費下載。關于該軟件的具體使用方法,請參照NGN接入設備維護指導手冊第六章,在此不作贅述。NGN IP網絡設備日常維護指導手冊 4.5 SBC常見問題解決 由于IP地址資源緊張以及安全等原因,在現在的網絡當中,NAT的使用越來越普遍,為了 使Voip應用普遍適用于這些網絡情況,Utstarcom在系統當中引入了SBC(session border controller作為Voip穿越NAT的proxy. 下面,列出了一些SBC安裝調試過程當中容易遇到的問題及其解決方法,作為大家日常 維護,問題處理時的參考. 4.5.1 V

54、oip穿越SBC通話一段時間后中斷 故障現象:IAD終端以及SIP phone穿越SBC通話時,發現經過2到4分鐘,就出現不能繼續通 話情況. 故障原因:終端在通話的時候,并沒有收到(或者收到錯誤的SBC發出的鏈路?;钚畔?(對于MGCP來說,是AUEP包,對于SIP phone 來說,是注冊請求包.過了一段時間后,CSA 誤認為該終端已經失效,將鏈路釋放.這是由于NAT當中的映射保持時間a小于SBC和終端之間 的?;钚畔⒔粨Q時間b(默認的MGCP是180s,SIP是200s,所以當經過時間a秒后,在NAT 內,該映射無任何信息通過,NAT釋放該映射.這導致了CSA無法將鏈路?;钚畔l到終端

55、上. 解決方法:修改MGCP的AUEP包間隔和SIP的registration-interval為較短時間(AUEP30秒, registration-interval為40秒. 4.5.2 MGCP IAD 無法通過SBC注冊的問題 故障現象:在iAD 通過SBC向注冊時,不能夠注冊成功,例如一個名為SBCtest的iAD設備, 在經過SBC轉化后,變成了SBC的地址加中括號,即為4,此時可以看 到slr.log中出現獲取用戶信息出錯,導致設備注冊失敗 故障原因:系統無法辨認經過SBC轉換過的注冊包,導致無法注冊 解決辦法:經過SBC的轉化作用,RSIP包中的endpoint由 * EI terminal ip, 這樣,CSA 變成了 EI/* SBC的MGCP 就不能獲得slr的位置信息,不能正確注冊.這時,我們需要 在NMS的CS-A的配置管理-呼叫處理-域中需要加入MGCPrealm,填寫為SBC作為CSA 側 terminal的ip地址, 這樣才能得到用戶的信息,注冊成功. 客戶成功,我們成功 2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論