時間:2022-10-02 09:42:37
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇網絡故障范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
關鍵詞:網絡故障;故障檢測;故障定位;故障診斷;專家系統;數據挖掘;神經網絡
中圖分類號:TP393.06
隨著計算機、通信以及互聯網技術的飛速發展及應用,網絡作為一種重要的工具,在軍事、政治、經濟和科研等諸多領域起著越來越重要的作用,已經成為社會生產和生活必不可少的一部分。與此同時,網絡的規模和復雜性不斷增大,一旦網絡發生故障,如果不能在有效時間內對網絡故障進行診斷與修復,將會造成巨大的損失,甚至嚴重威脅社會的安全與穩定,因此對網絡故障診斷技術進行研究具有越來越重要的應用價值和現實意義。
1 網絡故障診斷一般過程
通常來說,網絡故障診斷是以網絡原理、網絡配置和網絡運行的知識為基礎,根據網絡出現的故障現象,并使用專門的網管理和檢測工具以獲取告警信息進而對網絡中出現的故障進行診斷、恢復以及預測的過程,一般可分為以下五個部分[1]:
(1)故障檢測,即網絡故障告警信息的獲取。網絡發生故障時,通過主動輪詢或異步收集方式,對網絡中的相關設備或服務的相關告警信息、設置和性能參數,狀態信息等進行收集和分析,及時發現網絡出現的故障及問題。
(2)故障定位,即定位故障源。對故障檢測階段收集的海量告警數據進行分析和處理,在網絡中找出故障,為下一步的故障原因的診斷提供依據。
(3)故障原因的診斷,即查找故障產生的根源。根據故障定位的結果綜合運用各種規則進行系統的推理,快速的找到故障產生的原因或者最可能的原因。
(4)故障修復。根據網絡故障診斷結果修復網絡故障,恢復網絡的正常運行。
(5)故障預測,即根據先驗知識和監測數據預測網絡可能發生的故障。
其中故障檢測,故障定位,故障原因診斷是必不可少的三個步驟,下面將重點對上述三個步驟進行詳細的介紹。
2 網絡故障檢測
通常計算機網絡通過以下兩種方式收集信息,通過分析收集到的信息來檢測故障[2]。
(1)Trap機制。在網絡中每一個被管設備中都要運行一個程序以便和管理站中的管理程序進行通信。
(2)主動輪詢。網絡中發生故障的被管設備或服務主動向網絡管理系統發出告警信息,能夠及時發現網絡中的故障,網絡管理系統還需通過主動輪詢這種方式了解與網絡性能密切相關的信息,并對這些影響網絡性能信息設置閾值,來判斷網絡性能,超過設定閾值也會觸發事件。
3 網絡故障定位
網絡系統中,一般通過監測被管設備或服務等各種方法獲取大量原始告警數據或歷史積累信息,這些數據往往由于通信系統的復雜性、網絡結構異構性、噪聲、外界因素、因果關系等原因而具有相當大的不確定性和不精確性,導致故障癥狀和故障原因都存在非線性映射關系,需要利用關聯技術對數據進行處理和分析才有效的進行故障定位[3],目前常用的故障定位技術主要有下面幾種:
3.1 基于人工智能的故障定位技術
3.1.1 基于規則的推理技術
基于規則的推理(Rule-based Reason,RBR)是最簡單的關聯技術,已被用于多種構架。一般而言,基于規則的系統由三個組成部分組成,如圖1所示。
(1)推理引擎,主要提供解決問題所需要的策略。
(2)知識庫,提供和定義與問題相關的規則和專家知識。
(3)工作內存,主要提供解決問題所需要的數據。
在基于規則的推理的網絡故障定位系統中,知識庫充當一個專家的角色,利用從人類專家獲取專家積累的經驗和知識,這些知識主要包括對網絡問題的定義以及當某一特定問題發生時,網絡故障定位系統需要執行的操作。工作內存主要是利用具體的網絡協議對網絡中的被管設備或服務進行監測,得到有關被管設備或服務的各種信息。在對網絡故障進行定位時,推理引擎與知識庫共同合作,將監測得到的網絡中被管設備或服務的狀態信息與知識庫中定義好的條件部分進行比對,根據條件滿足與否,來進行網絡故障的定位。
基于規則的網絡故障定位系統,由于無需對專家系統的具體結構和操作細節進行深入了解,從而具有結構簡單等諸多優點,并且實現起來比較簡單,非常適用于小型系統。但是基于規則的網絡故障定位系統在匹配規則時,需要網絡狀態與知識庫中的規則條件精確匹配,否則將推出整個推理過程,無法定位故障,并且規則存在不易維護性和指數增長性,所有這些缺點決定了基于規則的網絡故障定位系統不適用大型系統。
3.1.2 基于模型的推理技術
基于模型的推理(Model-based Reason,MBR)是建立在面向對象上的基礎之上,利用現有的專家經驗和知識,將具體的目標系統中的實體都模型化診斷對象,并且明確地表現出現實目標系統中對象之間存在的各種關聯關系,再根據系統模型對具體的目標系統的行為進行推測。由于通常情況下,具體的目標系統與理想的系統模型之間存在差異性,因此基于模型的推理的專家系統需要對推測的行為和目標系統的實際行為進行不一致診斷,以確定具體目標系統中的故障根源。
為了更好地說明基于模型的推理專家系統的工作流程,文獻[4]使用一個物理模型和對應的對等模型分別如圖2、3所示的網絡系統。網絡系統按一定的周期,有規律的向圖2中的被管設備發送ping命令以監測網絡系統中的被管設備是否運行正常。管理系統和被管設備之間通過一個模型對象實現彼此之間的相互通信,具體來說,如圖2所示,系統中的集線器模型向被管設備集線器發送ping命令,路由器模型則向被管設備路由器發送ping命令。當目標網絡發生故障時,如果故障發生在集線器1,則集線器1模型可以將其發現并且識別出來,如果集線器1模型連續3次向被管設備集線器1發送ping命令,在3次響應超時以后,集線器模型1根據現有的網絡現象推測被管設備集線器1有可能發生故障,或者說目標系統中的故障位于集線器1。集線器1模型則會在確定故障并正式發送告警信息之前,集線器1模型將分析自身與圖2中其他被管設備的模型之間的關系以此來確定其是否應該詢問網絡中路由器模型,如網絡中的路由器模型返回的是相應的被管路由器設備工作處于正常狀態,則集線器1觸發警報。
3.1.3 基于范例的推理技術
基于范例的推理(Case-based Reason,CBR)故障定位技術與前面的基于規則推理技術和基于模型推理技術相比具有很大的差異性,主要因為基于范例的推理技術的思想源于人類現實生活,主要根據過去積累的實際經驗或經歷,利用類比的推理方法對現有的新問題做出相似的解答,然后根據新問題與舊問題之間的差異對解答進行修改從而得到新問題的完全解答。基于范例推理的網絡故障定位技術主要由四個部分組成,檢索 (Retrieve)、復用(Reuse)、修正(Revise)、保存(Retain),簡稱4R過程。
基于范例推理的故障定位技術與基于規則推理的故障定位技術相比,由于在基于范例推理的故障定位技術中檢索只是基于對案例的部分匹配,而基于規則推理的故障定位技術則是完全匹配,因此基于范例推理的故障定位技術對網絡配置變化的適應度更好,更適用于問題的總體解決方案。
3.2 模型遍歷技術
模型遍歷技術(Model traversing techniques)是一種構建網絡故障傳播模型的方法,該方法在構建故障傳播模型時,主要根據網絡在運行時各種被管對象之間的相互關系,并且按照從引起事件的被管對象開始的順序進行構建。該方法主要適用于網絡中被管對象之間的相互關系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統配置變化較頻繁時該方法的魯棒性很好。模型遍歷技術主要具有兩大特點,事件驅動和事件關聯,所謂事件驅動是指在一個故障癥狀報告到來之前,系統一直處于等待故障癥狀狀態;事件關聯則是確定兩個故障癥狀是否來源同一個事件源。
一般情況下,模型遍歷技術需要在其事件報告中明確標識網絡系統中故障的征兆類型、征兆目標等相關信息,如果網絡系統中出現故障征兆,且不妨用si來表示該故障征兆,當si的目標和si來源相同,則說明si是一個次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術的整個處理可分為以下3步:
(1)首先,對網絡中的每個事件,依據網絡在運行時各種被管對象之間的相互關系對其構建一個和事件源相關的對象圖。
(2)當給定的兩個事件的對象圖相交時,此時說明兩個圖至少包含同一個對象,則認為這兩個對象圖的事件源是關聯的。
(3)當給定三個故障癥狀si,sj,sk,其中si,sj相互關聯,sj,sk相互關聯,則根據故障癥狀的傳遞性可知si是一個次要的故障癥狀。
4 網絡故障原因診斷
(1)基于信號處理方法。該方法主要是依據信號模型,直接對網絡系統中的可測信號進行分析與處理,并通過提取可測信號的頻率等特征值,對網絡中存在的故障原因進行診斷。
(2)基于解析模型的方法?;诮馕瞿P偷姆椒ㄖ饕罁祵W模型和數學方法來進行故障原因的診斷,在診斷時需要建立對象的精確數學模型。
(3)基于知識檢測的方法。與基于解析模型方法相比,此方法最大的特點在于其并不需要對象的精確數學模型就可以對網絡中的故障原因進行診斷。
下面主要介紹幾種目前國內外研究學者研究比較多的基于知識檢測的方法,基于專家系統故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經網絡故障原因檢測方法。
4.1 基于專家系統故障原因診斷方法
基于專家系統故障原因診斷系統主要是利用人類專家的經驗和歷史積累診斷數據,使用一定的方法將其轉化為系統能夠識別的規則存在專家系統的知識庫中。當網絡中出現故障時,診斷系統利用專家系統知識庫中的規則,對發生故障網絡中的被管對象的各項性能參數進行處理與分析以正確的確定網絡故障發生的具體原因[5]。組成由人機接口、推理機、知識庫等六部分組成:
目前,國內外學者公認的專家系統瓶頸是知識獲取問題,因為專家系統在診斷過程中主要依賴于從人類專家領域內獲取的知識、經驗和以往診斷數據,而這些獲取起來途徑有限,操作起來具有一定的局限性和復雜性。另外,專家系統在實時性和學習能力等方面也存在一定的局限性,因此目前通常將專家系統同其他方法相結合以提高專家系統在這些方面存在的局限性和不足。
4.2 模糊故障診斷方法
很多時候,網絡中的故障與系統得到的網絡現象之間存在非線性的映射關系,這種非線性的映射關系很難用確定的數學公式或者模型來刻畫,相應的在故障原因診斷時,很難給出故障的精確原因。相反,只能給出故障發生的可能原因。對于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。
目前使用的比較多的是向量識別法,其診斷過程可分為以下3步:
首先,需要根據網絡中的故障與表征網絡故障的數據,建立二者之間的關系,通常用關系矩陣R來表示。
其次,對需要診斷的目標網絡系統(對象)進行狀態檢測,提取相關的特征參數以構建特征向量矩陣X。
最后,根據模糊理論和矩陣理論,求解前面兩步構建的關系矩陣方程Y=X?R,得到關系矩陣方程的解Y,再根據隸屬度等原則,對目標網絡系統的故障向量Y進行處理,得到故障的原因。
從上述診斷過程可知,在模糊故障診斷中,正確的進行故障原因診斷的前提是建立關系矩陣R、隸屬函數、特征值向量X,而這些矩陣、函數、向量的建立是人為構造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對特征元素的選取也有一定的要求,所以兩者若處理不當,會導致該方法的診斷結果精度嚴重下降甚至完全錯誤。
4.3 BP神經網絡診斷方法
由于人工神經網絡的這些特性以及網絡中故障與征兆之間有可能存在的非線性映射關系,使得人工神經網絡在網絡故障診斷中大有用武之地。目前,人工神經網絡已經大量應用在網絡故障診斷領域。BP神經網絡是常用的人工神經網絡模型[6]。
BP神經網絡故障診斷分為訓練和診斷兩個階段:
(1)訓練階段。BP神經網絡對樣本進行訓練,以選定網絡結構和規模,確定網絡總層數、各層神經元數。借助BP學習算法,將原始網絡收集到的故障樣本的特征參數作為BP神經網絡輸入樣本集,以與之對應的網絡故障原因編碼為BP神經網絡的輸出,以此對BP神經網絡進行訓練。
(2)故障診斷階段。主要對待檢測對象的故障樣本進行特征提取和歸一化處理,然后輸入到BP神經網絡進行診斷輸出診斷結果,整個過程分為以下4個步驟:1)故障樣本集預處理。2)BP網絡結構設計。3)訓練BP神經網絡。4)故障診斷。
5 結束語
本文對網絡故障的概念以及基本過程進行了概述,重點對當前網絡故障中的故障檢測、故障定位、故障診斷的關鍵技術及方法進行了研究和總結歸納,對開展網絡故障診斷技術研究具有一定的指導意義。
參考文獻:
[1]王成等.網絡故障診斷技術研究[J].科技信息,2011(11).
[2]陳琳.一種網絡環境中的故障診斷模型[J].北京航空航天大學學報,2004(11).
[3]張燕.網絡故障診斷關鍵技術[J].電腦知識與技術,2009(31).
[4]李千目.戰略互聯網智能診斷技術研究[D].南京理工大學,2005.
[5]吳曉知,李興明.網絡故障管理專家系統中知識庫的構造[J].微計算機信息,2008(06).
[6]戚涌,劉鳳玉.基于BP神經網絡的網絡智能診斷系統[J].微電子學與計算機,2004(10).
關鍵詞:光路傳輸
故障現象:一輛2011年產寶馬740Li轎車,車型為F02,搭載N63發動機,行駛里程2萬km。用戶反映該車中央顯示器黑屏。
檢查分析:維修人員試車發現,該車除顯示器黑屏外其他系統工作正常。通過故障診斷儀查看網絡圖(圖1),發現網絡中光纖局域網部分的網絡傳輸存在異常。
光纖局域網是通過光路來傳送數據的,各控制單元之間的數據總線采用光路串聯方式連接。而對串聯方式而言,任何地方出現斷點的話,整個局域網都會癱瘓。從網絡分布圖可以看出,由于車載電腦CIC的光路出現了斷路,所以導致整個局域網無法傳輸數據。
檢查車載電腦CIC的電源,正常。斷開車載電腦CIC的光纜插接器后重新插上,正常情況下插接器會持續發光近10s,表明光路已接通。但該車的插接器卻完全不亮,說明總線驅動器沒有工作。
故障排除:更換CIC,故障排除。
(杜強)
奔馳轎車換擋闖車
關鍵詞:電路接觸不良
故障現象:一輛2011年產奔馳C200轎車,搭載271型發動機和722.6型自動變速器,行駛里程3萬km。用戶反映該車有時換擋沖擊嚴重。
檢查分析:維修人員試車,發現該車換擋沖擊現象實為偶發。當故障出現時,換入倒擋沖擊非常明顯,這說明故障與油壓控制有關。檢測變速器控制單元,未發現故障碼。檢測發動機控制單元時,發現其保存有與變速器控制單元通信中斷的故障記錄。對于控制器局域網而言,這類故障通常是由作為通信對象的控制單元電源中斷引起。
查看變速器控制單元的電路圖(圖2),得知其電源是由前指令接收執行單元SAM提供的。打開SAM的上蓋,可以看到具體的執行元件是一個繼電器。拔下繼電器測量各端子之間的電阻,正常。
不插繼電器,將SAM上對應繼電器輸入、輸出端的插座跨接。試車發現故障不再出現,說明故障點就在繼電器內部。于是拆開繼電器外殼檢查,發現其電磁線圈的引線端從接點處翹起(圖3),這導致了電路接觸不良。
故障排除:更換繼電器,故障排除。
(致遠)
奔馳旅行車連桿斷裂
關鍵詞:連桿彎曲
故障現象:一輛2006年產奔馳R500旅行車,搭載273型V8發動機和722.9型自動變速器,行駛里程14萬km。該車行駛中發動機缸體突然被連桿洞穿。
檢查分析:維修人員為查明導致這起嚴重故障的原因,將損壞的發動機解體檢查。發現由于1缸連桿斷裂,導致缸體破損(圖4)。據用戶反映,故障發生前沒有任何預兆。那么究竟是什么原因造成了如此嚴重的后果呢?
仔細觀察氣缸壁發現,1缸第一道活塞環留下的活塞上止點印痕有下沉的跡象(圖5)。根據新印痕的色澤判斷?;钊霈F下沉已經很久。這表明在故障出現前,1缸連桿早已出現了彎曲。
這就解釋了故障發生得如此突然的原因。原來連桿出現彎曲后,在彎曲部位便出現了橫向剪切力。隨著發動機運轉時間的增加,連桿受傷部位的疲勞度也在不斷積累。當某一瞬間連桿彎曲部位所受到的剪切力大于其承受強度時,連桿便發生了斷裂。從連桿斷裂處金屬表面的顏色(圖6)也可看出,的確是彎曲在前斷裂在后。
那么又是什么原因導致連桿彎曲呢?檢查發現1缸的進排氣門都被頂彎了,但從活塞頂部的印記看(圖7),這應是連桿斷裂后,活塞運動與氣門不同步所造成的。既然氣缸內無任何異物,推測連桿的彎曲是在用戶不知情的情況下由于氣缸進水造成的。
故障排除:更換缸體和活塞總成,故障排除。
(王述杰)
高爾夫旅行車行駛異常
關鍵詞:氧傳感器信號偏差
故障現象:一輛2012年產進口高爾夫旅行車,行駛里程2萬km。用戶反映該車最高時速超不過60km/h。
檢查分析:維修人員試車,發現該車怠速運轉平穩,但行駛中加速明顯無力。檢測發動機控制單元,發現有氧傳感器的故障提示(圖8)。根據經驗,若是氧傳感器失效的話,一般不會對車輛行駛產生如此嚴重的影響。但此時除了此故障提示外,別無其他提示。
為了明確氧傳感器信號與車輛行駛異常之間的關系,還是決定先查看與氧傳感器有關的數據。讀取發動機控制單元第32組數據(圖9)時發現,氧傳感器在怠速時工作基本正常,但在部分負荷狀態下其信號偏高的自適應值卻達到了極限。根據車輛的行駛狀況看,氧傳感器的實際信號應該是超出了其自適應的范圍。這樣在部分負荷條件下,由于氧傳感器的信號偏差,使噴油量不斷增加,導致混合氣燃燒不良,發動機輸出扭矩下降。
關鍵詞:故障樹;網絡故障;系統研制
中圖分類號:TP393.08 文獻標識碼:A文章編號:1007-9599 (2011) 12-0000-01
Network Failure Analysis System Development Based On Fault Tree Theory
Guo Yiwei1,Li Jinsong1,Huang Hongyong2,Xiao Jian2,Du Wenzheng1
(1.Xihua University,School of Mechanical Engineering and Automation,Chengdu610039,China;2.PLA 92762 Troops,Xiamen361000,China)
Abstract:In this paper the fault tree analysis techniques applied to fault diagnosis in computer networks,network management to improve the reliability,stability,flexibility,speed and accuracy of fault diagnosis,rapid network fault diagnosis,prediction and maintenance,to ensure high network service quality and reliability.
Keywords:Fault tree;Network failure;System development
一、引言
隨著計算機網絡的爆炸式的增長。網絡無處不在,廣泛的深入到人們的生活,網絡基礎設施的完善極大的促進了現代社會的發展。人們對網絡的可靠性也提出了更高的要求:能夠及時快速的進行網絡故障分析,對保持網絡的健康狀態具有重要的意義。然而隨著網絡規模的日益膨脹,網絡故障分析遇到了極大的困難,其主要表現在以下幾個方面:
1.現代信息技術的廣泛應用,計算機網絡規模、網絡復雜性和多樣性都有了巨大的發展。大規模網絡的故障關系錯綜復雜,網絡故障分析難度越來越大。
2.新的網絡設備產品不斷推出,功能越來越多,結構越來越復雜、產品規格和標準不完全統一提高了故障診斷的難度。
3.國際互聯網深入到人們的生活之中,網絡信息量急劇膨脹,對網絡故障分析提出了越來越高的要求。
二、計算機網絡的層次化體系
為了在所有類型的計算機系統之間建立允許通信的網絡系統,人們就推出了OSI參考模型。其含義就是推薦所有公司使用規范來控制網絡。這樣所有公司都有相同的規范,就能相互聯接。提供各種網絡服務功能的計算機網絡系統是非常復雜的。根據分而治之的原則,ISO將整個通信功能劃分為七個層次:應用層、表示層、會話層、傳輸層、網絡層、數據鏈路層、物理層。
三、計算機網絡數據的傳輸
OSI七層模型的每一層都對數據進行封裝(網絡節點將要傳送的數據用特定的協議頭打包來傳輸數據),以保證數據能夠正確無誤的到達目的地,被終端主機理解及處理。
四、網絡故障故障樹的建造
網絡故障模式多種多樣,發生故障的原因復雜,一個簡單的故障模式就可能對應兩條甚至多條原因,不同的故障模式下的原因也有可能部分相同;一個故障模式的發生還可能會導致其它故障模式的發生,關系的交織和相互影響,就使分析十分困難。在建造故障樹過程中我們基于OSI參考模型來建造故障樹網絡故障主樹如圖所示;物理層故障主樹、數據鏈路層故障主樹、網絡層故障主樹、傳輸層故障主樹、應用層(應用層、表示層、會話層)故障主樹。
實際當中我們要了解的是設備發生了哪種故障,是從在線監測的數據和故障征兆來判斷的。所以在了解故障樹和故障模式分析所形成的關于網絡故障機理和故障診斷實踐的經驗知識基礎上,我們就要來研究分析來判斷故障模式,形成分析報告。實際分析過程中,系統會依據規則知識,結合網絡的結構、運行、維護等具體情況,對網絡設備進行故障判斷。
故障分析系統可以使計算機軟件系統能夠運用知識和事實以及推理機制去解決通常需要人類專家才能解決的復雜的問題。故障分析就是這樣一個整體判斷的完整的復雜系統。
五、分析系統的結構
故障分析系統工作原理如圖所示。故障分析系統以用戶提供的事實為基礎,根據系統的故障樹知識庫,利用一定的推理方法進行推理判斷,最后輸出結果。從結構上講主要是由故障樹知識庫和推理機所組成。
故障分析系統的功能是根據一定的推理策略從知識庫中選擇有關知識,對有關的證據進行推理,直到得出相應的結論為止。網絡設備故障分析系統推理策略主要包含正向推理和反向推理兩種方法:
基于數據的正向推理是:從己知的關于被診斷設備事實(主要指異?,F象和試驗數據)出發,不斷匹配規則前提,直到得出關于故障模式的所有結論。
基于目標的反向推理:從故障模式的假設出發,不斷地反向應用診斷知識進行規則前提的假設驗證,當假設沒有可用的規則時,推理機主動向用戶詢問。
反向推理目的性強,要求用戶參與,但由于推理進程中假設多,因而推理搜索過程長且比較盲目。
參考文獻:
[1]比奇洛,孫遠運等.計算機網絡故障排除與維護實用大全[M].北京:中國鐵道出版社,2006
【關鍵詞】網絡故障 物理故障邏輯故障 維修方法
【中圖分類號】TP393.01 【文獻標識碼】A 【文章編號】1672-5158(2013)04-0169-01
研究背景
計算機網絡是由計算機各種軟硬件和通信相關設備組成的系統,即利用各種通信手段,把空間上分散的計算機連在一起,達到相互通信而且共享軟件、硬件和數據等資源的系統。隨著計算機網絡的發展,人們的生活得到了巨大的便利,但計算機網絡的連接多樣性、終端分布不均勻性和網絡的開放性、互連性等特征,網絡故障也越來越多,目前在各單位的網絡中都存儲著大量的信息資料,幾乎所有是工作也依賴于網絡,一旦網絡被破壞造成信息的丟失將帶來巨大損失。加強因此怎樣解決網絡故障是我們要面對和解決的重要問題,本文就是通過計算機網絡故障進行分析并提出相應的對策,最后達到更好的運用計算機網絡的目的。
常見網絡故障
連通故障
連通故障又可以稱為物理故障一般,即物理層中物理設備相互連接失敗或者硬件及線路本身的問題:一是線路的連接故障,由于網線在使用過程中的損壞老化,或者接口處的松動等造成的網絡連接故障。二是由于接口配置問題的物理故障,即由于接口的松動或者其他因素的損壞,使網線無法正常接入以及此類相關設備損壞導致故障。三是網卡的物理故障,主要是指由于網卡松動,使網絡連接失效。
邏輯故障的種類
計算機網絡的邏輯故障又稱軟件故障,主要是指軟件安裝或網絡設備配置錯誤所引起的網絡異常,其中最常見的是網絡設備配置錯誤。邏輯故障與連接故障相比復雜得多。常見的網絡邏輯故障有:主機邏輯故障、進程或端口故障、路由器邏輯故障等。主機邏輯故障通常包括網卡驅動程序、網絡通信協議安裝錯誤、網絡地址參數配置不正確等。進程或端口故障是指進程或端口由于受到病毒或系統的影響而無法啟動。路由器邏輯故障是指因為端口的配置錯誤而導致的網絡故障,如路由器CPU利用率高和路由器內存余量太小以及SNMP進程意外關閉而造成的故障。另外網絡地址的安全問題,也是計算機網絡故障之一。網絡用的TCP/IP協議本身就是一種安全風險,大量重要程序都以TCP為傳輸層協議,因此TCP的安全性問題會給網絡帶來嚴重的后果。四是網絡結構的安全問題。互聯網由無數個局域網組成,通常情況下計算機之間互相傳送的數據流要經過重重轉發,因此,攻擊者只要接入任一節點就可以捕獲所有數據包從而竊取關鍵信息。
計算機網絡安全的相關技術
雖然計算機網絡面臨著諸多的安全問題,但是目前已有比較成熟的網絡安全技術,包括防病毒軟件、防火墻、入侵檢測、安全掃描等多個安全組件組成,主要有防火墻技術、數據加密技術、入侵檢測技術、防病毒技術等。
防火墻技術:
“防火墻”既可以阻止外界對內部網絡資源的非法訪問同時也可以防止系統內部對外部系統的不安全訪問,其主要技術包括:數據包過濾、應用級網關、服務和地址轉換。
數據加密技術:
加密的目的是保護網絡節點之間的鏈路信息安全,可以進行數據加密、身份鑒別、訪問控制、數字簽名、數據完整性驗證、版權保護等,用戶可根據網絡情況選擇對稱密鑰密碼體制和非對稱密鑰密碼技術等不同的加密方式。信息加密過程操作簡單,但是意義重大,在多數情況下,信息加密是保證信息機密性的唯一方法。
入侵檢測技術:
分別基于網絡和基于主機。由于網絡的入侵檢測系統主要采用被動方法收集網絡上的數據。目前,在實際環境中應用較多的是基于主機的入侵檢測系統,它可以不受網絡協議、速率和加密的影響直接針對主機和內部的信息系統同時還具有檢查木馬等功能。
防病毒技術:
網絡防病毒軟件則主要注重網絡防病毒。嘗試利用360安全衛士等具有殺毒和軟件修復功能的瀏覽器或Firefox瀏覽器,可以清除病毒,防止病毒軟件對計算機網絡系統的破壞。
安全對策以及維護方法
對計算機網絡的維護包括對硬件的維護和對軟件的維護。對硬件的維護包括檢測聯網電腦網卡、網線、集線器、交換機、路由器等故障、計算機硬盤、內存、顯示器的維護。首先要仔細檢查計算機網卡是否運行正常,檢查網線以及網卡指示燈,如果出現故障,應及時更換網線,集成器等部件。檢查網絡插口股,在網絡連接過程中,會因為物品擠壓以及不小心造成的損壞,以及接口處的松動,而導致計算機無法聯網,此時應對計算機與插口間的電纜線進行檢查。利用測線儀等工具測試網線、接口、網卡以及交換機端口是否正常。對由于路由器配置錯誤會導致的故障,方法就是重新配置路由器端口的靜態路。如果是由,只有對路由器進行升級、擴大內存。
對計算機軟件的維護包括計算機網絡設置的維護,對網絡安全l生的檢測,以及對網絡通暢性的檢測。多為瀏覽器本身故障或被惡意軟件篡改破壞,導致無法瀏覽網頁,對網絡設置的維護。首先,檢查Ping線路近端的端口是否處于關閉的狀態,若是因為端口處于關閉狀態,只需重新啟動該端口即可。檢查lP地址,TCP/IP選項參數是否正確,當所填參數有誤時,可以通過lP地址,TCP/IP選項參數進行修改核對。對網絡安全性的維護包括安裝殺毒軟件,經常性的進行查殺毒處理,安裝的防火墻,設置高密的防治網絡安全入侵的加密處理,定期的對網絡加密設置進行更新。例如及時查殺病毒并,避免使用非正規的磁盤,不要打開垃圾郵件,不要隨意點擊非法網站。
【論文摘要】:隨著網絡技術的發展,網絡故障也表現為多樣化,網絡故障的查找與排除也相對復雜。結合工作經驗的實例,分析了氣象業務中網絡故障的不同種類,并提出了切實有效的診斷及排除方法。
隨著越來越多的先進技術和服務引入到氣象業務網絡中,網絡管理和維護工作變得越來越復雜。局域網在氣象系統廣泛應用中,常遇到各種故障,正式運行的網絡一旦出了問題,需要及時進行檢測和診斷,盡快定位并排除故障。
下面介紹一下網絡故障的診斷和排除方法。
一、主要的故障種類
根據網絡故障的性質把網絡故障分為物理故障與邏輯故障,也可根據網絡故障的對象把網絡故障分為路由故障和主機故障。
1.1物理故障
物理故障即硬件連接故障,指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。網卡沒有連接到主板上,網卡的電源燈和數據燈都不亮,設備管理器中檢測不到網卡。網線沒有連接好,網卡已經驅動,協議也添加,但仍然不能上網,觀察網卡硬件連接,網卡只有一個燈亮,不閃爍。
如兩個路由器Router直接連接,這時應該讓一臺路由器的出口連接另一臺路由器的入口,而這臺路由器的入口連接另一路由器的出口才行。當然,集線器C6D、交換機、多路復用器也必須連接正確,否則也會導致網絡中斷。還有一些網絡連接故障比較隱蔽,要診斷它只有靠經驗。
1.2邏輯故障
邏輯故障中最常見的情況就是配置錯誤,指因為網絡設備的配置原因而導致的網絡異常或故障。配置錯誤可能是路由器端口參數設定有誤,或路由器路由配置錯誤以至于路由循環或找不到遠端地址,或者是路由掩碼設置錯誤等。邏輯故障的另一類就是一些重要進程或端口關閉及系統的負載過高。如線路中斷,沒有流量,用ping發現線路端口不通,檢查發現該端口處于down的狀態,說明該端口已經關閉,導致故障。
1.3路由器故障
線路故障中很多情況都涉及到路由器,也可以把一些線路故障歸結為路由器故障。檢測這種故障,需要利用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數據、計費數據、路由器CPU的溫度、負載以及路由器的內存余量等數據,通常情況下網絡管理系統有專門的管理進程,不斷地檢測路由器的關鍵數據,并及時給出報警。
1.4主機故障
主機故障常見的現象就是主機的配置不當。如主機配置的IP地址與其它主機沖突,或IP地址根本就不在子網范圍內,由此導致主機無法連通。主機的另一故障就是安全故障。主機沒有控制其上的finger、RPC、rlogin等多余服務。而攻擊者可以通過這些多余進程的正常服務或bug攻擊該主機,甚至得到Administractor的權限等。
二、故障的檢測和診斷
大多計算機用Windows操作系統,Windows提供了一些命令行檢測工具,這些工具是網絡診斷中常用的,而且一般的問題大都可以通過這些命令診斷出來。如果對這些命令很熟悉,在網絡出故障時就會運用自如。
2.1用連接故障診斷工具Ping網絡診斷
輸入命令:ping172.18.82.201(172.18.82.201為本機地址),顯示:Pinging172.18.82.201with32bytesofdata:Replyfrom172.18.82.201:bytes=32time=10msTTL=128有"time="的內容,表明可以ping通,網絡協議TCP/IP協議正常。執行ping命令后得到信息:Pinging172.18.82.201with32bytesofdata:Requesttimedout.表示不可以ping通,或者是tcp/ip協議可能有問題,或者是計算機到交換機間的硬件連接存在問題。
測試數據傳輸丟包,輸入Pingstatisticsfor172.18.72.56,顯示:Packets:Sent=4,Received=2,Lost=2(50%loss),Approximateroundtriptimesinmilli-seconds:Minimum=177ms,Maximum=182ms,Average=89ms信息表示發送了4個數據包,回送收到2個,丟失2個,丟失率為50%。發送數據包最快回送時間177ms,最慢回送時間182ms,平均89ms。如可以ping通自己,也可以ping通鄰居或能看到其他機器,表明本地設置正確。網關可以通過軟件實現協議轉換操作,能起到與硬件類似的作用。ping網關地址,例如ping172.18.82.17-t,就可以查看與網關是否連通。
2.2pathping命令
pathping用于跟蹤數據包到達目標所采取的路由,并顯示路徑中每個路由器的數據包損失信息,也可以用于解決服務質量連通性問題。是一個比tracert更為有用的工具。它將ping和tracert命令的功能和這2個工具所不提供的其他信息結合起來。由于該命令顯示數據包在任何給定路由器或鏈路上丟失的程度,因此可以很容易地確定可能導致網絡問題的路由或鏈路。不過WIN9X/Me、WindowsNT不提供此命令。命令格式是:pathpingtargetname,比如c:\>pathping172·19·3·1,
Computingstatisticsfor75seconds···
SourcetoHereThisNode/Link
HopRTTLost/Sent=PctLost/Sent=PctAddress
0jishu-sun[172·19·1·242]0/100=0%|
10ms0/100=0%0/100=0%172·19·1·20/100=0%|
25ms1/100=0%1/100=0%172·19·6·20/100=0%|
34ms0/100=0%0/100=0%172·19·3·1
Tracecomplete·
可以看出,它先提供給我們查看路由的結果,然后等待75s(此時間根據躍點數變化)最后顯示測試結果。第3列是源到當前的丟包數。第4列是指明線路和路由器丟包情況,最右邊的欄中標記為"|",表明沿線路轉發丟失的數據包,該丟失表明鏈阻塞;最右邊欄中為IP地址的,表明該路由器的丟失率,可能是由于路由器CPU超負荷所致。如果某一處丟包嚴重,則應采取必要的措失,以提高通信質量。
三、故障排除的解決方案
不系統的故障診斷與排除方法將導致在網絡故障現象相互依賴和偶然性的迷宮中浪費時間。系統的網絡故障排除方法的總體思路是系統地將產生故障可能的原因所構成的1個大集合縮減成1個小的子集或者直接確定故障起因。
3.1網絡適配卡中斷與其他硬件資源沖突
在"系統"的"設備管理器"查找旁邊出現感嘆號的有黃圈的網絡適配器項目,找到項目網絡適配器可能與其它設備使用同樣的資源設置。雙擊網絡適配器項目,在網絡適配器"資源"中更改網絡適配器的中斷和I/O地址,避免與其它硬件沖突。用即插即用的網絡適配卡,可使用制造商提供的安裝盤將即插即用型改為跳線型,設置網絡適配卡的中斷和I/O地址。
3.2在"網上鄰居"中沒有顯示網絡中的其它計算機
打開"網上鄰居"時,將顯示你的計算機,如果計算機所在的工作組設置不正確,打開"網上鄰居"時看不到所需的計算機。在"網絡"的"標識"更改工作組的設置。
確認計算機是否安裝了必要的網絡組件,如果沒有安裝正確的網絡客戶、適配器和協議組件,將不能與網絡通信。在"網絡"的"配置"中可看已安裝的網絡組件。確認所安裝的網絡客戶軟件和協議是否適合所連接的網絡。局域網中盡量采用TCP/IP和NETBEUI協議,或者只用NETBEUI協議。
參考文獻
計算機網絡技術的普及和發展,給人們的生存方式帶來了巨大的變革。人們通過計算機網絡獲取資源、交換信息已經成為一種常態,但在網絡的使用過程中難免會存在各種問題,對人們的學習、工作和生活造成不便,甚至影響到關鍵數據和經濟財產的安全。因此,了解計算機網絡的常見故障和處理方法尤為重要。
1 計算機網絡的故障類型
計算機網絡故障一般可分為物理故障和邏輯故障兩類。
物理故障是指由于硬件原因引起的網絡故障,常常表現為本地連接斷開、網絡時斷時續等。常見的物理故障包括網線損壞、路由器和交換機故障、網卡損壞、元件接觸不良等。
邏輯故障通常表現為本地連接受限、網絡不穩定、瀏覽器顯示異常等。邏輯故障主要由計算機網絡參數錯誤、網卡驅動不兼容、路由器配置不合理和病毒入侵等原因造成。
2 計算機網絡故障的診斷方法
計算機網絡故障具有多變性和復雜性,涉及網線、網卡、路由器、病毒等多方面原因,當計算機網絡發生故障時,我們可以根據經驗初步判斷故障類型,逐層排查,最終確定故障所在。計算機網絡故障的診斷應從三個方面入手。[1]
1)先檢查可直接觀察和判斷情況的外部設備,如網線是否損壞、路由器指示燈是否正常等,再考慮設備內部的軟硬件問題。
2)先檢查是否為本地計算機的網絡故障,如病毒入侵、驅動程序損壞、網卡松動等,再考慮網絡鏈路、路由器、交換機的故障。
3)先檢查計算機、路由器的網絡參數配置,如果沒有問題,再考慮設備的硬件故障。
3 常見故障的分析和處理方法
3.1 物理故障
1)線路連接問題
線路連接問題是硬件故障中最常見的一種,占所有網絡故障的70%以上。[2]常見的線路故障包含接口松動、線路損壞和電磁干擾三類,例如路由器或交換機的電源插頭未通電、RJ45水晶頭損壞或松動、網線因擠壓和拉扯而損壞、周邊有較強電磁波干擾等。線路連接的檢測可通過替換排除法和專業儀器測試的方式進行。對于水晶頭和線路損壞等問題,可通過更換來解決;對于電磁干擾問題,則可選用屏蔽強度較高的網線。
2)路由器和交換機故障
路由器和交換機是計算機網絡中路由轉發和數據交換的核心設備,是局域網內設備能否連通廣域網的關鍵。路由器和交換機故障主要是指物理損壞,造成設備不能通電、端口故障等問題,可通過信號燈的狀態和替換排除法進行判斷。
信號燈的狀態直接反映了路由器和交換機的工作狀態,如系統運行和端口連通是否正常。在使用替換排除法時,可將網線逐個連接到路由器和交換的端口進行檢測,如果部分端口連通正常,則可判定為設備的端口故障;如果所有端口均不能連通,則可判定為零部件發生故障。如果路由器不能加電而電源線連通正常,則考慮是路由器的電源問題。
3)計算機網卡問題
計算機網卡發生故障,也將導致網絡連接出現問題,常見的故障包括網卡松動、網卡金手指氧化、網卡硬件故障、卡槽損壞等。網卡的故障檢測分為兩個步驟進行:(拔出網卡,仔細清理卡槽內的灰塵,用橡皮擦小心擦拭網卡金手指,之后重新插入卡槽,如果恢復正常則認定為網卡松動和金手指氧化所引起的接觸不良。(如步驟一無法恢復正常,可將正常使用的網卡更換到故障計算機中,如果問題得以解決則說明是網卡硬件故障,更換網卡即可,否則就可能是網卡的插槽損壞。
3.2 邏輯故障
1)路由器參數配置問題
路由器在購買和安裝之后通常需要進行參數配置,包括網絡參數、DHCP、安全管理等設置,如果參數配置錯誤,則會引起網絡連接不上、經常掉線等問題。路由器的參數配置首先是WAN口的配置,需要根據具體的網絡環境設置WAN口的連接類型和連接模式,例如靜態IP還是PPPOE撥號、是自動連接還是定時連接等。
在一些大型的局域網環境中,難以做到給每一臺計算機進行參數分配,為了避免IP地址沖突和提高使用運行效率,還需進行DHCP服務器的配置,如果參數配置出現問題,則會影響整個局域網的連接。此外,有些路由器還進行了安全管理設置,如訪問限制、防火墻和遠程web端口的設置等,都影響了用戶的網絡連接。
2)計算機網絡配置問題
計算機的網絡配置主要是指通信協議(TCP/IP)的配置,通信協議被破壞或遭到篡改都會導致網絡連接故障。當計算機出現網絡連接受限等提示時,應首先檢查TCP/IP的設置是否正確,如是否設置了靜態IP和DNS服務器的地址,以及IP地址是否和路由器在同一個網段等。如果網絡連接正常,QQ能正常使用但不能訪問瀏覽器網頁時,則往往是DNS的配置出現錯誤,一般來說,重新設置DNS服務器的地址即可解決問題。
3)計算機網卡驅動程序問題
計算機網卡驅動程序的問題一般分為兩種:驅動程序未安裝或被卸載、驅動程序與網卡不兼容。使用者由于誤操作而刪除驅動程序和相關文件的事情時有發生,造成網絡連接錯誤或找不到本地連接等問題,可打開設備管理器,查看網絡適配器的運行狀態,如果有黃色問號或運行不正常等提示,則卸載驅動程序重新進行安裝。
網卡驅動程序不兼容的問題常常出現在重裝電腦的過程中,造成驅動程序無法安裝或網絡連接故障等,可對驅動程序進行升級,或下載官方驅動程序重新安裝,一般可解決問題。
4)網絡病毒攻擊和黑客入侵問題
網絡病毒攻擊和黑客入侵波及范圍大、危害程度高,是最常見網絡故障誘因之一,可造成計算機網絡訪問異常、整個局域網運行緩慢、核心設備參數被篡改、關鍵數據被盜取等種種問題,嚴重的可引起整個網絡癱瘓、造成經濟損失和威脅人身安全,是計算機網絡安全防護的重中之重。一旦出現網絡連接異常和安全信息提示時,應立即進行漏洞修復、病毒掃描等相關處理。此外,路由器、防火墻等核心網絡設備的管理賬號和口令應具備較高的復雜性,以提高網絡安全防護性能。
4 計算機網絡的維護
為了減少網絡故障的發生、提高網絡運行的效率和安全性,在使用過程中,我們還需對計算機網絡進行合理的維護,主要包括以下幾方面。
1)定期檢查設備的運行情況
定期檢查計算機、路由器、交換機等設備的運行情況,對出現故障的設備進行及時的維修和更換,避免因設備的突然損壞造成不必要的損失;同時應對軟件系統進行維護和更新,及時修復系統漏洞、安裝系統更新、升級安全防護軟件,保證網絡的穩定運
2)加強安全防護措施
加強路由器的安全性措施,限制系統的物理訪問,禁用不必要的功能和端口,嚴格管理登錄賬號和口令,防止病毒攻擊和黑客入侵;[3]還可設置一定的網絡訪問限制,規定哪些網站用戶不可訪問,避免用戶因誤操作而帶來的安全隱患。
3)保持網絡機房的環境衛生
計算機、路由器等設備在使用的過程中,CPU、主板、風扇、卡槽等部位容易積累大量的灰塵?;覊m會影響設備的散熱性能,造成零部件的接觸不良,加速設備的老化,而且容易引發靜電,可能導致元件的損壞。因此,需定期對設備進行除塵,保持網絡機房的環境衛生。
5 結束語
隨著科學技術的發展,計算機網絡已經成為人們生活的重要組成部分,了解計算機網絡的常見故障和處理方法,重視計算機網絡的日常維護,才能使我們做到在故障發生前積極防范、在故障發生后迅速補救,使網絡的運行更穩定、更高效、更安全。
“邯鄲學步”也好,“照貓畫虎”也罷,總之,一遇到網絡故障,就按照這些思路來辦吧!
一位網管的牢騷
現在的網吧客人,開機不會,輸入法切換不會,字母大小寫轉換不會,玩私服登錄器怎么用不會,QQ開語音不會,進了游戲不會退出,私服服務器關了說我機子有問題。語音聊天不會開MIC,說網吧耳機是壞的,看電影嫌不是普通話的!QQ登錄不上說機器不好,我跑過去一看,密碼不對,他還問我密碼多少!!
打個CS別人放顆煙霧彈,他遭閃了,狂喊:網管死機了……今天有客人還問我,網管我這里怎么沒有QQ幣呢,你幫我下載點QQ幣……我%#%##,那玩意要是能下載,我TMD就不用上班了~
小提示:如何具體對某層進行排查?
網絡故障在OSI模型的每一層,都有相應的檢測排查工具或措施:物理層,使用專門的線纜測試儀;數據鏈路層,使用簡ARP命令來檢查MAC地址和IP地址之間的對應關系;網絡層,除使用ping命令測試連通性和route命令查看路由配置外,還需要使用網絡檢測分析軟件對網絡層和傳輸層的數據通信進行檢測分析;應用層,檢測應用程序配置是否正確,對應用程序自身進行測試。
總原則:OSI模型與網絡故障的排除
做網管的,相比對“OSI”這個概念或多或少都有了解吧。為了降低設計的復雜性,增強通用性和兼容性,所有的計算機網絡都設計成層次結構,并且是統一的――這種層次結構就是OSI。
1.通過OSI模型來排查問題
那么,這個OSI模型與解決網絡故障有什么關系呢?實際上,一個很簡單的道理――既然任何網絡都是由這7層構成的,那么網絡發生故障,也就是7層中的某一層,或者某幾層出了問題,所以解決故障,就是解決層的故障了。這么說可能大家有點暈乎乎,我們舉個例子來講一下吧。
實例1:某客戶端不能訪問web服務
我們一般解決這一故障的思路是:首先檢查客戶端Web瀏覽器是否正確配置,可嘗試使用瀏覽器訪問另一個Web服務器;如果Web瀏覽器沒有問題,可在Web瀏覽器上測試Web服務器是否正常運行;如果Web服務器沒有問題,再測試網絡的連通性……
這個思路是什么意思呢?其實它就是從OSI模型的“應用層”出發,一直到“物理層”(網卡是否損壞?網線是不是斷了?)。
網管在分析和排查網絡故障時,應充分利用網絡這種分層的特點,快速準確地定位并排除故障,這便是本文要介紹的總體思路。
2.兩種逐層排查方式
對于這一思路,通常有兩種逐層排查方式:一種是從低層開始排查,適用于物理網絡不夠成熟穩定的情況,如組建新的網絡、重新調整網絡線纜、增加新的網絡設備等;另一種是從高層開始排查,適用于物理網絡相對成熟穩定的情況,如硬件設備沒有變動,而軟件曾經變動,比如新裝了TCP/IP協議、重裝了操作系統和瀏覽器等等。
無論哪種方式,最終都能達到目標,只是解決問題的效率會不同而已。比如實例1中,如果你顛倒順序,從“物理層”開始排查,那問題最終可以解決,但恐怕得花上一整天,結果卻發現――原來是那個網站出了問題,別的一切正常……
小提示:什么是OSI模型?
OSI,即OpenSystemInterconnection,開放系統互聯。最早的網絡剛剛出現的時候,很多大型公司都擁有網絡技術,公司內部計算機可以互相連接,但卻不能和其他公司連接,因為沒有一個統一規范。ISO正是為此而來,它把網絡分為物理層、數據鏈路層網絡、網絡層、傳輸層、會話層、表示層、應用層等7層,其中每一層都有其作用(見圖1)。
圖1
3.不可過于教條
前面介紹的兩種“逐層”排查方式顯得比較古板,實際操作時,大家記得要靈活運用,否則可能浪費很多時間和精力。一種比較通用的方法是――折中法。
第1步 涉及網絡通信的應用出現故障,直接從位于中間的網絡層開始排查,首先測試網絡連通性。具體就是使用ping命令。這也是幾乎所有網絡故障發生后,網管第一步要做的就是ping的原因。
第2步 如果網絡不能連通,再從物理層(測試線路)開始排查。如果網絡能夠連通,再從應用層(測試應用程序本身)開始排查。
實例2:網絡之間不能正常通信
方法1:首先我們要ping遠程計算機,成功則說明系統和網絡正常,失敗后再ping同一子網的網關來確定是否能連接到路由器。失敗后再ping 127.0.0.1來確認TCP/IP協議是否正常。
方法2:首先ping 127.0.0.1,如果成功則ping同一子網的網關,如果成功則ping其他網關,直到最后ping遠程主機。
這兩種排查方法的思路是不一樣的,方法1是從高層到低層,而方法2是從低層到高層。至于具體如何靈活去安排排查的順序,這個是不一定的,需要大家經驗的積累,經驗能告訴你究竟怎樣效率最高。
習慣:網絡故障排除的經驗
前面我們從技術的角度來介紹一些排除故障的思路,下面就從人為經驗方面做些介紹。實際上,一個好的習慣對故障解決是非常重要的,尤其是長期需要和“故障”打交道的網管。
第1步 你真的知道“故障”是怎么回事嗎?
在開始排除故障前,準備好紙和筆,將故障現象記錄下來。在識別故障的時候要注意以下幾點:
當故障發生的時候,正在運行哪些程序?
這些程序以前是否成功運行過?
如果成功運行過,最后一次運行是在什么時候?
發生故障之前對系統、軟件配置以及硬件設備配置做了哪些更改?
第2步 列舉可能導致故障產生的所有原因
將所有可能導致這一結果的情況列出來,記得不要放過任何細節、任何可能。比如無法瀏覽網頁時,到底是網卡故障、網絡連接問題,還是網絡協議設置不當,或者是IE瀏覽器的參數設置有誤,或者干脆是ISP出了問題?
第3步 縮小包圍圈
故障排除的時候有幾個原則:
先操作簡單的,后操作復雜的:比如ping就很簡單,而要用測試儀查查網線是否斷裂就是復雜的。
先來“軟”的,后來“硬”的:對軟件設置問題的解決往往具有回溯性,且容易操作,建議將這部分放在最開始。
從本機到本地,從本子網到大局域網,從局域網到互聯網:范圍由小到大,容易讓問題不那么復雜。