網(wǎng)絡(luò)故障檢測技術(shù)論文
計(jì)算機(jī)網(wǎng)絡(luò)故障種類較多,計(jì)算機(jī)網(wǎng)絡(luò)故障檢測是一個(gè)復(fù)雜的系統(tǒng)工程,不僅對網(wǎng)絡(luò)故障處理步驟有所要求,而且對網(wǎng)絡(luò)故障分析方法以及計(jì)算機(jī)故障維護(hù)都有極高的要求。下面是由學(xué)習(xí)啦小編整理的網(wǎng)絡(luò)故障檢測技術(shù)論文,謝謝你的閱讀。
網(wǎng)絡(luò)故障檢測技術(shù)論文篇一
網(wǎng)絡(luò)故障診斷技術(shù)概述
摘 要:對網(wǎng)絡(luò)故障診斷技術(shù)進(jìn)行了概述。介紹了網(wǎng)絡(luò)故障診斷的基本概念及一般過程,重點(diǎn)對網(wǎng)絡(luò)故障診斷中的故障檢測、定位、原因診斷三個(gè)主要階段的關(guān)鍵技術(shù)和方法進(jìn)行了深入研究,總結(jié)了相關(guān)領(lǐng)域經(jīng)典主流方法,并給出了方法具體過程和細(xì)節(jié)。
關(guān)鍵詞:網(wǎng)絡(luò)故障;故障檢測;故障定位;故障診斷;專家系統(tǒng);數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP393.06
隨著計(jì)算機(jī)、通信以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展及應(yīng)用,網(wǎng)絡(luò)作為一種重要的工具,在軍事、政治、經(jīng)濟(jì)和科研等諸多領(lǐng)域起著越來越重要的作用,已經(jīng)成為社會生產(chǎn)和生活必不可少的一部分。與此同時(shí),網(wǎng)絡(luò)的規(guī)模和復(fù)雜性不斷增大,一旦網(wǎng)絡(luò)發(fā)生故障,如果不能在有效時(shí)間內(nèi)對網(wǎng)絡(luò)故障進(jìn)行診斷與修復(fù),將會造成巨大的損失,甚至嚴(yán)重威脅社會的安全與穩(wěn)定,因此對網(wǎng)絡(luò)故障診斷技術(shù)進(jìn)行研究具有越來越重要的應(yīng)用價(jià)值和現(xiàn)實(shí)意義。
1 網(wǎng)絡(luò)故障診斷一般過程
通常來說,網(wǎng)絡(luò)故障診斷是以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運(yùn)行的知識為基礎(chǔ),根據(jù)網(wǎng)絡(luò)出現(xiàn)的故障現(xiàn)象,并使用專門的網(wǎng)管理和檢測工具以獲取告警信息進(jìn)而對網(wǎng)絡(luò)中出現(xiàn)的故障進(jìn)行診斷、恢復(fù)以及預(yù)測的過程,一般可分為以下五個(gè)部分[1]:
(1)故障檢測,即網(wǎng)絡(luò)故障告警信息的獲取。網(wǎng)絡(luò)發(fā)生故障時(shí),通過主動(dòng)輪詢或異步收集方式,對網(wǎng)絡(luò)中的相關(guān)設(shè)備或服務(wù)的相關(guān)告警信息、設(shè)置和性能參數(shù),狀態(tài)信息等進(jìn)行收集和分析,及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)出現(xiàn)的故障及問題。
(2)故障定位,即定位故障源。對故障檢測階段收集的海量告警數(shù)據(jù)進(jìn)行分析和處理,在網(wǎng)絡(luò)中找出故障,為下一步的故障原因的診斷提供依據(jù)。
(3)故障原因的診斷,即查找故障產(chǎn)生的根源。根據(jù)故障定位的結(jié)果綜合運(yùn)用各種規(guī)則進(jìn)行系統(tǒng)的推理,快速的找到故障產(chǎn)生的原因或者最可能的原因。
(4)故障修復(fù)。根據(jù)網(wǎng)絡(luò)故障診斷結(jié)果修復(fù)網(wǎng)絡(luò)故障,恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行。
(5)故障預(yù)測,即根據(jù)先驗(yàn)知識和監(jiān)測數(shù)據(jù)預(yù)測網(wǎng)絡(luò)可能發(fā)生的故障。
其中故障檢測,故障定位,故障原因診斷是必不可少的三個(gè)步驟,下面將重點(diǎn)對上述三個(gè)步驟進(jìn)行詳細(xì)的介紹。
2 網(wǎng)絡(luò)故障檢測
通常計(jì)算機(jī)網(wǎng)絡(luò)通過以下兩種方式收集信息,通過分析收集到的信息來檢測故障[2]。
(1)Trap機(jī)制。在網(wǎng)絡(luò)中每一個(gè)被管設(shè)備中都要運(yùn)行一個(gè)程序以便和管理站中的管理程序進(jìn)行通信。
(2)主動(dòng)輪詢。網(wǎng)絡(luò)中發(fā)生故障的被管設(shè)備或服務(wù)主動(dòng)向網(wǎng)絡(luò)管理系統(tǒng)發(fā)出告警信息,能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)中的故障,網(wǎng)絡(luò)管理系統(tǒng)還需通過主動(dòng)輪詢這種方式了解與網(wǎng)絡(luò)性能密切相關(guān)的信息,并對這些影響網(wǎng)絡(luò)性能信息設(shè)置閾值,來判斷網(wǎng)絡(luò)性能,超過設(shè)定閾值也會觸發(fā)事件。
3 網(wǎng)絡(luò)故障定位
網(wǎng)絡(luò)系統(tǒng)中,一般通過監(jiān)測被管設(shè)備或服務(wù)等各種方法獲取大量原始告警數(shù)據(jù)或歷史積累信息,這些數(shù)據(jù)往往由于通信系統(tǒng)的復(fù)雜性、網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性、噪聲、外界因素、因果關(guān)系等原因而具有相當(dāng)大的不確定性和不精確性,導(dǎo)致故障癥狀和故障原因都存在非線性映射關(guān)系,需要利用關(guān)聯(lián)技術(shù)對數(shù)據(jù)進(jìn)行處理和分析才有效的進(jìn)行故障定位[3],目前常用的故障定位技術(shù)主要有下面幾種:
3.1 基于人工智能的故障定位技術(shù)
3.1.1 基于規(guī)則的推理技術(shù)
基于規(guī)則的推理(Rule-based Reason,RBR)是最簡單的關(guān)聯(lián)技術(shù),已被用于多種構(gòu)架。一般而言,基于規(guī)則的系統(tǒng)由三個(gè)組成部分組成,如圖1所示。
(1)推理引擎,主要提供解決問題所需要的策略。
(2)知識庫,提供和定義與問題相關(guān)的規(guī)則和專家知識。
(3)工作內(nèi)存,主要提供解決問題所需要的數(shù)據(jù)。
在基于規(guī)則的推理的網(wǎng)絡(luò)故障定位系統(tǒng)中,知識庫充當(dāng)一個(gè)專家的角色,利用從人類專家獲取專家積累的經(jīng)驗(yàn)和知識,這些知識主要包括對網(wǎng)絡(luò)問題的定義以及當(dāng)某一特定問題發(fā)生時(shí),網(wǎng)絡(luò)故障定位系統(tǒng)需要執(zhí)行的操作。工作內(nèi)存主要是利用具體的網(wǎng)絡(luò)協(xié)議對網(wǎng)絡(luò)中的被管設(shè)備或服務(wù)進(jìn)行監(jiān)測,得到有關(guān)被管設(shè)備或服務(wù)的各種信息。在對網(wǎng)絡(luò)故障進(jìn)行定位時(shí),推理引擎與知識庫共同合作,將監(jiān)測得到的網(wǎng)絡(luò)中被管設(shè)備或服務(wù)的狀態(tài)信息與知識庫中定義好的條件部分進(jìn)行比對,根據(jù)條件滿足與否,來進(jìn)行網(wǎng)絡(luò)故障的定位。
基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng),由于無需對專家系統(tǒng)的具體結(jié)構(gòu)和操作細(xì)節(jié)進(jìn)行深入了解,從而具有結(jié)構(gòu)簡單等諸多優(yōu)點(diǎn),并且實(shí)現(xiàn)起來比較簡單,非常適用于小型系統(tǒng)。但是基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)在匹配規(guī)則時(shí),需要網(wǎng)絡(luò)狀態(tài)與知識庫中的規(guī)則條件精確匹配,否則將推出整個(gè)推理過程,無法定位故障,并且規(guī)則存在不易維護(hù)性和指數(shù)增長性,所有這些缺點(diǎn)決定了基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)不適用大型系統(tǒng)。
3.1.2 基于模型的推理技術(shù)
基于模型的推理(Model-based Reason,MBR)是建立在面向?qū)ο笊系幕A(chǔ)之上,利用現(xiàn)有的專家經(jīng)驗(yàn)和知識,將具體的目標(biāo)系統(tǒng)中的實(shí)體都模型化診斷對象,并且明確地表現(xiàn)出現(xiàn)實(shí)目標(biāo)系統(tǒng)中對象之間存在的各種關(guān)聯(lián)關(guān)系,再根據(jù)系統(tǒng)模型對具體的目標(biāo)系統(tǒng)的行為進(jìn)行推測。由于通常情況下,具體的目標(biāo)系統(tǒng)與理想的系統(tǒng)模型之間存在差異性,因此基于模型的推理的專家系統(tǒng)需要對推測的行為和目標(biāo)系統(tǒng)的實(shí)際行為進(jìn)行不一致診斷,以確定具體目標(biāo)系統(tǒng)中的故障根源。
為了更好地說明基于模型的推理專家系統(tǒng)的工作流程,文獻(xiàn)[4]使用一個(gè)物理模型和對應(yīng)的對等模型分別如圖2、3所示的網(wǎng)絡(luò)系統(tǒng)。網(wǎng)絡(luò)系統(tǒng)按一定的周期,有規(guī)律的向圖2中的被管設(shè)備發(fā)送ping命令以監(jiān)測網(wǎng)絡(luò)系統(tǒng)中的被管設(shè)備是否運(yùn)行正常。管理系統(tǒng)和被管設(shè)備之間通過一個(gè)模型對象實(shí)現(xiàn)彼此之間的相互通信,具體來說,如圖2所示,系統(tǒng)中的集線器模型向被管設(shè)備集線器發(fā)送ping命令,路由器模型則向被管設(shè)備路由器發(fā)送ping命令。當(dāng)目標(biāo)網(wǎng)絡(luò)發(fā)生故障時(shí),如果故障發(fā)生在集線器1,則集線器1模型可以將其發(fā)現(xiàn)并且識別出來,如果集線器1模型連續(xù)3次向被管設(shè)備集線器1發(fā)送ping命令,在3次響應(yīng)超時(shí)以后,集線器模型1根據(jù)現(xiàn)有的網(wǎng)絡(luò)現(xiàn)象推測被管設(shè)備集線器1有可能發(fā)生故障,或者說目標(biāo)系統(tǒng)中的故障位于集線器1。集線器1模型則會在確定故障并正式發(fā)送告警信息之前,集線器1模型將分析自身與圖2中其他被管設(shè)備的模型之間的關(guān)系以此來確定其是否應(yīng)該詢問網(wǎng)絡(luò)中路由器模型,如網(wǎng)絡(luò)中的路由器模型返回的是相應(yīng)的被管路由器設(shè)備工作處于正常狀態(tài),則集線器1觸發(fā)警報(bào)。 3.1.3 基于范例的推理技術(shù)
基于范例的推理(Case-based Reason,CBR)故障定位技術(shù)與前面的基于規(guī)則推理技術(shù)和基于模型推理技術(shù)相比具有很大的差異性,主要因?yàn)榛诜独耐评砑夹g(shù)的思想源于人類現(xiàn)實(shí)生活,主要根據(jù)過去積累的實(shí)際經(jīng)驗(yàn)或經(jīng)歷,利用類比的推理方法對現(xiàn)有的新問題做出相似的解答,然后根據(jù)新問題與舊問題之間的差異對解答進(jìn)行修改從而得到新問題的完全解答?;诜独评淼木W(wǎng)絡(luò)故障定位技術(shù)主要由四個(gè)部分組成,檢索 (Retrieve)、復(fù)用(Reuse)、修正(Revise)、保存(Retain),簡稱4R過程。
基于范例推理的故障定位技術(shù)與基于規(guī)則推理的故障定位技術(shù)相比,由于在基于范例推理的故障定位技術(shù)中檢索只是基于對案例的部分匹配,而基于規(guī)則推理的故障定位技術(shù)則是完全匹配,因此基于范例推理的故障定位技術(shù)對網(wǎng)絡(luò)配置變化的適應(yīng)度更好,更適用于問題的總體解決方案。
3.2 模型遍歷技術(shù)
模型遍歷技術(shù)(Model traversing techniques)是一種構(gòu)建網(wǎng)絡(luò)故障傳播模型的方法,該方法在構(gòu)建故障傳播模型時(shí),主要根據(jù)網(wǎng)絡(luò)在運(yùn)行時(shí)各種被管對象之間的相互關(guān)系,并且按照從引起事件的被管對象開始的順序進(jìn)行構(gòu)建。該方法主要適用于網(wǎng)絡(luò)中被管對象之間的相互關(guān)系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統(tǒng)配置變化較頻繁時(shí)該方法的魯棒性很好。模型遍歷技術(shù)主要具有兩大特點(diǎn),事件驅(qū)動(dòng)和事件關(guān)聯(lián),所謂事件驅(qū)動(dòng)是指在一個(gè)故障癥狀報(bào)告到來之前,系統(tǒng)一直處于等待故障癥狀狀態(tài);事件關(guān)聯(lián)則是確定兩個(gè)故障癥狀是否來源同一個(gè)事件源。
一般情況下,模型遍歷技術(shù)需要在其事件報(bào)告中明確標(biāo)識網(wǎng)絡(luò)系統(tǒng)中故障的征兆類型、征兆目標(biāo)等相關(guān)信息,如果網(wǎng)絡(luò)系統(tǒng)中出現(xiàn)故障征兆,且不妨用si來表示該故障征兆,當(dāng)si的目標(biāo)和si來源相同,則說明si是一個(gè)次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術(shù)的整個(gè)處理可分為以下3步:
(1)首先,對網(wǎng)絡(luò)中的每個(gè)事件,依據(jù)網(wǎng)絡(luò)在運(yùn)行時(shí)各種被管對象之間的相互關(guān)系對其構(gòu)建一個(gè)和事件源相關(guān)的對象圖。
(2)當(dāng)給定的兩個(gè)事件的對象圖相交時(shí),此時(shí)說明兩個(gè)圖至少包含同一個(gè)對象,則認(rèn)為這兩個(gè)對象圖的事件源是關(guān)聯(lián)的。
(3)當(dāng)給定三個(gè)故障癥狀si,sj,sk,其中si,sj相互關(guān)聯(lián),sj,sk相互關(guān)聯(lián),則根據(jù)故障癥狀的傳遞性可知si是一個(gè)次要的故障癥狀。
4 網(wǎng)絡(luò)故障原因診斷
(1)基于信號處理方法。該方法主要是依據(jù)信號模型,直接對網(wǎng)絡(luò)系統(tǒng)中的可測信號進(jìn)行分析與處理,并通過提取可測信號的頻率等特征值,對網(wǎng)絡(luò)中存在的故障原因進(jìn)行診斷。
(2)基于解析模型的方法?;诮馕瞿P偷姆椒ㄖ饕罁?jù)數(shù)學(xué)模型和數(shù)學(xué)方法來進(jìn)行故障原因的診斷,在診斷時(shí)需要建立對象的精確數(shù)學(xué)模型。
(3)基于知識檢測的方法。與基于解析模型方法相比,此方法最大的特點(diǎn)在于其并不需要對象的精確數(shù)學(xué)模型就可以對網(wǎng)絡(luò)中的故障原因進(jìn)行診斷。
下面主要介紹幾種目前國內(nèi)外研究學(xué)者研究比較多的基于知識檢測的方法,基于專家系統(tǒng)故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經(jīng)網(wǎng)絡(luò)故障原因檢測方法。
4.1 基于專家系統(tǒng)故障原因診斷方法
基于專家系統(tǒng)故障原因診斷系統(tǒng)主要是利用人類專家的經(jīng)驗(yàn)和歷史積累診斷數(shù)據(jù),使用一定的方法將其轉(zhuǎn)化為系統(tǒng)能夠識別的規(guī)則存在專家系統(tǒng)的知識庫中。當(dāng)網(wǎng)絡(luò)中出現(xiàn)故障時(shí),診斷系統(tǒng)利用專家系統(tǒng)知識庫中的規(guī)則,對發(fā)生故障網(wǎng)絡(luò)中的被管對象的各項(xiàng)性能參數(shù)進(jìn)行處理與分析以正確的確定網(wǎng)絡(luò)故障發(fā)生的具體原因[5]。組成由人機(jī)接口、推理機(jī)、知識庫等六部分組成:
目前,國內(nèi)外學(xué)者公認(rèn)的專家系統(tǒng)瓶頸是知識獲取問題,因?yàn)閷<蚁到y(tǒng)在診斷過程中主要依賴于從人類專家領(lǐng)域內(nèi)獲取的知識、經(jīng)驗(yàn)和以往診斷數(shù)據(jù),而這些獲取起來途徑有限,操作起來具有一定的局限性和復(fù)雜性。另外,專家系統(tǒng)在實(shí)時(shí)性和學(xué)習(xí)能力等方面也存在一定的局限性,因此目前通常將專家系統(tǒng)同其他方法相結(jié)合以提高專家系統(tǒng)在這些方面存在的局限性和不足。
4.2 模糊故障診斷方法
很多時(shí)候,網(wǎng)絡(luò)中的故障與系統(tǒng)得到的網(wǎng)絡(luò)現(xiàn)象之間存在非線性的映射關(guān)系,這種非線性的映射關(guān)系很難用確定的數(shù)學(xué)公式或者模型來刻畫,相應(yīng)的在故障原因診斷時(shí),很難給出故障的精確原因。相反,只能給出故障發(fā)生的可能原因。對于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。
目前使用的比較多的是向量識別法,其診斷過程可分為以下3步:
首先,需要根據(jù)網(wǎng)絡(luò)中的故障與表征網(wǎng)絡(luò)故障的數(shù)據(jù),建立二者之間的關(guān)系,通常用關(guān)系矩陣R來表示。
其次,對需要診斷的目標(biāo)網(wǎng)絡(luò)系統(tǒng)(對象)進(jìn)行狀態(tài)檢測,提取相關(guān)的特征參數(shù)以構(gòu)建特征向量矩陣X。
最后,根據(jù)模糊理論和矩陣?yán)碚?,求解前面兩步?gòu)建的關(guān)系矩陣方程Y=X・R,得到關(guān)系矩陣方程的解Y,再根據(jù)隸屬度等原則,對目標(biāo)網(wǎng)絡(luò)系統(tǒng)的故障向量Y進(jìn)行處理,得到故障的原因。
從上述診斷過程可知,在模糊故障診斷中,正確的進(jìn)行故障原因診斷的前提是建立關(guān)系矩陣R、隸屬函數(shù)、特征值向量X,而這些矩陣、函數(shù)、向量的建立是人為構(gòu)造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對特征元素的選取也有一定的要求,所以兩者若處理不當(dāng),會導(dǎo)致該方法的診斷結(jié)果精度嚴(yán)重下降甚至完全錯(cuò)誤。
4.3 BP神經(jīng)網(wǎng)絡(luò)診斷方法
由于人工神經(jīng)網(wǎng)絡(luò)的這些特性以及網(wǎng)絡(luò)中故障與征兆之間有可能存在的非線性映射關(guān)系,使得人工神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)故障診斷中大有用武之地。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)大量應(yīng)用在網(wǎng)絡(luò)故障診斷領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)是常用的人工神經(jīng)網(wǎng)絡(luò)模型[6]。
BP神經(jīng)網(wǎng)絡(luò)故障診斷分為訓(xùn)練和診斷兩個(gè)階段:
(1)訓(xùn)練階段。BP神經(jīng)網(wǎng)絡(luò)對樣本進(jìn)行訓(xùn)練,以選定網(wǎng)絡(luò)結(jié)構(gòu)和規(guī)模,確定網(wǎng)絡(luò)總層數(shù)、各層神經(jīng)元數(shù)。借助BP學(xué)習(xí)算法,將原始網(wǎng)絡(luò)收集到的故障樣本的特征參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)輸入樣本集,以與之對應(yīng)的網(wǎng)絡(luò)故障原因編碼為BP神經(jīng)網(wǎng)絡(luò)的輸出,以此對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(2)故障診斷階段。主要對待檢測對象的故障樣本進(jìn)行特征提取和歸一化處理,然后輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷輸出診斷結(jié)果,整個(gè)過程分為以下4個(gè)步驟:1)故障樣本集預(yù)處理。2)BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。3)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。4)故障診斷。
5 結(jié)束語
本文對網(wǎng)絡(luò)故障的概念以及基本過程進(jìn)行了概述,重點(diǎn)對當(dāng)前網(wǎng)絡(luò)故障中的故障檢測、故障定位、故障診斷的關(guān)鍵技術(shù)及方法進(jìn)行了研究和總結(jié)歸納,對開展網(wǎng)絡(luò)故障診斷技術(shù)研究具有一定的指導(dǎo)意義。
參考文獻(xiàn):
[1]王成等.網(wǎng)絡(luò)故障診斷技術(shù)研究[J].科技信息,2011(11).
[2]陳琳.一種網(wǎng)絡(luò)環(huán)境中的故障診斷模型[J].北京航空航天大學(xué)學(xué)報(bào),2004(11).
[3]張燕.網(wǎng)絡(luò)故障診斷關(guān)鍵技術(shù)[J].電腦知識與技術(shù),2009(31).
[4]李千目.戰(zhàn)略互聯(lián)網(wǎng)智能診斷技術(shù)研究[D].南京理工大學(xué),2005.
[5]吳曉知,李興明.網(wǎng)絡(luò)故障管理專家系統(tǒng)中知識庫的構(gòu)造[J].微計(jì)算機(jī)信息,2008(06).
[6]戚涌,劉鳳玉.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)智能診斷系統(tǒng)[J].微電子學(xué)與計(jì)算機(jī),2004(10).
作者簡介:張璋(1987.12-),男,安徽蚌埠人,碩士研究生,研究方向:網(wǎng)絡(luò)安全、身份認(rèn)證。
作者單位:南京理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,南京 210094
點(diǎn)擊下頁還有更多>>>網(wǎng)絡(luò)故障檢測技術(shù)論文