近年來VoIP、VoD等實時應用在網(wǎng)絡應用中比例大量增加,實時應用需要網(wǎng)絡對其提供服務保證或區(qū)分服務,網(wǎng)絡路徑的延時特性和傳輸速率越來越受到人們的重視。網(wǎng)絡延時和有效帶寬直接反映了路徑的性能和對端主機提供的服務等級水平,但它們都是隨時間隨機變化的變量,跟蹤這些路徑特征參數(shù)的動態(tài)變化可以獲得資源的使用狀況和性能趨勢,并作為網(wǎng)絡路徑性能評價和實時的端到端性能管理的依據(jù)。
一、端到端路徑性能問題
端到端性能管理的目標是為用戶提供一條穩(wěn)定可用的具有一定服務保障的連接。其范圍已超出了流量工程和容量規(guī)劃等傳統(tǒng)問題,包括故障發(fā)現(xiàn)、路由選擇與配置管理、流量分析等廣泛的內(nèi)容。對于用戶而言,路徑的延時特性和路徑有效帶寬決定了服務水平,即是否能啟動一次新的連接,在局部節(jié)點獲得一定的資源保證,并達到可接受的響應時間。對ISP來說,則還要關心網(wǎng)絡路徑的長期利用率、路由可達性、瓶頸帶寬和其它端到端的性能等屬性和參數(shù)。這些參數(shù)一般是較為穩(wěn)定的,其中連通性和路徑穩(wěn)定性反映了路徑的總體性能,而路徑非對稱性則影響我們對網(wǎng)絡延時的測量。
連通性
連通性指的是IP網(wǎng)絡中主機之間是否能相互到達對方,或者說一個或多個節(jié)點之間的下層連接是否可用。連通性描述了網(wǎng)絡的可靠性,是完成網(wǎng)絡業(yè)務的基本條件。Ping程序可用于確定網(wǎng)絡上一個遠程設備對本地系統(tǒng)來說是否可達,并有助于在系統(tǒng)之間調(diào)試連通性問題。我們可以從測量主機向網(wǎng)絡路徑的目的端定時運行ping,發(fā)出ICMP請求并等待有效的ICMP應答,從而確定網(wǎng)絡連接的可用性,并可根據(jù)ICMP應答的類型孤立出路由選擇和許多其它網(wǎng)絡故障或問題的來源。因此,連通性是保證路徑性能穩(wěn)定的基礎。
路徑MTU
MTU是網(wǎng)絡連接中允許一個物理幀傳輸?shù)淖畲髷?shù)據(jù)量,TCP/IP驅(qū)動程序需要知道這個數(shù)值以便設置合適的數(shù)據(jù)包長度,以避免出現(xiàn)不必要的拆分過程。不同網(wǎng)絡的MTU缺省值不一樣,以太網(wǎng)的標準值為1500,而多數(shù)ISP提供的撥號網(wǎng)絡的標準值為576。理論上,只要網(wǎng)絡連接穩(wěn)定性高,MTU越大則傳輸效率越高。但是,如果接收機器所在網(wǎng)絡或傳輸路徑上路由器的MTU小的話,數(shù)據(jù)幀將不得不再次被拆分,這樣反而降低了效率。因此,優(yōu)化的MTU應與整條傳輸路徑上最小的MTU值(即路徑MTU)相等。RFC1191描述了路徑MTU的發(fā)現(xiàn)機制,通過發(fā)送分組在分組頭部設置不分片標志字段并判斷返回ICMP錯誤消息實現(xiàn)。發(fā)送的第一個分組的長度與出口MTU相等,每次收到ICMP不能分片錯誤時,就減少分組長度,以下一個最小的MTU值發(fā)送。由于MTU值個數(shù)總是有限的,因此總可以找到路徑中最小的MTU。所以檢測路徑MTU并設置系統(tǒng)的MTU值,可以減少對IP數(shù)據(jù)包的分段,提高路徑的傳輸效率。
路由非對稱性
非對稱路由是指往返某一節(jié)點的路徑不一致,兩個方向的延時不同,由此在網(wǎng)絡測量,特別是基于源端的測量中造成很多問題。檢測路由的非對稱性目前還非常困難。
路徑穩(wěn)定性
端到端路徑的穩(wěn)定性是衡量網(wǎng)絡性能的關鍵性參數(shù),路徑穩(wěn)定性可以分為路徑的空間穩(wěn)定性和時間穩(wěn)定性。其中空間路徑穩(wěn)定性由路由的規(guī)模和模式?jīng)Q定,不穩(wěn)定的路由可能是由路由不對稱、循環(huán)路由、路由振蕩等病態(tài)路由行為引起,也可能是連接頻繁中斷引起的。發(fā)生率(Prevalence) 和持續(xù)性(Persistence),分別從特定路由的發(fā)生頻率和不變性方面定義了穩(wěn)定性。路徑的時間穩(wěn)定性則強調(diào)了路徑性能與時間變化的關系。本文將從路徑的延時特性和傳輸速率出發(fā),給出路徑穩(wěn)定性的評價指標,并作為網(wǎng)絡路徑性能評價和實時的端到端性能管理的依據(jù)。
二、性能指標
路徑延時穩(wěn)定性參數(shù)
設測量的延遲變量為X, 為t時刻測得的網(wǎng)絡延時,則 為 間隔內(nèi)的延時變化。若在 時間段內(nèi)每次測量的樣本值為 ,則這組延遲樣本集的樣本方差為 , 其中 = 。假設 為SLA(service level agreement)規(guī)定的或是某種應用服務質(zhì)量要求的網(wǎng)絡延時抖動目標臨界值。根據(jù)在 時間段延時的抖動程度,定義延時抖動有界比例系數(shù)為:一般 可取為 。延時抖動有界比例系數(shù)反映了相鄰兩次測量之間延時抖動小于 情況所占的比例,一般設定當 時,認為連接有較好的穩(wěn)定性, 越大,即 越接近1,連接越穩(wěn)定。但延時抖動有界比例系數(shù)不能反映最大延時抖動,由于排隊延時隨背景流量而出現(xiàn)較大的波動,定義如下形式的平均抖動/最大抖動系數(shù):設定 時,認為連接有較好的穩(wěn)定性, 越大,連接越穩(wěn)定。綜合以上兩個參數(shù),當路徑同時滿足 和 時,確定該路徑是關于延時穩(wěn)定的。
路徑速率參數(shù)
路徑延時穩(wěn)定性參數(shù)反映了鏈路整體運行的穩(wěn)定程度,但不能反映不同鏈路速率的差別。某一條鏈路可能延遲較大,但延時抖動較小,丟失率很低,這時僅由路徑延時穩(wěn)定性參數(shù)難以反映鏈路的實際傳輸質(zhì)量。通過采集SNMP網(wǎng)絡設備MIB接口組數(shù)據(jù),可以計算接口數(shù)據(jù)傳輸速率V:,其中 分別為在 內(nèi)接口接收與發(fā)送的總字節(jié)數(shù)。通過連續(xù)采集路徑中多個接口的流量數(shù)據(jù),將最小的接口傳輸速率 作為路徑速率參數(shù)通知給用戶,以反映當前路徑的實際傳輸性能。
數(shù)據(jù)采集
我們選擇實驗室的測量主機到湖南大學DNS服務器作為實驗對象,該路徑經(jīng)過兩個路由器,分別通過100M Ethernet和1000M Ethernet鏈路相連。我們使用Ping采集了近兩天的每10ms一次測量的延時數(shù)據(jù),并通過讀取第一個路由器MIB庫獲得了每5ms的接口速率數(shù)據(jù)。
三、端到端路徑性能的測量
我們采用以上測量方法基于以下原因。通常,網(wǎng)絡性能參數(shù)的測量采取主動測量的方法,即在指定的路徑上按一定規(guī)則發(fā)送探測性流量數(shù)據(jù)來測量網(wǎng)絡上某一主機是否可達(reachability)、網(wǎng)絡延遲、網(wǎng)絡中包丟失情況和網(wǎng)絡吞吐量等鏈路性能參數(shù)或測量網(wǎng)絡路徑的跳數(shù)、路由抖動、路由對稱性等從源端到目的端的路由信息。主動測量會在網(wǎng)絡中引入較多的測量流量,對網(wǎng)絡實際性能會造成一定的影響。
由于路徑帶寬的測量需要向網(wǎng)絡發(fā)送大量的分組數(shù)據(jù),耗費大量有效帶寬,這使得以主動方式測量帶寬對用戶應用和網(wǎng)絡都極具損害性。而使用SNMP可以定時查詢網(wǎng)絡設備接口的流量速率數(shù)據(jù),結合SNMP與網(wǎng)絡往返延遲的測量評價路徑性能,可使測量發(fā)送的分組數(shù)降到最低。
延時分布數(shù)據(jù)分析
測量獲得的延時數(shù)據(jù)的分布可以看出延時分布RTT的測量值很不穩(wěn)定,延時值最高達到了25.198ms,最低為2.091ms,接近于固有延時。但大部分散點集中于10ms的上下5ms范圍內(nèi),只有極少數(shù)點落在大于20ms小于5ms范圍,說明路徑相對較為穩(wěn)定。計算延時抖動有界比例系數(shù) ,平均抖動/最大抖動系數(shù) ,與實際網(wǎng)絡運行狀況基本相符。
延時抖動數(shù)據(jù)分析
40小時中每十分鐘測量的延時抖動的分布延時的抖動分布來看,在取網(wǎng)絡延時抖動目標臨界值 為 =4.629ms時,最壞情況下達到抖動的邊界16ms,遠遠超過了期望的 值。這說明該路徑對于實時應用是不可能達到很好的性能的。
鏈路接口速率分析
同時采集的路由器MIB庫接口流量速率數(shù)據(jù)可以看出該路徑的利用率極低,特別是流出速率很小。在實際中可以用加大負載的辦法提高網(wǎng)絡的利用率,計算鏈路接口可以達到的最大的數(shù)據(jù)傳輸速率。