網絡丟包的原因,怎么排查數據丟包
總體思路:
1、首先需要確定是否發生數據丟包,并找出在哪些設備訪問時會出現丟包的情況;
2、確定丟包的位置,即進行定位;
3、調查具體的丟包原因
a.如果發現設備在訪問某一網段時出現丟包情況,可以首先在多臺設備上進行ping測試,以便確定目標網段周圍的多個節點的連通性。
55世纪使用網段(類似于診斷六那樣),來確定是什么類型的流量丟包,還是所有的流量都丟包。
55世纪如果確定是某一特定流量丟包的情況,可以排除路由策略或策略路由的問題(類似于診斷六,帶有...)。
55世纪如果源不能通,可以不帶源。
如果出現多種流量丟包的情況,造成這種情況的原因可能有很多,包括物理層、數據鏈路層、網絡層和策略等。
b.確定包裹的丟失地點;
有兩種方法:
55世纪第一種方法是逐段使用ping和tracert進行測試。首先,ping網關,然后ping網關的下一跳,依次類推。
可以通過跟蹤到達目標地址的路徑,或者使用tracert命令來確認在哪一跳出現了丟包現象。雖然這種方法簡單,但并不十分精確。
由于丟包可能是間歇性的原因,需要進行多次的ping和tracert測試來進行驗證。
55世纪使用流量統計的方法來檢測丟包情況。具體操作如下所示:在出現丟包的鏈路上的設備入口和出口處進行流量統計。
55世纪實施流量管理策略,我們需要分別統計通過入接口進行傳輸的Inbound方向和通過出接口進行傳輸的Outbound方向的特定報文。
請確認該報文是否在本設備被丟棄。
我們以端口a的入方向和端口b的出方向,以及端口b的出方向和端口c的入方向的流量統計情況為例。
55世纪如果端口a的輸入方向和端口b的輸出方向的Passed計數大致相等,那么可以說明在這個位置沒有丟包發生。
當端口a入方向的報文Passed計數多于端口b出方向的報文Passed計數時,可以說明發生了丟包情況。
故障發生在Switch_3。
如果端口b的出方向和端口c的入方向的Passed計數大致相等,那么可以推斷此處沒有發生丟包情況。
當端口b的出方向通過的報文數量大于端口c的入方向通過的報文數量時,表明存在丟包的現象。
請根據物理鏈路之間的檢查設備進行定位,該鏈路發生在Switch_3和Switch_2之間。
流量統計的配置方法如下:
1.首先,進入流量統計配置頁面。
2.在頁面上找到“配置”選項,并點擊進入配置菜單。
55世纪3.在配置菜單中,找到“流量統計”選項,并點擊進入流量統計配置頁面。
4.在流量統計配置頁面上,可以選擇要統計的流量類型,例如網站流量、應用程序流量等。
5.隨后,根據需要,可以設置統計的時間范圍,例如按小時、按天、按周等。
55世纪6.在配置完成后,記得保存設置,以便應用到實際使用中。
55世纪a.設置訪問控制列表(ACL)規則。
b.對配置進行流動分類。
c.流行配置是指被廣泛應用和接受的配置方式。
d.制定配置流策略。
55世纪使用流策略來應用于接口。
調查具體丟包的原因
55世纪(1)如果出現丟包問題在物理線路上發生,接下來需要主要檢測設備之間的物理鏈路。
導致物理鏈路故障的主要原因有:
※雙工或速率不匹配
雙工或速率不匹配是指通信設備之間的傳輸模式或數據傳輸速率不一致。這可能會導致通信中斷或數據傳輸錯誤。為了確保有效的通信,設備之間的雙工模式和傳輸速率需要相互匹配。如果出現雙工或速率不匹配的情況,需要進行相應的調整和配置,以確保通信的正常進行。
55世纪※線纜接頭連接不良或松動
※物理連接線過長或者損壞
對于物理鏈路故障,我們可以采取以下具體的排查方法:
A、觀察設備端口上的指示燈狀態。
如果燈常亮是表示無連接。這時候需要更換接口或者網線再試一下。
B、需要檢查設備之間的鏈路和接口模塊是否發生故障。
當設備之間使用雙絞線進行連接時,可以通過測試儀器來檢測雙絞線是否存在故障,并且還可以測試設備之間雙絞線的長度。
進行檢查,確認是否符合要求,需要檢查雙絞線的線序類型是否正確。
55世纪纖傳輸距離要求能夠滿足。
纖長度不足以達到光模塊支持的傳輸距離;使用測量儀器來檢測信號的衰減是否在允許范圍內;若超出范圍,則進行警示。
55世纪查看信息以確認光功率是否正常等。
(2)如果丟包問題出現在設備上,接下來我們應該主要檢查設備或協議等方面的問題,可能的原因包括:
55世纪※物理層問題包括設備單板故障以及上送給CPU的報文速率超過設備的限速。
55世纪※數據鏈路層:存在環路、ARP攻擊以及配置錯誤,配置問題主要包括:VLAN配置錯誤、
55世纪包括黑洞MAC地址、端口安全、VLAN隔離和防環協議等。
※網絡層:涉及路由震蕩、路由環路、路由過濾、安全策略配置(如IPSG、URPF)等問題。
※QOS配置:包括限速處理、報文過濾、流量過大和擁塞避免等配置;A、進行物理層檢查,確認單板重置或插拔不會影響業務,并嘗試恢復業務,觀察情況。
包丟失問題是否得到了改善。可以使用命令來檢查CPU統計信息,以確認上送的CPU報文是否遺失。
業務是否丟包還需要檢查。
B、數據鏈路層檢查的目的是防止廣播風暴或MAC地址震蕩發生,這些問題會因為存在二層環路而出現。
當廣播風暴發生時,交換機的所有與VLAN相關的端口將會以高速轉發數據,并且指示燈會快速閃爍。
55世纪ARP的攻擊主要有兩種類型,即防洪攻擊和欺騙攻擊。如果收到大量的ARP報文,則說明可能存在泛洪攻擊。
當三層設備上的ARP表對應關系發生變化時,表明可能存在欺騙攻擊。
55世纪在檢查設備配置時,首先要確認VLAN配置是否正確,然后檢查是否存在黑洞MAC地址以及端口是否設置正確。
配置包括安全性和VLAN隔離等設置。
C、進行網絡層檢查時,需要先查看是否有目標網段的路由,同時還要檢查是否存在路由互指的情況。在進行這些檢查時,可以進行多次查看以確保準確性。
請確認是否存在路由震蕩,并最終檢查是否存在與安全相關的配置,例如IPSG和URPF等。
D、QoS配置檢查:對比接口速率和實際報文速率,以判斷流量是否過大。
55世纪請確認接口是否配置了限速或過濾規則,以及擁塞避免等相關配置。