我的网络的互联网速度一直很慢。经过大量的故障排除后,我确定任何流媒体内容/下载都将导致WAN流量的延迟爆炸。

例如,在无负载的情况下,我在30ms左右ping 8.8.8.8。如果我在同一台计算机上开始流式传输YouTube,则延迟会跳到500毫秒左右,相差约400毫秒。如果我关闭视频,等待时间将返回30ms。但是,如果我有一个用户在同一LAN上开始播放pandora,问题将再次出现。

我的网络运行在单个10/100交换机上。交换机直接连接到DSL路由器。我通常有6Mb的连接。

在故障排除中,我已经完成了以下操作:


从数个工作站用wireshark进行了扫描,以查找错误的数据包。 (我会包括在内,但扫描过程中会包含机密信息)。
用升级的型号替换路由器,然后升级固件。
如果ISP的速度提高了,该速度在speedtest.net上已正确测量(10降,1.5升)。问题是完全一样的。
要防止ISP的硬件/端口损坏,请在ISP的一端换出卡。
在另一个办公室使用完全相同的ISP /软件包进行测试。让多台计算机在不影响延迟的情况下以1080p和pandora流式传输YouTube。
关闭每台计算机,但关闭一台计算机,然后在晚上没有用户在场的情况下运行。
受监控的LAN流量,永远不会遇到延迟问题。

我知道,如果我达到了带宽极限,或者某些硬件的速度出现瓶颈,则将导致此问题。但是,似乎根本不是那样。几乎所有通过WAN的流量都会增加延迟。即使我几乎将连接速度提高了一倍,问题也一样。当我让两个用户使用pandora并进行了几次冲浪时,互联网一无所有(丢弃的数据包,页面无法加载)。我家里有一半的连接,而同时进行的netflix / youtube / pandora流式传输甚至都没有达到我的5 Mb。

问题:什么时候通过WAN传输流量会导致高延迟?

评论

这个问题涉及广泛的领域,您正在谈论的是对网络进行故障排除并查找问题。问题应该更具体。顺便说一下,这与wireshark无关(如您的标签所述)。就是说,欢迎来到网络工程;)

有什么答案对您有帮助吗?如果是这样,您应该接受答案,这样问题就不会永远弹出来寻找答案。或者,您可以发布并接受自己的答案。

#1 楼

这听起来像某种形式的“缓冲膨胀”,可能是在DSLAM / LNS上执行6Mb速率限制的部分。 />

评论


+1可能是ISP上某些配置不当的速率限制或整形,但也可能是CPE质量较差(或出现故障)。我已经看到速率为40Mbps的CPE开始以超过10Mpbs的速度翻倒,例如,因为它们无法处理高pps速率。高pps速率的小数据包确实使它们感到紧张。

– jwbensley
13年5月22日在20:57

哦,我还没有看到他取代了CPE。我错过了要点!

– jwbensley
13年5月22日在21:06

#2 楼

我会验证延迟发生的位置。使用MTR之类的工具检查每个跃点的延迟。 MTR将每个跃点的ping统计信息与跟踪路由结合在一起,可以极大地帮助缩小此类问题。

在linux操作系统上,命令为mtr 8.8.8.8,该工具也有Windows版本。

输出将显示延迟在哪里开始。如果它在ISP网络上,则可以将输出转发给ISP,并帮助他们使用它来解决他们的网络问题。

如果延迟在您的网络内开始,则可以缩小自己也解决问题。

评论


是否有可用于Cisco IOS设备的MTR版本?我知道可以从Junos CLI运行

– DrBru
13年10月23日在10:14

#3 楼

查看DSL线路统计信息。 (交错式vs.快速路径,错误计数器等)。

在不同位置的测试测试了不同的线路,也许是在不同的DSLAM上。这表明不应该归咎于ISP基础架构。强烈建议您的DSL线路出现故障。 DSLAM本身可能很拥挤,但您很难像预期那样反复地将其推到线路上。

如果ATM信元被破坏(大多数DSL的传输),您会看到像这样的明显减速,因为必须重新发送整个帧。

#4 楼

每当我遇到客户遇到网络延迟的情况时,要做的第一件事就是检查网络中的每个单独连接。通常,只有一个设备会出现瓶颈。

如果网络使用率较低,我将完全禁用除Internet连接设备以外的所有设备的QoS(因为QoS会降低交换环境中的通信量)。

在您的数据包捕获中,我将进行I / O分析,并查看您是否在任何地方都达到了平稳状态。这可能表明突发流量将导致排队,这将延迟数据包的传送或完全清除数据包。

如果出现问题,我还将检查每个设备的CPU。如果看到CPU跳升,则可能是您的问题设备。还要检查日志,看是否有任何错误。

另外,我将确保所有连接都以全速(速度100全双工)进行协商。

也请尝试禁用任何防火墙或安全服务。

#5 楼

另一件事要看的是您的交换机和DSL调制解调器之间的连接。您描述的症状几乎听起来像是两者之间存在双工不匹配。

排除交换机的另一种方法是完全卸下交换机,并使用直接连接到DSL的一台计算机测试连接调制解调器。

#6 楼

高流量时的高延迟/低吞吐量有时表示L1问题(双工不匹配/电缆不良/光纤不干净)。您是否检查出不是这种情况?

#7 楼

这会成为上游的瓶颈吗?不知道您在哪里,但是ISP的国际带宽可能很糟糕。 Speedtest.net将默认为最近的服务器。

#8 楼

我使用的一种简单方法是traceroute函数,该函数查找跟踪中的高响应时间,并检查系统是否存在硬件故障,DOS攻击,QoS错误分类等。当然,您需要访问路径中的所有设备。自从我在一家电信公司工作以来,这段时间对我来说很轻松。

#9 楼

您要在哪个操作系统上进行测试?如果是Windows,默认情况下会安装“ QoS数据包计划程序”服务并将其绑定到网络接口。它将根据网络堆栈的基础设置启动,并主动延迟未归类为“多媒体”的任何流量。

尝试从界面中删除它并重新检查结果。

更好的是,重新配置它:http://www.dslreports.com/faq/3688

#10 楼

根据我的经验,我会补充说某些ISP会以最低的优先级来处理ICMP数据包。发生过一次,每次我启动youtube时,“请求都超时”。

在开始播放视频之前和播放视频时发布winmtr。
开始第二次流传输,让我们看看这将如何影响ICMP数据包和第一视频。

#11 楼

如果您通过10/100交换机进行连接,并且部分进行了自动协商,则可能是双工不匹配。当网络上的负载相对安静时不会显示时,这将导致频繁的冲突。冲突将导致重新发送,并迫使通信回退,并可能导致看似不合理的减速。

#12 楼

很抱歉,无法恢复旧线程。 OP写道:


...几乎所有通过WAN的流量都会增加延迟...


这些是缓冲膨胀。路由器可能会排队过多的流量,并且会饿死小流量(这对于提供响应能力是必要的。)

您的路由器需要一种减轻“负载延迟”问题的方法。您可能无法使用QoS,但这需要大量的配置和不断的调整。 PIE或其他技术。