silen91 2023-02-28 00:18 采纳率: 100%
浏览 78
已结题

overrun errors 导致网络端口适配器断线

问题描述:我们公司一款数据记录仪需要搭配网络适配器使用,可以将测量数据传输到服务器(监测简单的拓扑如下图)

img

,Vnet网络接口适配器技术参数如图

img


老外给的参数说这款网络端口适配器只支持10M双工或半双工模式。
我们的一个客户,之前安装了我们这套数据采集系统(有软件有传感器硬件)当时采用星形网络拓扑结构。后来又买了设备之后,扩大安装规模,把星形网络改成了环形网络,从那之后就出现了记录仪异常断线的情况,通过浏览器中输入对应网络端口适配器IP看后台界面,出现了大量的overrun errors(如图),点一次刷新就会多一些,这个适配器应该是有个机制或者最大承受限度(具体我也不清楚是多少),超过它就会断线。这是我们第一次遇到这种问题,这套系统卖了也有十几年了。

img

以下是manual 中的定义

img

由于可以确定的是我们的设备没问题(因为之前没改变网络结构的时候运行很久也没出问题),客户坚持他们的网络也没问题说是专业的网络人员施工,采集的服务器也没问题(就是一台安装了windows server 2012的电脑)。那问题到底可能来源于哪,目前很困惑,由于我对网络也不是很懂所以想问一下。
目前的思路:1,客户在环路上使用的交换机主要是华为S5720S-12TP-LI-AC,我们团队的一个技术坚称就是交换机问题说是我们的设备性能没那么好,不应该使用华为这么好的交换机,换成最普通就好,但是这个理由别说说服客户,我都觉得就是没有依据,所以更换交换机是一个解决办法吗?
2,交换机配置,怀疑交换机速率太快与我们的适配器不匹配,但是现在的交换机不是可以自协商吗?正常应该不会有问题吧?
3,环路网没有施工到位,可能存在网络问题,如二层环路?
想要的答案:
1,附上其他客户的设备后台连接页面的图片,可以看到overrun errors几乎是0或者是很小

img


img


2,客户说想联系老外修改什么底层的东西,他自己也说不清楚,但是这个没可能,老外是不会因为个例去改变什么的
3,在我们的适配器设备不能做改变的情况下(就是一个产品不可能做修改的),我该把问题的方向放到哪呢?现在很迷惑,没有方向。请各位帮帮忙!

  • 写回答

2条回答 默认 最新

  • 「已注销」 2023-02-28 08:37
    关注

    参考GPT和自己的思路,从您的描述中可以看出,记录仪的断线问题可能涉及多个方面,以下是可能的原因和解决办法:
    overruns,表示这个数据包还没有被进入到网卡的接收缓存fifo队列就被丢掉,因此此时网卡的fifo是满的。为什么fifo会是满的?因为系统繁忙,来不及响应网卡中断,导致网卡里的数据包没有及时的拷贝到系统内存,fifo是满的就导致后面的数据包进不来,即这个数据包被网卡硬件丢掉。
    所以,个人觉得遇到overruns非0,需要检测cpu负载与cpu中断情况。
    可参考https://blog.csdn.net/Mrerlou/article/details/120544880
    1 网络拓扑结构问题:
    由于您将网络从星形改为环形,导致设备之间的连接变得复杂,可能存在网络拓扑结构问题。可能的解决办法是重新评估网络拓扑结构,确保所有设备都能够连接到网络并保持稳定的连接。此外,您也可以考虑添加网络拓扑优化设备,例如网桥和交换机。

    2 交换机配置问题:
    您提到的交换机速率过快可能会导致适配器不匹配的问题,但是现代的交换机通常可以自动协商速率和双工模式,因此这可能不是主要原因。可能的解决办法是确保所有交换机都按照建议的配置进行设置,例如启用 QoS、开启流量控制等。

    3 网络质量问题:
    您提到网络可能存在二层环路等问题,这可能导致数据包被重复发送,从而影响网络质量。您可以使用网络分析工具(例如 Wireshark)来检查网络流量,并查找任何异常的流量模式。此外,您还可以考虑添加网络质量监控设备,例如网络流量分析器和网络探针。

    4 适配器性能问题:
    您团队中的一位技术人员可能会认为适配器的性能不够好,但这可能需要更多的证据来支持这种观点。您可以使用性能测试工具来测试适配器的性能,并与其他客户的适配器进行比较,以确定问题的原因。
    除了之前提到的解决办法之外,还有其他可能有用的方法来解决记录仪断线的问题:

    5 更新适配器固件版本:
    您可以尝试更新适配器的固件版本,以确保它与其他设备兼容,并解决任何已知的问题。请确保使用官方适配器固件版本,并遵循厂商提供的更新说明。

    6 调整适配器缓冲区:
    适配器缓冲区的大小可能会影响其性能和稳定性。您可以尝试调整适配器缓冲区的大小,以确保其与网络负载和流量匹配。请注意,缓冲区过小可能导致数据包丢失,而缓冲区过大则可能导致延迟和其他性能问题。

    7 使用网络隔离设备:
    如果您无法解决记录仪断线问题,您可以考虑使用网络隔离设备。这些设备可以确保记录仪和其他设备之间的隔离,以避免网络问题影响记录仪的连接稳定性。

    8 增加网络带宽:
    如果您的网络负载很高,可能需要增加网络带宽以确保记录仪可以稳定连接。您可以使用网络带宽管理工具来监控网络流量,并考虑增加带宽或优化网络流量以减少负载。

    将星型网络结构改为环形网络结构后,可能会出现以下问题导致记录仪异常断线:

    1 网络拓扑环路问题:
    环形网络结构存在环路,如果网络环路不正确或不完整,可能导致记录仪无法正确传输数据或出现延迟或丢包等问题。此时,您需要确保网络拓扑正确配置,并避免出现环路问题。

    2 网络带宽问题:
    环形网络结构可能会导致网络带宽不够充足,因为所有数据都必须在网络中传输一次。如果网络带宽不够,可能会导致数据传输速度变慢,延迟增加,丢包率增加,最终导致记录仪断线。此时,您需要考虑增加网络带宽,以确保数据传输速度和稳定性。

    3 设备兼容性问题:
    适配器和其他网络设备之间的兼容性问题可能会导致记录仪出现异常断线问题。此时,您需要确保适配器和其他设备之间的兼容性,并尝试更新适配器的固件版本,以确保其与其他设备兼容并解决任何已知的问题。

    4 网络隔离问题:
    如果其他网络设备对记录仪的连接产生干扰或影响,可能会导致记录仪异常断线。此时,您需要使用网络隔离设备,以确保记录仪和其他设备之间的隔离,避免网络问题影响记录仪的连接稳定性。

    5 网络设备性能问题:
    如果您的网络设备性能较低,可能无法处理高速数据传输,可能会导致数据包延迟或丢失。此时,您需要考虑升级或更换网络设备,以确保其能够满足高速数据传输的需求。

    以上问题不一定全部出现,也不一定都是问题的原因。您需要根据具体情况进行排查和解决。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月8日
  • 已采纳回答 2月28日
  • 修改了问题 2月28日
  • 修改了问题 2月28日
  • 展开全部

悬赏问题

  • ¥15 工创大赛太阳能电动车项目零基础要学什么
  • ¥20 limma多组间分析最终p值只有一个
  • ¥15 nopCommerce开发问题
  • ¥15 torch.multiprocessing.spawn.ProcessExitedException: process 1 terminated with signal SIGKILL
  • ¥15 QuartusⅡ15.0编译项目后,output_files中的.jdi、.sld、.sof不更新怎么解决
  • ¥15 pycharm输出和导师的一样,但是标红
  • ¥15 想问问富文本拿到的html怎么转成docx的
  • ¥15 我看了您的文章,遇到了个问题。
  • ¥15 GitHubssh虚拟机连接不上
  • ¥15 装完kali之后下载Google输入法 重启电脑后出现以下状况 且退不出去 桌面消失 反复重启没用