全球主机交流论坛

标题: 困扰半年的OVH 独立服务器频繁 IP 不通,重启恢复,硬件检... [打印本页]

作者: Toools    时间: 2025-7-21 13:56
标题: 困扰半年的OVH 独立服务器频繁 IP 不通,重启恢复,硬件检...
本帖最后由 Toools 于 2025-8-8 23:24 编辑

去年年底买的OVH9.9

各位好,我遇到一个长期未能解决的问题,想请教有没有类似经历或建议:

服务器:OVH 独立服务器,Debian 11 系统自带的, 没DD过;

问题表现:不定期发生 IP 无法访问(ping 不通 / ssh 无响应),需面板远程重启后恢复;

发生频率:每个月1-3 次; (不定期,不定时,没任何前兆,负载等都正常范围)

资源状态:系统负载、内存、磁盘使用都正常;

硬件检测:已通过 OVH 官方流程做过两次硬件诊断(含 Rescue 模式下检测),硬盘、内存、主板、电源均未检测出问题;

日志情况:journalctl、dmesg 无明显错误,内核无 panic;

是否人为误操作:无;

Rescue 模式稳定:是;

OVH 给出的回应是:硬件未发现问题,可做更深入测试或替换,但每次测试都说“系统稳定”,但我这边仍不定期出现失联,非常苦恼。


已经参考楼下大哥提供的 关闭 EEE 禁用 TSO 和 GSO
方法验证了,
8.8 号 又一次发生  IP 不通




作者: jianshan    时间: 2025-7-21 13:57
没有遇到过
楼下解答
作者: 小萝卜    时间: 2025-7-21 14:04
直接重做系统啊。如果不是硬件问题,就重做系统。还解决啥。
作者: 憾江独钓    时间: 2025-7-21 14:08
有一台盲盒,偶尔无缘无故会重启,不过频率不高
作者: CMBCHINA    时间: 2025-7-21 16:02
网卡兼容问题,debian11的pve之前经常会这样,HETZNET好说话,我说网卡有问题,请帮我更换,他们说检测没问题,我说我检测过所有硬件,确定网卡问题,然后hz回复说,为了解决您的疑虑,我们已经为您更换了网卡,请再次检查。
之后没发生过
别的商家也发现过类似问题,大多都是debian或者其他版本的linux发送包不规律,导致网卡掉了。定时重启网卡,或者重启系统都可以解决,一劳永逸的方法换网卡,或者换其他系统
作者: Toools    时间: 2025-7-21 16:12
本帖最后由 Toools 于 2025-7-21 16:14 编辑
CMBCHINA 发表于 2025-7-21 16:02
网卡兼容问题,debian11的pve之前经常会这样,HETZNET好说话,我说网卡有问题,请帮我更换,他们说检测没问 ...


感谢提供线索,
我判断也是网卡 或者  网线接口这块的问题, 还有的哥们  建议固定使用静态IP试试

昨晚那次的断网,正是我异地自动备份流量大的时候出现的,

系统?  有的哥们  debian12也有这情况。系统目前还不方便换,太多站在里面
作者: CMBCHINA    时间: 2025-7-21 17:37
本帖最后由 CMBCHINA 于 2025-7-20 21:38 编辑
Toools 发表于 2025-7-20 20:12
感谢提供线索,
我判断也是网卡 或者  网线接口这块的问题, 还有的哥们  建议固定使用静态IP试试


出问题的就是debian11和12 ,你用其他的应该是没问题的。比如centos/rockylinux啥的,
当然你要懂得话,可以修改/etc/sysctl.conf   反正我是不太懂,反正包的大小和策略都要改
作者: lordong    时间: 2025-7-21 17:47
本帖最后由 lordong 于 2025-7-21 17:52 编辑

和你差多 9.9刀OVH鸡 发现这个问题当时是基于DEBIAN12的PROMOX

也是时不时网络失联

流量一大就断网

后来发现是网卡问题

关闭 EEE 禁用 TSO 和 GSO

可以参考

https://docs.hetzner.com/robot/dedicated-server/troubleshooting/performance-intel-i218-nic/

去问GHATGPT给你个脚本

设置为永久重启开机自动运行关闭这些
作者: simonw    时间: 2025-7-21 18:06
已经习惯了,
猜测是散热的问题


作者: nmb    时间: 2025-7-21 18:42
硬盘,散热,供电,内存。特别是老机子内存是很容易出问题的。
作者: tem    时间: 2025-7-21 18:44
网卡驱动有问题,好像要设置rx不节能什么的
作者: Toools    时间: 2025-7-21 20:36
simonw 发表于 2025-7-21 18:06
已经习惯了,
猜测是散热的问题

我也工单让数据中心检查过, 没有散热问题
你这个比我频率更高,猜测真是网卡方面的原因

作者: 小混混    时间: 2025-7-21 22:29
换个系统就好,那个Debian 11版本会自动休眠
作者: Toools    时间: 2025-7-22 10:47
lordong 发表于 2025-7-21 17:47
和你差多 9.9刀OVH鸡 发现这个问题当时是基于DEBIAN12的PROMOX

也是时不时网络失联

感谢,已经使用这招了,在观察

暂时是临时禁的,没有脚本开机自动工作。

先观察一段时间再看, 我猜应该也是这个原因了
作者: 张小龙    时间: 2025-7-22 10:54
OVH 的机器好像是有这个问题,但是垃圾场nocix堪萨斯的机器似乎没有这个问题。
作者: lordong    时间: 2025-8-2 01:47
Toools 发表于 2025-7-22 10:47
感谢,已经使用这招了,在观察

暂时是临时禁的,没有脚本开机自动工作。

现在如何了?稳定了吗?是这个问题导致的吗?

作者: xiaoz    时间: 2025-8-2 06:29
本帖最后由 xiaoz 于 2025-8-2 10:03 编辑

有遇到,你看我另一个帖子也有反馈,不过没一个人答复。我的是OVH CA KS-LE,每隔1-3个月就会出现网络问题,然后自己恢复,官方让我自己检测我的程序软件问题,QTMD数据已经迁移到netcup不准备续费了。
作者: HKYUN    时间: 2025-8-2 08:54
估计是网卡问题
作者: MSN    时间: 2025-8-2 09:54
所以我一直用VPS。或者超大号VPS。大号VPS有的时候比服务器都贵
作者: Toools    时间: 2025-8-8 13:46
lordong 发表于 2025-8-2 01:47
现在如何了?稳定了吗?是这个问题导致的吗?

临时禁后, 用了接近20天,还是不行, 昨晚又不能ping了,重启后 又行


作者: lordong    时间: 2025-8-8 13:54
Toools 发表于 2025-8-8 13:46
临时禁后, 用了接近20天,还是不行, 昨晚又不能ping了,重启后 又行

能坚持二十天算是有进步了,如果后面你再找出是什么问题,再给我们说一下哈。目前OVH对这个问题是不怎么上心的。。。
作者: Toools    时间: 2025-8-8 13:56
lordong 发表于 2025-8-8 13:54
能坚持二十天算是有进步了,如果后面你再找出是什么问题,再给我们说一下哈。目前OVH对这个问题是不怎么 ...

一直都是 20来天出现,  几天较少。  客服确实不上心,我已经做个两轮硬件排查过,没异常,不了了之

作者: Apian    时间: 2025-8-8 13:57
一台阿童木ATOM N2800 KS1 centos7的最近也经常出现,不知道咋回事,重启都不行,TK他们处理上线了,但是没有告知原因,现在TK貌似有点敷衍,我怀疑硬件挂了
作者: lordong    时间: 2025-8-8 13:59
Toools 发表于 2025-8-8 13:56
一直都是 20来天出现,  几天较少。  客服确实不上心,我已经做个两轮硬件排查过,没异常,不了了之
...

他们做检测估计没作对,要DEBIAN下大流量24小时不间断测试才能发现问题。

估计他们可能连iperf3长时间测试都懒得做。
作者: Toools    时间: 2025-8-8 14:42
lordong 发表于 2025-8-8 13:59
他们做检测估计没作对,要DEBIAN下大流量24小时不间断测试才能发现问题。

估计他们可能连iperf3长时间测 ...

好像流量不大的情况下 ,其实也会出现这症状。

哥们, 你还做过哪种方法来预防 或者 解决,   (定期重启? )
作者: chxin    时间: 2025-8-8 14:45
Toools 发表于 2025-8-8 13:46
临时禁后, 用了接近20天,还是不行, 昨晚又不能ping了,重启后 又行

同样故障,ip时通时不通,工单说正常,重装无效,无法换机器,只能重买一台换了
作者: Toools    时间: 2025-8-8 14:59
chxin 发表于 2025-8-8 14:45
同样故障,ip时通时不通,工单说正常,重装无效,无法换机器,只能重买一台换了 ...

大换系统也不行?  比如  debian  换 Ubuntu  ,也验证不行吗
作者: lordong    时间: 2025-8-12 08:33
Toools 发表于 2025-8-8 14:42
好像流量不大的情况下 ,其实也会出现这症状。

哥们, 你还做过哪种方法来预防 或者 解决,   (定期重 ...

老哥,新版DEBIAN13出来了,新内核。我试了下有改善一些稳定性,你可以试试,看看有没有好些。
作者: Toools    时间: 2025-8-12 09:24
lordong 发表于 2025-8-12 08:33
老哥,新版DEBIAN13出来了,新内核。我试了下有改善一些稳定性,你可以试试,看看有没有好些。 ...

我不太方便更换系统,  DEBIAN13这个没1个把月时间,可能也测试不出来效果吧
我上周5又提交工单给 网络部门-  不确定性故障   那栏提交了工单,让继续排查,目前还没回, 看看怎么说
作者: lordong    时间: 2025-8-12 09:50
Toools 发表于 2025-8-12 09:24
我不太方便更换系统,  DEBIAN13这个没1个把月时间,可能也测试不出来效果吧
我上周5又提交工单给 网络部 ...

小心OVH ~ 如果他们觉得工单烦了 看到你是国人 有可能会被直接删号
作者: Toools    时间: 2025-8-12 10:40
lordong 发表于 2025-8-12 09:50
小心OVH ~ 如果他们觉得工单烦了 看到你是国人 有可能会被直接删号

感谢提醒,刚刚已经关闭了工单
将就用吧
后期有什么消息进展, 沟通一下
作者: gick    时间: 2025-8-12 11:08
不知道和你说的是不是同一问题。我的自玩小站放在OVH上也是过段时间不通,我以为可能是爬虫太多OVH防御导致的。其它流量不大的站没事。所以我就把它迁移到别的机器上了。
作者: Toools    时间: 2025-8-12 11:18
gick 发表于 2025-8-12 11:08
不知道和你说的是不是同一问题。我的自玩小站放在OVH上也是过段时间不通,我以为可能是爬虫太多OVH防御导致 ...

发生后会自动来一封邮件, 大概是不能 ping, 机房的人, 人工给你重启了,,,,,又恢复正常。   

如果是这样的话, 就是类似问题




欢迎光临 全球主机交流论坛 (https://443502.xyz/) Powered by Discuz! X3.4