【原创】疑难杂症,综合故障,适配器供电不足引发的网络故障

前一段时间,基于RK3399 DIY了一个路由器,4G内存,6核心CPU,ARM64架构,跑了一些特殊服务,放在电视柜里还是比较稳定的,就是线多,不美观。

拓扑结构是   电信光猫   |   移动光猫  —– 联果交换机(4口2.5G + 2口10G SFP+)—RK3399  DIY路由器 |  ZTE无线路由

最近一段时间,又购买了一台10G交换机,将主干升级到10G光纤,也就具备将DIY版路由器移个位置的条件,起初也没有觉得啥,就是这几天,路由器频繁死机,特点就是网速奇慢无比、路由器一会就死了,

拓扑结构是   电信光猫   |   移动光猫 |  ZTE无线路由 —– 联果交换机(4口2.5G + 2口10G SFP+)—– 联果交换机(4口2.5G + 2口10G SFP+)—-RK3399  DIY路由器

换了以前非常稳定的N1,导入RK3399路由的配置,依然死的一塌糊涂,由此怀疑是不是配置引发的惨案。

一直怀疑是物理机sing-box以及docker虚拟路由器里面hysteria,两个同时跑,因为涉及AES解码,是不是把资源吃完了,导致死机,于是关了他们,结果路由还是一下死一下死的,比之前更老火了,甚至1分钟1死,把非必要的服务关了,路由器依然要死,想来还是体质或者是配置原因。我都怀疑是不是 AES对系统CPU能力要求较高,解码需求多了,就死了。

都已经放弃了这个DIY路由器了,拿出了以前的Mikrotik千兆路由替换了DIY设备,结果跑不满200Mbps,想想还是自己做的DIY路由性能强一些,又绕回来了,来查找这个路由慢的原因。

为了排除不是新加的网络设备的原因,将设备挪回电视柜,用电视柜的适配器(台达3A)接上,没有问题。

猛然想到是不是 之前搬迁后用那个12V-1A的适配器供电不足,(搬迁前用的是台达3A)适配器,把路由搬回去,换上12V-3A电源,测试了一个小时,居然稳定了,网速也快了不少,想来就是适配器供电不足。这才发现,路由顶上的风扇转速显然不够,像没有有一样,还有一点噪声了。想来是天气冷了,油干了,阻力增大,导致风扇功耗增大,于是供电不足了,直接取了风扇,DIY的RK3399路由器似乎又稳定了。 为了验证这个想法,将N1 diy路由弄上去,居然也运行如飞,至少路由器稳定了,但测速,依然达不到200M宽带的峰值 240MBPS,只有200兆左右。

开始查弱电箱设备,无意中瞥见弱电箱集中供电的适配器山寨版(12v-10A)适配器,实际最大输出能力可能至多12v-4a左右,弱电箱有2光猫、10G交换机1个(模块2个),风扇2个。USB风扇接在移动光猫U口,想起最近几天移动宽带网络时不时抽风,光猫时不时点不亮,怕也是供电不足的原因,拆除USB风扇,弱电箱移动光猫稳定了。

仅仅留下了小风扇散热。

全部打理好后,RK3399主路由再测速,200Mbps宽带瞬间拉满到250mbps的极限速率。视频播放也在8万分以上,如此,问题全部解决。

===============

分析:这个问题是由于两个适配器供电不足引发的设备问题,十分隐蔽难查,特此记录。

结论:足安的适配器对网络稳定至关重要!!!冬天温度降低,温度导致风扇轴承里的油干涸,引起阻力增大(完全是推测,未用万用电表设备测试),会提升功耗,超出适配器供电能力,引发不稳定,导致网络不稳定。

这个困扰了我10天半个月的问题至此解决。

那么,下一步需要做的,则是寻觅一款安全足A的适配器,给弱电箱供电。

============================

后来那个RK3399还是出问题,故障有供电的原因,但估计还是有其他方面的原因,现在换回N1了。关于RK3399为什么要死机呢?重新刷机试试?是个大工程啊。

2024年11月10日,发现 rk3399 路由, rpcd 服务卡死,直接把CPU2拉满了,直接导致路由页面到不开( ubus.sock),把该服务kill 掉,路由页面秒开。

在确保了弱电箱供电够用的情况下(只保留了电信光猫、交换机,然后京东紧急购买了一个正宗明纬的12v 6.67A 80wd电源,还没有到货),实在没有办法找到RK3399啥问题了,丢一边,换上N1路由,结果稳定了10多个小时。

那么说,RK3399自身的确是有问题的。一、怀疑是硬件CPU 暗伤坏?二、怀疑硬件内存哪里暗伤?  三、怀疑是系统用长了,各种冲突?

第一、第二就是用另一块板子来测试,这个比较耗时。

第三种,也是为难,在RK3399装系统,这个工程量有点大,好在以前有脚本备份,也就是20分钟,然后,恢复环境试试。(反正又测试吧,若能好,那么就排除第一二种可能了,我觉得大概率可能会好。

重装了RK3399的系统,似乎好像不抽风了。回想起写入镜像时,慢的很。那么,就是说,它自带的EMMC的性能并不好,大概就是一般TF卡级别,系统长期读写,碎片化导致EMMC性能下降?又或者软件冲突? 反正是好了。具体原因还真没明白。至于具体是哪一个原因,得以后再复现才知道了。

分析:这次系统不稳定,大概率就是两个问题,一个是弱电箱供电不足,引起部分设备工作不正常(连电信光猫电源led灯都坏了)。二个是路由器本身系统故障引发。重装后,路由器是稳定了。

那么,就等电源回家了。然后,整个家庭网络又能安稳的工作了。

===========

11日 00:50分,又断。

通过wifi无法访问局域网任何ip

弱电箱交换机断电后重开,可以访问除开路由器以外的其他ip。

更换光模块一对(难道光模块有问题?),然后重启路由,现在恢复访问。

现在就等待变压器回来了。

问题你说变压器不行,它也不发热啊,莫非真是光模块也有问题?

这是个系统性的复杂问题。

或许电源回来,一切就明白了。

=============

其实N1今天一天好像不怎么死,那么,买个硅脂,给RK3399涂上,看看它还死不死。

要是等电源回来,弱电箱稳定它还死,就让它 另谋高就

=====================================================

重新擦了 硅脂, 同样死。

换了另外一台RK3399,同样死。

以前不死,如此,排除设备本身问题。说明大概率是 配置引发了。

这个就没有必要弄了,重新装 ARMBIAN,做其他服务器吧。

路由还是用N1吧,毕竟N1还是外观要好看得多。

===================================================

电源回来了,京东自营的电源,台湾明纬 80 W,正宗货。换上去以后,弱电箱5个设备工作正常了(动力澎湃,从风扇声音可以听出来)。换回RK3399,居然不死了。

结论:之前正品电源损坏,临时用手边既有的山寨 台达(12V,10A) 替代,想着凑合用一用,一直又舍不得买新电源,结果,开始还行,后来慢慢的不稳了,想来超出了它的供电能力,勉强供电品质也不好。

想来是 弱电箱供电品质不好,导致光纤级联的下级设备网络不稳定,而我的RK3399路由虽然接在下一级交换机上,但由于网络不稳定,导致反复,设备频繁死机,无法自动恢复,引发网络系统性的故障。

如此,网络已恢复。故障就是供电原因。却是弱电箱供电原因,而不路由的原因。

这个,也给我提了个醒,电源的品质一定要好,输出的电流一定要足A,要纯净。

 

再说一下为啥没买台达,想来基本上个人很难买到正宗的台达、全汉,假货满天飞,而且贵的要死,台湾明纬专业做电源,相对要便宜一点,但品质却是世界一流,加上有京东自营加持,设备本身支持在线验证,所以,买明纬电源也一样。

 

===============

终:弱电箱是稳定了,只是rk3399路由会断流,也懒得去找原因了,反正大概率就是配置问题了。 N1当前已经稳定了。

===============

2024年11月13日,今天,百度一下,说是sing-box tun 连接超过200M时候,会引发死机。

又在哪里看见,说MWAN3插件会引起断流。

今天N1路由工作正常,但无法登录WEB页面以及SSH。怀疑是不是argon主题与升级后的组件不兼容????(网上也有argon主题与openwrt的报告)

于是,将 sing-box 改为 tproxy模式,卸载mwan3插件,卸载argon主题。删除了/etc/config中不存在服务的配置(遗留垃圾配置)

好像,备用rk3399路由稳定了,至少,目前一切正常了,这个问题太隐蔽了,持续观察。

估计N1工作正常则是因为N1是以前做的固件,版本和RK3399略有不同,一直没有升级任何插件。

最终,原来在用的那个RK3399(老),还是不稳定。但N1,备用RK3399似乎是稳定了

==

14日,一早,昨夜备用rk3399运行一晚上,稳定无事,fast测速恢复至带宽极限,如此。原主用rk3399坏了暗伤的可能性较大,也不管那台机器了,直接用备用吧。

15-16日,回四川老家了,家里没用网络,稳定。

继续观察

今天19号 稳定

这么说,问题是不是出在20那台机器???? 病毒(之前装盗版软件????)