设备长期跑量不理想的排查思路
设备长期跑量不理想分两种情况:一是设备长期无上行流量,二是设备长期有上行流量,但是流量很低,或只是偶尔短时间突高一下,下面分别进行原因说明。
设备长期无上行流量原因
- 设备NAT非0,请参考NAT非0优化进行处理;
- 设备存储不可用,请更换存储盘;
- 设备插件版本过低,或版本更新失败,请检查系统稳定性,确保插件能够自更新;
- 设备频繁掉线或者重启,请检查确保网络稳定;
- 设备网络ping长期延迟超过150ms,或者丢包超过20%,请检查确保网络稳定;
- 节点归属非中国大陆,非三大运营商(电信、移动、联通),此类资源建议下线。
设备长期低上行流量原因
- 是否为新上线设备,新设备刚部署上线,无缓存或缓存少,一般新设备需要3天~7天的部署缓存观察期,之后带宽才趋于稳定
- 设备NAT类型频繁变动,请检查确保网络稳定;
- 设备网络ping延迟高,或者丢包,请检查确保网络稳定;
- 设备存储介质性能差,读写速度慢,请参考《3.2.2 如何选购合适的存储盘》小节更换优质存储盘;
- 设备混跑严重,导致系统负载高,请保证充足的系统资源;
- 设备CPU性能差,可服务的并发连接数小,更换成多核心,或高性能CPU的资源;
- 设备间隙性掉线或者重启;
- 该设备归属区域需求冗余;
- 设备本身上行带宽小,存储容量小。