如何解决服务器网络压力下远程ssh心跳超时问题

问题

postgresql故障节点rewind过程,主备节点间存在大量的数据传输,此时主机节点ssh备机节点可能会出现心跳超时断开问题:

类似问题:

ssh 远程执行命令慢(debug2: channel 0: open confirm rwindow 0 rmax 32768)

出现的服务器:dell R740 :KYLIN V10

分析

网卡bufferfloat满载,小包可能会发不出去

解决

方法一(当前生效):

tc qdisk replace dev em1 root fq_codel

注:此方法重启系统后会失效

方法二(永久生效):

1、echo 'net.core.default_qdisk=fq_codel' >>/etc/sysctl.conf

2、重启服务器

查询是否生效

tc qdisc show dev eth0

结果如下表示生效:

qdisc fq_codel 0: root refcnt 2 limit 10240p flows 1024 quantum 1514 target 5ms interval 100ms memory_limit 32Mb ecn drop_batch 64

但行好事,莫问前程
原文地址:https://www.cnblogs.com/mingfan/p/14988015.html