CEPH经常出现slow request的排查解决

现象:

通过ceph -w日志经常发现有request blocked的问题(如果虚拟机系统跑在ceph上时,就会发现严重的卡顿现象)

排查:

1、通过dstat未发现有明显的瓶颈 (dstat -tndr 2)

2、通过iostat也未发现有明显的瓶颈 (iostat -dx 2)

3、通过netstat也未发现存储网网卡的发送队列或者接收队列有明显的积压 (netstat -an)

4、也未出现ceph官方解释的四种问题(设备坏掉等)

解决:

最后也是多次尝试,发现将存储网网卡的lro关掉后,恢复正常。

关于LRO,LSO,GRO,GSO,TSO,UFO请参考http://www.cnblogs.com/CasonChan/p/5166708.html

原文地址:https://www.cnblogs.com/CasonChan/p/5629662.html