记一次线程等待引起的bug解决过程

1. 记一次线程等待引起的bug解决过程

1.1. 问题

使用Springboot的Scheduled注解框架执行定时任务,发现线上突然不打任何日志了,我们要找到它不打日志的原因

1.2. 导出堆栈信息

  1. 我们使用的是阿里的k8s服务,其实哪里都一样,进到对应容器的里,导出堆栈信息
jps 或 top找到执行java程序的pid
jstack -l pid > out.dump

然后退出容器后,使用docker cp 容器id:out.dump out.dump拿到本机目录,后用ftp拿到该文件

1.3. 分析堆栈信息

  1. 我使用了一个在线分析工具,可以推荐下,将out.dump上传上去分析

想要找到对应线程,首先你日志得把对应的线程信息打印出来,根据之前打印日志的线程信息,可以知道该找哪个线程

UTOOLS1585296657076.png

然后找到对应线程打开

UTOOLS1585296545404.png

找到了阻塞的原因,由于多线程中countdown之前代码运行报错,导致不能执行countdown,使得await阻塞了,我把countdown放到finally中就可以解决该问题了

原文地址:https://www.cnblogs.com/sky-chen/p/12582288.html