UBUNTU18.04 SERVER 多显卡 服务器,为防止显卡计算任务出现不意外报错,设置显卡工作状态为:设定持久模式

参考:

https://www.cnblogs.com/devilmaycry812839668/p/14799016.html

https://www.cnblogs.com/devilmaycry812839668/p/14799092.html

==============================================================

参考:

http://bbs.gpuworld.cn/index.php?topic=10353.msg20364

设定持久模式,(就是没人用GPU的时候,驱动不自动卸载,而是一直都处于加载状态)  
本次有效下次重启还需要重新设定。

默认状态是驱动每次用完都自动卸载的,然后重新加载。

一个常见的用途是,root设定了PM模式后,加载驱动了,然后普通用户可以方便的CUDA.

----------------------------------------------------------------------------

如果不加载这个,driver频繁卸载加载,GPU频繁被初始化,会导致GPU死机,CPU访问PCIe config registers时间过长导致 softlock。

driver不用的时候会卸载。

----------------------------------------------------------------------------

设置持久模式命令:

nvidia-smi -pm 1
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注者,如有侵权请与博主联系。
原文地址:https://www.cnblogs.com/devilmaycry812839668/p/14940294.html