ubuntu18.04 当你的安装了cuda,程序跑着跑着,却崩溃了怎么办?(提示cuda没了)

前情提要:最近跑程序,突然有天提示cuda没了,具体大意是cuda没安装,但其实我已经安装好久了,而且程序也跑了很多次了,后来查明白,其原因有二:

(1)linxu系统的不稳定性,经常会导致这样那样的问题。这样的时候一般是要重装了,缺啥装啥。

(2)Ubuntu18.04内核更新导致的重新更换成旧内核就行。

 网上搜索的教程连接如下:

个人摸索出来的一点经验,写下来以防忘记。我们需要先去探查一下具体问题在那里,我分为两步:

1.在终端输入 nvcc -V ,查看驱动和cuda在不在。

这就表示该在的都在,驱动也在。

2.在终端输入 nvidia-smi,再次查看驱动可不可以用。

 提示这个,就证明你的驱动确实有问题,非常符合上面列举的第二个原因。那你就只需两步:

1.输入  sudo apt-get install dkms

2.输入  sudo dkms install -m nvidia -v 460.84

这里的460.84是你前面安装的驱动版本号,比如:NVIDIA-Linux-x86_64-460.84.run  那你的版本号就是460.84,如果不记得了,可以这么查看:进入/usr/src目录中,可以看到里面有nvidia文件夹,后缀就是其版本号 。

输入  cd /usr/src 

但我没办法按此进入,路径有问题,庆幸的是我记得我的版本号

 这两步以后,你的驱动就ok啦。

可以再次输入  nvidia-smi,查看

 如图,就没问题了,事实上,到此我的问题就解决了,但如果这样还解决不了,那就只能归为第一个原因,然后缺啥装啥,第一个首先还是装驱动,可以参考  https://www.cnblogs.com/senfm/p/14887402.html

 

补充一点小知识,为了防止我的环境再次崩溃,我直接限制了我的更新,来源(https://www.cnblogs.com/carle-09/p/11504544.html):

祝好!

原文地址:https://www.cnblogs.com/senfm/p/14983413.html