安装CUDA和cuDNN

  参考资料:

  https://blog.csdn.net/weixin_44629973/article/details/105480753

  https://blog.csdn.net/u012235003/article/details/54575758

  https://www.jianshu.com/p/22b11a11a25e

  https://blog.csdn.net/zhouchen1998/article/details/107778087

  上面的四个博客已经把安装需要的所有东西讲清楚了,这则随笔想写一下自己配这个环境学到的东西,以及安装大致流程。

  (我的)目标:想自己从源码编译一下Pytorch,发现需要安装CUDA和cuDNN,于是有流程如下:  

  1. 检查是否安装了显卡驱动

  你的服务器上有若干张显卡,你可能已经安装了显卡驱动(通过apt-get install)也可能没有。如果你安装了显卡驱动,那么你应当能运行nvidia-smi命令查看显卡的运行情况。

  2. 下载与你显卡兼容的CUDA

  去英伟达的官网下载与你的显卡兼容的CUDA,CUDA的版本书写模式是10.0, 10.1 ,11.0 ,11.1这种。驱动版本的书写模式使440.95.01这种,cuDNN的版本书写模式是v8.0.2这种。怎么检查兼容性?答:先通过显卡型号查得自己的显卡支持的最高CUDA,选定CUDA版本后英伟达官网会给出与CUDA版本对应的cuDNN版本。即显卡→CUDA→cuDNN

  3. 安装

  现在你已经下载了需要的包,先运行apt-get install build-essential安装编译器,再使用sh命令运行CUDA的安装脚本(扩展名一般是.run)。如果你已经有了nvidia的驱动,那么不要在安装的时候勾选安装驱动。这个过程可能缺少一些组件,也可能报错。但通过查看log并搜索解决方案,解决的时间成本很低。(记得关闭lightdm服务,如果有)

  4. 配置环境变量

  安装完CUDA之后,/usr/local/文件夹下会出现一个文件夹比如cuda-11.0,还会出现一个链接叫cuda。此时你需要配置环境变量来链接你需要的cuda版本(这也意味着你可以安装多个不同版本的CUDA)。我建议这样配置:

  在/etc/profile 下添加如下语句:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-版本/lib64
export PATH=$PATH:/usr/local/cuda-版本/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-版本

  然后source /etc/profile,如果你不加版本,那么直接写cuda应该也可以,会指向cuda这个链接指向的地方。

  5. 测试

  通过上述步骤,CUDA的安装已经大致完成,那检验胜利成果。通过运行nvcc -V和测试编译来测试!(详见第2个参考资料)

  

  cuDNN的安装就比较简单,就把库拷过去即可。

原文地址:https://www.cnblogs.com/chester-cs/p/13791575.html