安装CUDA和cuDNN

　　参考资料：

　　https://blog.csdn.net/weixin_44629973/article/details/105480753

　　https://blog.csdn.net/u012235003/article/details/54575758

　　https://www.jianshu.com/p/22b11a11a25e

　　https://blog.csdn.net/zhouchen1998/article/details/107778087

　　上面的四个博客已经把安装需要的所有东西讲清楚了，这则随笔想写一下自己配这个环境学到的东西，以及安装大致流程。

　　（我的）目标：想自己从源码编译一下Pytorch，发现需要安装CUDA和cuDNN，于是有流程如下：　　

　　1. 检查是否安装了显卡驱动

　　你的服务器上有若干张显卡，你可能已经安装了显卡驱动（通过apt-get install）也可能没有。如果你安装了显卡驱动，那么你应当能运行nvidia-smi命令查看显卡的运行情况。

　　2. 下载与你显卡兼容的CUDA

　　去英伟达的官网下载与你的显卡兼容的CUDA，CUDA的版本书写模式是10.0, 10.1 ,11.0 ,11.1这种。驱动版本的书写模式使440.95.01这种，cuDNN的版本书写模式是v8.0.2这种。怎么检查兼容性？答：先通过显卡型号查得自己的显卡支持的最高CUDA，选定CUDA版本后英伟达官网会给出与CUDA版本对应的cuDNN版本。即显卡→CUDA→cuDNN。

　　3. 安装

　　现在你已经下载了需要的包，先运行apt-get install build-essential安装编译器，再使用sh命令运行CUDA的安装脚本（扩展名一般是.run）。如果你已经有了nvidia的驱动，那么不要在安装的时候勾选安装驱动。这个过程可能缺少一些组件，也可能报错。但通过查看log并搜索解决方案，解决的时间成本很低。（记得关闭lightdm服务，如果有）

　　4. 配置环境变量

　　安装完CUDA之后，/usr/local/文件夹下会出现一个文件夹比如cuda-11.0，还会出现一个链接叫cuda。此时你需要配置环境变量来链接你需要的cuda版本（这也意味着你可以安装多个不同版本的CUDA）。我建议这样配置：

　　在/etc/profile 下添加如下语句：

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-版本/lib64
export PATH=$PATH:/usr/local/cuda-版本/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-版本

　　然后source /etc/profile，如果你不加版本，那么直接写cuda应该也可以，会指向cuda这个链接指向的地方。

　　5. 测试

　　通过上述步骤，CUDA的安装已经大致完成，那检验胜利成果。通过运行nvcc -V和测试编译来测试！（详见第2个参考资料）

　　cuDNN的安装就比较简单，就把库拷过去即可。