Ubuntu安装配置Tensorflow-GPU

Ubuntu 16.04 + GTX 1080 Ti + CUDA 9.0 + Cudnn 7.1 安装配置

1. 安装显卡驱动

首先查看一下自己的电脑需要怎样的驱动,我们可以先到 http://www.nvidia.com/Download/index.aspx 查询下我们需要的是怎样的驱动,这里我的显卡是 GTX 1080 Ti,所以以此为例说明,勾选好对应的配置:

 

点击search并下载驱动

打开terminal,卸掉系统原有驱动:

sudo apt-get remove --purge nvidia*

在安装新驱动前,禁用nouveau:

在终端中运行 lsmod | grep nouveau

若没有输出则nouveau已禁用;若有输出则说明nouveau正在运行,需要手动禁用:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在该文件尾部输入以下内容:

blacklist nouveau 
options nouveau modeset=0

保存并关闭文件。

在终端中执行:sudo update-initramfs -u

再次运行 lsmod | grep nouveau 检查nouveau是否禁用,若未禁用则重复上述操作。

关闭图形化界面:sudo service lightdm stop

按Ctrl + Alt + F1 进入字符终端页面,

进入驱动所在的目录,运行:

 sudo sh 驱动名

安装完之后重启: sudo reboot

打开终端输入命令: nvidia-smi, nvidia-settings查看驱动安装状态:

 

 

2. 安装CUDA 9.0

sudo sh cuda_9.0.176_384.81_linux.run

是否Accept EULA:Accpet

Install driver:Yes/No

Install OpenGL:No

Run nvidia_xconfig: No

Install Cuda Toolkit: Yes

Yes

Yes

配置CUDA的环境变量:

sudo gedit ~/.bashrc

在文件尾部输入:

  1. export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH  
  2.   
  3. export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH  

运行source ~/.bashrc 使其生效

 

3. 配置 Cudnn

下载Cudnn并解压:

tar -zxvf cudnn-7.0-linux-x64-v3.0-prod.tgz

解压后会看到一个cuda文件夹,里面包含了include以及lib64两个子目录。我们需要做的就是将这两个字母里面的文件复制到cuda对应的安装目录。这里以cuda的安装目录为/usr/local/cuda/,这个目录下也会包含include/以及lib64/这两个文件夹,将之前目录的文件复制过来即可。

sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuDNN/cuda/lib64/* /usr/local/cuda/lib64/

 

这时候本来已经可以了,但是由于权限的原因原来的两个符号链接文件(libcudnn.so,libcudnn.so.7.0)已经失效了,直接编译便会报错,所以这时手动生成符号链接。

#下面的操作在/usr/local/cuda/lib64/目录下进行

sudo rm -rf libcudnn.so libcudnn.so.7.0#删除两个符号链接;

sudo ln -s libcudnn.so.7.0.64 libcudnn.so.7.0

sudo ln -s libcudnn.so.7.0 libcudnn.so

 

运行source ~/.bashrc 使其生效

如果出现下面问题:

/sbin/ldconfig.real: /usr/local/cuda/lib64/libcudnn.so.7 is not a symbolic link

则参考如下解决方法,版本需对应安装的cudnn的相应版本(link:https://askubuntu.com/questions/1025928/why-do-i-get-sbin-ldconfig-real-usr-local-cuda-lib64-libcudnn-so-7-is-not-a):

sudo rm libcudnn.so

sudo ln libcudnn.so.7.0.5 libcudnn.so.7

sudo ln libcudnn.so.7 libcudnn.so

sudo ldconfig

Cudnn配置完毕

 

4. 安装Anaconda

根据环境下载对应的anaconda 软件,运行:

Sudo bash Anaconda3-5.1.0-Linux-x86_64.sh

安装完之后创建python虚拟环境:

conda create -n tensorflow pip python=2.7 # or python=3.3, etc.

(根据需要选择合适的python版本)

 

5. 安装Tensorflow-gpu

输入命令:source activate tensorflow-gpu

pip install --ignore-installed --upgrade tfBinaryURL

(我装的是tensorflow-gpu 1.10版本,把tfBinaryURL 替换如下

https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.10.0-cp36-cp36m-linux_x86_64.whl )

链接不好使~需要多试几次,tensorflow会自动下载安装

 

6. 缺少的一些包用pip安装:

Pip install opencv-python

Pip install matplotlib, etc

原文地址:https://www.cnblogs.com/jimchen1218/p/11804927.html