问题记录 | 配置ubuntu18.04+cuda9.0+cudnn服务器tensorflow-gpu深度学习环境

因为实验室服务器资源有限,我被分配的服务器经常变化,但是常常就分到连显卡驱动以及cuda都没有装的服务器,真的很头疼,我已经配了四五台了,特此记录一下,以便以后直接照版本安装。

Install nvidia driver

我的服务器配置是ubuntu18.04,显卡是1080Ti。

给ubuntu添加驱动的源:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt upgrade

查看设备型号得到推荐安装的驱动型号:

ubuntu-drivers devices

自动安装显卡驱动

sudo ubuntu-drivers autoinstall

重启

sudo reboot

如果重启一切顺利就命令检查

lsmod | grep nvidia

or

nvidia-smi

Install CUDA9.0 and cudnn7

查看 CUDA 版本:

cat /usr/local/cuda/version.txt

查看 CUDNN 版本:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

下载好cuda_9.0.176_384.81_linux.run

链接:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run

ubuntu16.04版本的:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run

安装cuda:

sudo chmod 777 cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176_384.81_linux.run -toolkit -samples -override --no-opengl-libs -silent

更改gcc版本

sudo apt install gcc-5 g++-5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50 
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

设置cuda环境变量

vim ~/.bashrc1
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda/extras/CPUTI/lib64
export CUDA_HOME=/usr/local/cuda-9.0/bin
export PATH=$PATH:$LD_LIBRARY_PATH:$CUDA_HOME

下载cudnn要在这个https://developer.nvidia.com/rdp/cudnn-archive链接中选择下载

复制cudnn库至cuda中

tar -zxvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/lib64/* /usr/local/cuda-9.0/lib64/
sudo cp cuda/include/* /usr/local/cuda-9.0/include/

安装tensoflow-gpu-1.14:

pip install -U tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple --user

tensorflow测试程序:

import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
原文地址:https://www.cnblogs.com/ManWingloeng/p/11489122.html