Linux(CentOS)下安装NVIDIA GPU驱动

GCC

官网:http://gcc.gnu.org

1)检查

NVIDIA驱动需要GCC等C/C++开发环境,首先检测GCC是否已经安装

gcc –v
# 如果系统显示没有找到GCC指令,或没有显示GCC版本信息,则需要安装C/C++环境

2)安装

# 使用yum命令安装
yum -y install gcc gcc-c++ kernel-devel //安装gcc、c++编译器以及内核文件

GPU

官网:https://www.nvidia.cn/

Blog:https://blog.csdn.net/xueshengke/article/details/78134991 https://blog.csdn.net/guohaosun/article/details/82749029 https://blog.csdn.net/Zhangwellyear/article/details/84956346 https://onlycaptain.github.io/2018/08/18/Ubuntu%E4%B8%8BNvidia%E9%A9%B1%E5%8A%A8%E5%AE%89%E8%A3%85/

1)下载

https://www.nvidia.cn/Download/index.aspx?lang=cn

2)安装

2.1)ELRepo源安装

ELRepo源提供了nvidia-detect命令,会自动寻找合适的驱动,然后根据显示的结果,用yum就能完成安装

1、添加ELRepo源

# 导入公钥(公共密钥)
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
# 为RHEL-7、SL-7/CentOS-7安装elrepo
rpm -Uvh https://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm # rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

2、查找合适驱动

# 安装显卡检查程序
yum install nvidia-detect  
# 查找合适的显卡驱动
nvidia-detect
kmod-nvidia
  

3、安装驱动

# 根据查询结果,安装合适版本驱动
yum -y install kmod-nvidia # yum install $(nvidia-detect)
# 也可以查找软件源中驱动程序
yum search kmod-nvidia

4、重启

reboot

2.2)离线安装

1、禁用Nouveau驱动(Root权限)

sudo vim /etc/modprobe.d/blacklist-nouveau.conf
# 添加下列两行
blacklist nouveau
options nouveau modeset=0
# 重新生成 kernel initramfs
dracut --force

2、重做initramfs镜像

cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
# 这一步可不执行
rm /boot/initramfs-$(uname -r).img.bak ; 

3、重启

# 改为终端模式,runlevel改为3
systemctl set-default multi-user.target
init 3
# 重启服务器
reboot
# sudo shutdown -r now
# 重启后验证驱动是否被禁用 如果无结果显示则表明成功禁用
lsmod | grep nouveau

4、查看系统内核版本

# 不同操作系统的内核版本会不一样
uname -r
# 3.10.0-957.el7.x86_64
#  确认boot目录的空间不少于300MB
df

5、预安装组件

# 联网安装
yum install gcc kernel-devel kernel-headers

6、安装下载的NVIDIA-Linux-x86_64-418.87.00.run

# 必需指定kernel source path,否则会报错;kernel的版本和系统内核有关,可能会有差别
./NVIDIA-Linux-x86_64-418.87.00.run --kernel-source-path=/usr/src/kernels/3.10.0-957.el7.x86_64  -k $(uname -r)
# 执行后,开始解压驱动包,进入安装步骤,可能中间会出现一些警告,但是不影响
Verifying archive integrity... OK
Uncompressing NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81.......................................
..................................................................
..................................................................

Accept(许可证)

Yes(安装32位兼容库)

安装完成!

问题

Error:Unable to load the 'nvidia-drm' kernel module . 

解决https://blog.csdn.net/maoersong/article/details/90574624

sudo vim /etc/modprobe.d/blacklist-nvidia.conf
# 添加内容
# Do not modify
# This file was generated by nvidia-prime
blacklist nvidia
blacklist nvidia-drm
blacklist nvidia-modeset
# alias nvidia off
# alias nvidia-drm off
# alias nvidia-modeset off
# 执行更新命令
sudo update-initramfs -u

3)检查驱动安装是否成功

# 查看GPU相关配置
nvidia-smi # 如果正常显示安装的显卡信息,则说明驱动安装成功; # 如果提示找不到该指令,或什么信息都没有显示,则驱动安装失败,可以卸载驱动后重新安装

CUDA

访问:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=8&target_type=runfilelocal

下载:http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run

cuDNN

访问:https://developer.nvidia.com/rdp/cudnn-download

下载:cuDNN Library for Linux

原文地址:https://www.cnblogs.com/YSPXIZHEN/p/11466145.html