工作站服务器CentOS安装Nvidia RTX3080/3090 GPU显卡驱动

系统安装完成后执行以下操作

 

参考地址:https://www.cnblogs.com/gollong/p/12655424.html

0.下载显卡驱动 并且保存到你知道的目录,后面会用到

  英伟达官网(有时需要FQ):https://www.nvidia.cn/drivers/results/168541/#

1.安装依赖库
yum -y install gcc
yum -y install epel-release
yum -y install --enablerepo=epel dkms 
2.安装kernel-devel 
  
yum install kernel-devel
yum install kernel-headers
 
3.查询 kernel
  
uname -r
 
4.安装对应版本
yum list | grep kernel-devel

 
5.屏蔽系统自带的nouveau,检查nouveau驱动
lsmod | grep nouveau

有输出代表需要禁用,无输出代表正常

有输出的情况需要禁用nouveau驱动
 vim /etc/modprobe.d/blacklist.conf 文件,
 
#nvidia driver
blacklist nouveau
options nouveau modeset=0

加入以上内容并保存   {ESC退出  :wq }
 
6. 重建initramfs image步骤 ,备份重建原来的镜像文件
      mv  /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
 
      dracut /boot/initramfs-$(uname -r).img $(uname -r)
重启
reboot
重启之后,界面应该是低分辨率。
 
7.进入文本界面
init 3
安装NVIDIA驱动
CD 打开到具体文件夹,执行以下命令
./NVIDIA-Linux-x86_64-460.32.03.run --no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1160.2.2.el7.x86_64(改成你的内核版本)
进入图形界面
init 5
 此时,界面应该正常。
 
8. 检查驱动情况
nvidia-smi
安装CUDA
似乎安装好了驱动,CUDA就安装好了。

这些信息对应的含义如下:

  

  • GPU:GPU编号(第0块GPU)
  • Name:GPU型号(GeForce RTX 2080 Ti)
  • Persistence-M:持续模式的状态。开启持续模式时新GPU启动时间短,耗能大。(off)
  • Fan:风扇转速,从0到100%之间变动(33%)
  • Temp:温度,单位是摄氏度(48摄氏度)
  • Perf:性能状态。P0表示最大性能,P12表示状态最小性能,即 GPU 未工作时为P0,达到最大工作限度时为P12(P0未工作)
  • Pwr:Usage/Cap:能耗(69W/250W)
 
  • Bus-Id:涉及GPU总线(00000000:02:00.0)
  • Disp.A:Display Active,表示GPU的显示是否初始化(off)
  • Memory-Usage:显存使用率(0MiB/11019MiB)
  • Volatile GPU-Util:浮动的GPU利用率(1%)
  • Uncorr. ECC:Error Correcting Code,错误检查与纠正(N/A)
  • Compute M.:compute mode,计算模式(Default)

  • Processes:表示每个进程对 GPU 的显存使用率

nvidia-smi -L

列出所有可用的 NVIDIA 设备信息

Training

训练的是YOLOv5的yolov5s模型
  • 定义使用的设备 --device 0 (第零号显卡)

  •  不定义使用的设备 发现四张卡都在运作。

显卡交火


显卡交火(AMD-ATI的多显卡技术叫做CrossFire;NVIDIA的多显卡技术叫SLI) 简单的说就是:让两块或者多块显卡协同工作,是指芯片组支持能提高系统图形处理能力或者满足某些特殊需求的多显卡并行技术。要实现多显卡技术一般来说需要主板芯片组、显示芯片以及驱动程序三者的支持。

显卡交火系统,是基于你的主板主持四路插槽系统的基础上,你安装n个一样型号的显卡,n个显卡就可以一起运作达到交火性能作用,比如远近闻名的四路泰坦。

系统会将要完成的画面(视频、动画、游戏、文本、图片等的等等)分解成几部分,分别分配给几块显卡独立渲染,然后再将渲染的结果交给主卡合成为一幅完整的画面(结果),输出给显示器。由于每块显卡只负责渲染画面的几分之一(取决于有几块显卡),大大的降低了显卡的负担,提高了运算速度,必然大幅度的提升系统整体的图形运算性能。

一般说来,双卡互联的总体性能大约为单卡的1.9倍(两块相同的显卡)。如果几块显卡参数相差较大,比如用GTX950和GTX980互联,那么GTX980就极大的被浪费了。因此,显卡之间规格最好相同。

References

  1. GPU状态监测 nvidia-smi 命令详解
  2. 主板的多显卡是怎么工作的?性能会提高吗?
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
原文地址:https://www.cnblogs.com/KdeS/p/14736469.html