Ubuntu系统崩后整理小结

首先是装系统,总是在最后安装那一步,出一些未知名的BUG,每次提示的大概意思是: 拷问的文件xxxx跟目标不匹配,可能会引起主机发热什么的。 查了下原因,网上大概意思是 系统盘 可能是插在了USB3.0的口上了,需要换成 USB2.0 的口重新安装,然而我本来就是插在USB2.0的口啊 (??黑人脸??)。 最后安装成功是用自己电脑,重新烧了一个 Ubuntu16.04 进U盘,并且插在主机的USB3.0的口上,完成了系统安装。(Ubuntu16.04 )

第二步就是更新的 apt 和 PIP的源,这个源就是你每次安装时,搜索的安装包的下载网站,相比于国外原生的地址,国内的网站显然要下载的更快些。

1.apt的源,针对我自己的电脑,这里一定要是 阿里云 的源,否则会导致显卡驱动安装失败!!!

>> sudo gedit /etc/apt/sources.list 

#替换成如下内容
deb-src http://archive.ubuntu.com/ubuntu xenial main restricted #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial universe
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates universe
deb http://mirrors.aliyun.com/ubuntu/ xenial multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse #Added by software-properties
deb http://archive.canonical.com/ubuntu xenial partner
deb-src http://archive.canonical.com/ubuntu xenial partner
deb http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial-security universe
deb http://mirrors.aliyun.com/ubuntu/ xenial-security multiverse

#接着就是更新下
>> sudo apt-get update

2.pip的源

>> mkdir -p ~/.pip/pip.conf

#然后填入以下内容并保存

[global] 
index-url = http://mirrors.aliyun.com/pypi/simple/ 
[install] 
trusted-host=mirrors.aliyun.com 

上面两个基本工作做完后,就可以开始装驱动了,我是直接用apt-get安装的,网上有三种安装方式,但这种是最有效的。

>> sudo apt-get install nvidia-384
#安装完后,需要重启下电脑
>> sudo reboot
#重启后,在命令行就可以检测到显卡驱动安装成功了。
>> nvidia-smi


#如果安装显卡驱动后,登录进入循环界面,不要慌。跟着我做
>> Ctrl + Alt + F1
#输入用户名与密码后,卸载已安装的显卡驱动
>> sudo apt-get remove --purge nvidia-*
>> sudo apt-get autoremove
>> sudo apt-get install -f
>> sudo reboot
#恩、、到此就当什么都没装过。。。。寻找适合自己的显卡驱动版本或者其他安装方法吧。

不知道为什么,我的电脑只能装384版的,如果是390或者其他版本的驱动,安装最后有一段显示 :

。。。
ERROR (dkms apport): There was a segmentation fault when trying to build the module Error! Bad return status for module build on kernel: 4.4.0-21-generic (x86_64)
。。。

猜测应该是不兼容的原因吧。

总之安装显卡驱动是最困难的,对我来说太玄学了。我刚开始也试着装过 nvidia-384 ,但是失败了。 经过一系列尝试发现,当我把 apt 的源从 清华源 换成 阿里云源后,竟然奇迹的安装成功了,也不会出现电脑重启后循环登录界面的情况。以上的这些过程折腾了我好多天的时间。

下面装cuda+cudnn就简单的多了,从官网上下一个cuda8.0或者cuda9.0的.run文件:

>> sudo chmod +x cuda_9.0.176_384.81_linux.run
>> sudo ./cuda_9.0.176_384.81_linux.run

#第二个问是否安装显卡驱动时,选择 no 因为之前已经安装过了。
#其他都是 y 或者 默认路径即可

#cuda安装好后,需要添加两个路径到 ~/.bashrc 文件最后
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
#保存后使文件生效
>> source ~/.bashrc

#配置cudnn,官网下载好自己需要的版本
>> sudo tar -xzf cudnn-9.0-linux-x64-v7.1.tgz -C /usr.local/

有一点需要知道的是,cuda安装完成后,只会生成/usr/local/cuda-9.0文件夹。所以想要卸载cuda时:

>> cd /usr/local/cuda-9.0/bin
>> sudo ./uninstall_cuda_9.0.pl

#卸载完成后,在把cuda-9.0文件夹删除,即可
>> sudo rm -rf /usr/local/cuda-9.0

最后一步就是安装caffe2了,也是由于很多不知名的原因(由于我之前安装的是cuda8,因该是不兼容),导致每次从源码编译caffe2时,很多报错,经常就是缺依赖,等等。也没成功过,最后放弃。还是选择了用anaconda,直接conda install pytorch-nightly -c pytorch .这里也是个重点,以为如果直接 conda install pytorch 的话,下载的是 pytorch0.4.2,而这版本是不包含caffe2的。所以必须是pytorch-nightly ,这个才是1.0的版本!!! 

倒腾了正好5天时间,心累。 不知道为什么自己总是遇到各种玄之又玄的BUG。。。研究生3年,其他的不敢说,装机我小能手!!! 各种bug最终都被我解决了(虽然还是不清楚其中的原因。。。)难受。

哦,刚刚有碰到了一个问题。系统重启后,直接进入了busybox。查了下,是系统文件出了问题,所以我就按照提示(/dev/sdb7 xxxxxx)

fsck.ext4 -y /dev/sdb7

reboot

电脑会重启,然后就正常开机了。

原文地址:https://www.cnblogs.com/caffeaoto/p/9860838.html