当前位置: > Ubuntu >

Ubuntu16.04+gtx1060+cuda8.0+cudnn8.0+tensorflow安装

时间:2019-12-28 11:47来源:linux.it.net.cn 作者:IT
1.Ubuntu16.04安装
 
 
 
1)先去官网找到对应的版本,我这里安装的是Ubuntu16.04 ltx版本,下载地址为:https://www.ubuntu.com/desktop。
 
2)下载好后,找一个U盘,用ultroiso制作启动盘,具体办法百度google网上一大堆。
 
3)关机,重启,按F12或者del进入bios设置boot顺序,我电脑是f12进入,开机的时候会有闪过,注意看一下或者网上查。把U盘设置为第一顺序。
 
4)然后就选择install Ubuntu。后面有不同是安装方式,比如和win一起,Erase disk and install Ubuntu,或者其他方式自己设置分区。
 
5)之后设置用户名密码之类,然后就是等。到最后下载abobe-flash的时候很慢,用了网上的方法,拔掉网线,过了会儿就装好了。然后就可以看到全新的Ubuntu系统。
 
 
 
2.GTX1060驱动安装
 
先根据对应的GPU下载对应的驱动版本,下载地址为http://www.nvidia.com/Download/index.aspx?lang=en-us
 
在我电脑上Ubuntu下载的速度很慢,所以先在win下用迅雷下好了,然后拷贝到了U盘里,放在home或者downloads目录下都行。
 
方法可以参照这里:https://wiki.ubuntu.com.cn/NVIDIA,但是不用完全安装步骤走。
 
我的方法是,1)ctrl+alt+f1到命令行环境,然后输入用户名和密码登录
 
2)sudo /etc/init.d/lightdm stop关闭界面环境
 
3)cd到放驱动文件的目录,运行sudo sh driver-name.sh,然后一路安装下去
 
4)sudo /etc/init.d/lightdm restart重新启动界面环境
 
5)终端输入nvidia-smi看安装结果
 
这样就安装成功了。
 
(装好的第二天某次死机了,我强关电脑重启后,出现了登录界面循环的问题,在小伙伴的建议下又重新装了一边显卡驱动就好了,这是后话)
 
(补充:后续电脑出现了挂起suspend恢复后会出现死机的问题,升级了内核出现黑屏,显示“输入不支持”,用启动盘进入try Ubuntu后用boot-repair修复后开机进入了选择内核的页面,选择了原来的内核才重新进入,真是大坑。后来又装了NVIDIA 367还是370的驱动,从sestem setting装的,还是会死机。不甘心的我认为还有可能是16.04太新,重装了14.04,装了375.20的驱动,还是会出现挂起恢复后死机,情况好点,玩了一小会儿才死机,但是依然会死。网上又搜了一些信息,最终感觉是nvidia驱动的问题,无怪Linus torvalds对nvidia说的那句,fuck you,nvidia!
 
14.04下367的驱动依然不行)
 
 
 
(以下三部分参考了博客:http://blog.csdn.net/WoPawn/article/details/52302164)
 
3.CUDA安装 
 
CUDA的安装文件也是win下下好的,通过U盘拷到了linux下。下载地址为:https://developer.nvidia.com/cuda-toolkit
 
安装步骤为:
 
1)cd到文件目录
 
2)sh CUDA-NAME.run --override 
 
3)启动安装程序,一直按空格到最后,输入accept接受条款 
输入n不安装nvidia图像驱动,之前已经安装过了 (这里注意)
输入y安装cuda 8.0工具 
回车确认cuda默认安装路径:/usr/local/cuda-8.0 
输入y用sudo权限运行安装,输入密码 
输入y或者n安装或者不安装指向/usr/local/cuda的符号链接 
输入y安装CUDA 8.0 Samples,以便后面测试 
回车确认CUDA 8.0 Samples默认安装路径:/home/用户名目录,该安装路径测试完可以删除 
 
 
 
 
 
4.cudnn安装
 
 
终端输入 
1)cd 到放安装文件的目录 (也是提取下好的)
2)解压在下载目录下产生一个cuda目录 
tar zxvf cudnn-8.0-linux-x64-v5.1.tgz 
cd cuda/include/ 
sudo cp cudnn.h /usr/local/cuda/include/ 复制头文件 
cd ../lib64 打开lib64目录 
sudo cp lib* /usr/local/cuda/lib64/ 复制库文件 
sudo chmod a+r /usr/local/cuda/include/cudnn.h/usr/local/cuda/lib64/libcudnn*给所有用户增加这些文件的读权限  
 
 
 
 
5.建立软链接
 
1)终端输入 
cd /usr/local/cuda/lib64/ 
sudo rm -rf libcudnn.so libcudnn.so.5 
sudo ln -s libcudnn.so.5.1.5 libcudnn.so.5 
sudo ln -s libcudnn.so.5 libcudnn.so 
2)设置环境变量(不然找不到CUDA文件,重要)
终端输入sudo gedit /etc/profile 
 
在末尾加入 
PATH=/usr/local/cuda/bin:$PATH 
export PATH 
保存后,创建链接文件 
sudo vim /etc/ld.so.conf.d/cuda.conf 
按a进入插入模式,增加下面一行 
/usr/local/cuda/lib64 
按esc退出插入模式,按:wq保存退出 
最后在终端输入sudo ldconfig使链接生效
 
 
 
6.cuda samples测试
 
打开CUDA 8.0 Samples默认安装路径,终端输入 
cd /home/用户名/NVIDIA_CUDA-8.0_Samples 
sudo make all -j4 (4核) 
出现“unsupported GNU version! gcc versions later than 5.3 are not supported!”的错误,这是由于GCC版本过高,在终端输入 
 
(源博客出现了这个问题,在我安装的时候并没有出现)
cd /usr/local/cuda-8.0/include 
sudo cp host_config.h host_config.h.bak 
sudo gedit host_config.h 
ctrl+f寻找有“5.3”的地方,只有一处,如下 
# if __GNUC__ > 5 || (__GNUC__ == 5 && __GNUC_MINOR__ > 3) 
#error -- unsupported GNU version! gcc versions later than 5.3 are not supported! 
将两个5改成6,即 
#if __GNUC__ > 6 || (__GNUC__ == 6 && __GNUC_MINOR__ > 3) 
保存退出,继续在终端输入 
cd /home/用户名/NVIDIA_CUDA-8.0_Samples  
sudo make all -j4 (4核) 
完成后继续向终端输入 
cd bin/x86_64/linux/release 
./deviceQuery 
完成之后出现如下图所示,表示成功安装cuda
 
(这是源博客的图)
 
 
 
 
 
 
 
7.安装pip
 
cd 
wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py 
sudo python ez_setup.py --insecure 
wget https://bootstrap.pypa.io/get-pip.py 
sudo python get-pip.py
 
 
 
9.Tensorflow安装
 
tensorflow有四种安装方式,
 
1)pip安装
 
2)Virtualenv installation
3)Anaconda installation
4)Docker installation
或者从源代码编译安装,我因为要用anaconda,所以选用了anaconda安装方式
 
官网的安装指导看这里:https://www.tensorflow.org/versions/r0.11/get_started/os_setup.html#anaconda-installation,网上也可以找到很多中文教程。大致步骤为:先安装anaconda2或者3,cd到目录下的envs目录,用conda指令创建一个tensorflow虚拟环境,然后source activate tensorflow,用pip下载安装。
 
然后可以在tensorflow环境下用conda指令安装ipython和jupyter
 
$ source activate tensorflow
(tensorflow)$ conda install ipython
 
(tensorflow)$ conda install jupyter
 
以后可以输入jupyter notebook,在jupyter里用tensorflow
 
每次启动都需要先source activate tensorflow,结束的时候deactivate tensorflow。
 
这次装完后后来出过一次问题,输入import tensorflow后,输出no module namad tensorflow,没找到解决办法,我重装了一下好了。
 
要是想在pycharm下用tensorflow的话,参考上一篇博客。
 
(责任编辑:IT)
------分隔线----------------------------
栏目列表
推荐内容