Ubuntu14.04+cuda8.0+tensorflow环境搭建教
Ubuntu安装这里不做详细教程,刻录到U盘进行安装即可。在显示检测到别的系统的界面时,注意选择使用自己分配空间。建议安装英文版。
一、nvidia驱动安装
对于Ubuntu的深度学习环境搭建,第一步是cuda的搭建,cuda中自带了nvidia的驱动,但建议先自行安装。Nvidia在linux下的驱动是一个神坑。具体操作步骤如下:
1、到nvidia官网查找显卡的做支持的驱动型号,并进行下载,此电脑为gtx1060,使用的为375.66版本的驱动。下载的是一个run文件。重命名为nvidia.run,放于home目录下。
2、电脑开机,进入bios,禁用集成显卡,对应浪潮服务器的操作为(不同型号有不同的操作),在VGA Priority目录下,修改成为offboard。即外接显卡为优先使用设备。将屏幕的vga线连接到显卡的输出,重启之后,屏幕显示无信号,但需要等待至电脑完全开机,屏幕才会点亮,驱动安装必须在使用独显输出的情况下才能成功,否则安装失败!笔记本未知是否需要这么操作。
3、更新显卡信息
sudo update-pciids lspci | grep –i vga 即可看到显卡型号
4、禁用nouveau
Linux自带nvidia驱动nouveau,需将其禁用,具体命令如下
sudo gedit/etc/modprobe.d/blacklist.conf
在文件末尾添加以下部分之后保存:
blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv (这里有一行空格)
运行
sudo update-initramfs –u
重启电脑
运行
lsmod | grep nouveau若无输出,则禁用成功
5、更新Ubuntu源,这里使用的为清华的源。
sudo apt-get update更新
6、进入文本模式(ctrl+alt+f1),解决桌面循环登录问题
sudo service lightdm stop (关闭图形界面) sudo sh nvidia.run –no-opengl-files
这条语句,如果驱动不在home目录下,则先cd到所下载的驱动目录下,这里已将文件重命名为nvidia.run,方便安装。–no-opengl-files表示不安装opengl,若缺损这条命令,安装完驱动将会循环登录!
安装提示一路accept,continue,yes即可。
运行
sudo nvidia-xcomfig配置文件
sudo service lightdm start
开启图形界面。
重启
若登录时,界面有一个巨大的nvidia标志闪过,即为安装成功,否则安装失败。若安装出错或循环的登录,运行以下命令进行下载:
sudo apt-get remove --purge nvidia-* sudo sh nvidia.run –uninstall
重新根据以上步骤操作即可。
二、cuda 8.0的安装
此步骤相对简单,采用runfiles安装。从nvidia官网下载相应的驱动,安装步骤参考nvidia驱动。环境检测建议下载官方文档
在终端中输入: $gcc --version 可以查看自己的gcc版本信息
1、检查是否安装了kernelheader和 package development
在终端中输入: $uname–r 可以查看自己的kernel版本信息
在终端中输入:$ sudo apt-getinstall linux-headers-$(uname-r)
可以安装对应kernel版本的kernel header和packagedevelopment
2、开始安装
sudo service lightdm stop sudo sh cuda.run
后面需要注意的是,在询问是否安装nvidia驱动时,因为已经单独安装过了,所以选择no,其他全选yes。
安装后,显示installed,即为安装成功。
sudo service lightdm start
3、设置环境变量
sudo gedit /etc/profile
在文件的末尾加入以下内容:
export PATH=/usr/local/cuda-8.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64" export CUDA_HOME=/usr/local/cuda
保存,重启
4、安装测试
cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make ./deviceQuery
得到以下形式结果:
编译之后有可能提示缺少gcc或者g++,缺啥补啥就行
sudo apt-get install g++
三、安装cudnn,其实就是把文件夹节假,然后将相应的文件copy覆盖
根据版本下载相应的版本。这里用为V5.1
tar xvzf cudnn.tgz sudo cpcuda/include/cudnn.h /usr/local/cuda/include sudo cpcuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
即可
四、安装TensorFlow,使用pip安装
1、打开命令框,输入,python,查看Python版本,此为2.7
2、安装pip
sudo apt-get install python-pip python-dev
安装GPU加速的TensorFlow版本
export TF_BINARY_URL=https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.11.0-cp27-none-linux_x86_64.whl sudo pip install --upgrade $TF_BINARY_URL
致此,环境搭建完成,可下载一个minisit分类样例自行测试。