第一章 Ubuntu16.04搭建Tensorflow-GPU

 在安装之前,最好版本之间要匹配,下面是Tensorflow官网给出的匹配图:

1、Install CUDA Toolkit 9.0

我安装的CUDA是9.0版本的,随着更新,也可以尝试新的版本。

CUDA Toolkit9.0下载地址:https://developer.nvidia.com/cuda-downloads

注意:安装CUDA Toolkit 9.0,您需要拥有一个CUDA开发人员帐户,然后登录。如果不这样做,请注册一个,然后您可以登录并访问下载,下载Ubuntu版本。

还需要根据自己的系统和显卡型号安装相应驱动:https://www.nvidia.com/Download/index.aspx?lang=en-us,完成此操作后,您就可以安装驱动程序和CUDA Toolkit了

下载的安装包一般在Download,然后改变下载文件的权限:

cd ~/Downloads
chmod +x * .run

运行.run文件(有多个分别运行)

./cuda_9.0.xxxx.run

最后运行:

nvidia-smi

若出现下面图,则表示安装成功

2、Install CUDNN v7

下载地址:https://developer.nvidia.com/cudnn

根据安装的CUDA版本找到对应的cuDNN版本,我的是7.3.1。

cd ~/Downloads

复制includes到cuda目录:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include

复制lib64到cuda目录:

sudo cp cuda/lib64/* /usr/local/cuda/lib64

Grant permissions:

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

Now, finally, we just need to export the system path to CUDA elements:

sudo nano ~/.bashrc

Go to the very end of this file, and add:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64" export CUDA_HOME=/usr/local/cuda

3、Install GPU Tensorflow

(1)首先安装python3

sudo apt-get install python3
#若要安装指定版本的python,这地方可以更改成你需要的版本
sudo apt-get install python3.6 python3.6-dev

(2)切换python优先级

安装好后会在 /usr/bin/ 下出现 python3.6 这个可执行文件,现在需要切换版本(默认版本2.7)
如下就是设置python3.6的路径,并设置优先级为200,默认优先级最高的优先使用

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3.6 200

所以如果想要使用系统默认的2.7版本,需要键入

sudo update-alternatives –install /usr/bin/python python /usr/bin/python2.7 250 

并设置优先级大于其他的版本 

(3)安装pip

当前python版本为3.x,输入如下命令:

sudo apt-get install python3-pip python3-dev

若python版本为2.7,则输入如下命令:

sudo apt-get install python-pip python-dev

在装tensorflow之前,不管是不是最新的pip版本,都要更新一下,具体命令如下:

python 2.7版本:
sudo pip install --upgrade pip
python 3.x版本:
sudo pip3 install --upgrade pip

(4)Tensorflow安装

CPU版本:
sudo pip3 install tensorflow
GPU版本:
sudo pip3 install tensorflow-gpu

 执行python3,进入命令行,查看安装版本:

python3

import tensorflow as tf
tf.__version__

我的是1.9.0,如果要改变tensorflow的版本,执行:

sudo pip3 install tensorflow-gpu=1.9.0

注意:若出现了libcudart.so.7.5: cannot open shared object file: No such file or directory的错误,如下所示:

原因是你安装的cuDNN高于7.5,怎么办呢?下面是解决办法:

比如我的安装的版本是9.0的,首先,将链接libcudart.so.9.0到/usr/lib以及/usr/lib/libcudart.so.7.5

ln -s /usr/local/cuda/lib64/libcudart.so.9.0 /usr/lib
ln -s /usr/local/cuda/lib64/libcudart.so.9.0 /usr/lib/libcudart.so.7.5

然后执行:

sudo ldconfig

OK

 

猜你喜欢

转载自blog.csdn.net/hunzhangzui9837/article/details/82853565