安装基础包
yum -y install epel-release
yum -y install kernel-devel
yum -y install dkms
|
编辑文件 /etc/default/grub 修改
“GRUB_CMDLINE_LINUX
”rd.driver.blacklist=nouveau nouveau.modeset=0
grub2-mkconfig -o /boot/grub2/grub.cfg
|
重启
安装显卡驱动
下载显卡驱动
下载完成是类似这样的文件 NVIDIA-Linux-x86_64-
410.72
.run 直接执行即可,
卸载 直接接参数 --uninstall
验证驱动是否正常
nvidia-smi
|
安装CUDA 9.0
我们使用rpm的方式安装
https:
//developer.nvidia.com/cuda-91-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=rpmlocal
|
需要把patch也一并下载
-rw-r--r--
1
root root
155023660
Jul
14
2018
cuda-repo-rhel7-
9
-
0
-
176
-local-patch-
4
-
1.0
-
1
.x86_64.rpm
-rw-r--r--
1
root root
1595730326
Sep
23
2017
cuda-repo-rhel7-
9
-
0
-local-
9.0
.
176
-
1
.x86_64.rpm
-rw-r--r--
1
root root
150679337
Dec
21
2017
cuda-repo-rhel7-
9
-
0
-local-cublas-performance-update-
1.0
-
1
.x86_64.rpm
-rw-r--r--
1
root root
149765568
Feb
15
2018
cuda-repo-rhel7-
9
-
0
-local-cublas-performance-update-
2
-
1.0
-
1
.x86_64.rpm
-rw-r--r--
1
root root
173037836
May
24
2018
cuda-repo-rhel7-
9
-
0
-local-cublas-performance-update-
3
-
1.0
-
1
.x86_64.rpm
|
在安装时,可能会有写软件包有冲突,比如ipa-client, salt-minion等, 我们可以暂时先把有冲突的卸载,回头在装回来
冲突的原因是用yum安装了python的模块,会造成python的pip管理有问题, 所以有冲突
rpm -ivh 安装完这些rpm 还没完事, 它其实只是解压在了/var目录
(paddle-venv) root
@algorithmgpu
-
11
-
123
:/var# ls -ld /var/cuda*
drwxr-xr-x
3
root root
138
Aug
6
11
:
48
/var/cuda-repo-
9
-
0
-
176
-local-patch-
4
/
drwxr-xr-x
3
root root
4096
Aug
6
11
:
56
/var/cuda-repo-
9
-
0
-local/
drwxr-xr-x
3
root root
138
Aug
6
11
:
48
/var/cuda-repo-
9
-
0
-local-cublas-performance-update/
drwxr-xr-x
3
root root
138
Aug
6
11
:
48
/var/cuda-repo-
9
-
0
-local-cublas-performance-update-
2
/
drwxr-xr-x
3
root root
182
Aug
6
11
:
48
/var/cuda-repo-
9
-
0
-local-cublas-performance-update-
3
/
|
我们需要在进入这些目录安装里面的rpm, 安装也是有顺序的
- /var/cuda-repo-9-0-local/ rpm -ivh *
- /var/cuda-repo-9-0-local/ rpm -Uvh * 其余patch依次按顺序
这样cuda就安装完成了, 安装目录在 /usr/local/cuda-9.0
下面配置环境变量
cat /etc/profile.d/cuda.sh
export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}
export PATH=/usr/local/cuda/bin/:${PATH}
|
导入一下环境变量 source /etc/profile
安装cudnn-9.0-linux-x64-v7.1
下载上面的版本
https:
//developer.nvidia.com/rdp/cudnn-download
|
安装
https:
//docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html
其实只是拷贝到对应目录
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
|
编译安装paddle
文档
注意这句话 执行编译前请您确认在虚环境中安装有编译依赖表中提到的相关依赖:
我们使用本机编译的方法, 非docker
照着文档一步步做就可以了
tips
make -j$(nproc) 这个命令执行时间可能得半天,根据不同网络而定
因为要下载很多git上的仓库
最后这个paddle的目录有 8.4G