华为云服务器配置
- 名称:GPU加速型 p1.2xlarge.8
- CPU:Intel E5-2690V4 2.6GHz(8核)
- GPU:NVIDIA Tesla P100(单卡,16G)
- 内存:64G
- 硬盘:通用型SSD 100G
- 系统:CentOS 7.3 64bit for P100 | 公共镜像
1 显卡驱动升级
由于华为云GPU服务器自带的显卡驱动版本比较低,不适配当前新版的PaddlePaddle版本,所以先进行显卡驱动的升级。
- 查询Nvidia-Driver版本:
nvidia-smi
- 查询CUDA版本:
cat /usr/local/cuda/version.txt
- 清除所有nvidia相关文件和依赖:
yum remove nvidia-*
- 为了删除干净还可以(目标就是把nvidia-driver的相关组件都清理掉):
rpm -qa|grep -i nvid|sort
yum remove kmod-nvidia-*
- 在卸除驱动后一定记得重启:
sudo reboot
- 到官方下载指定驱动版本文件:NVIDIA-Linux-x86_64-440.118.02.run,然后运行安装:
sh NVIDIA-Linux-x86_64-440.118.02.run
- 然后按照提示框一步步ok就行了,最后使用nvidia-smi查询是否升级成功:
2 安装 Anaconda
Anaconda是1个常用的python包管理程序,里面可以设置好多个python环境。
- 下载 Anaconda 安装脚本
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.05-Linux-x86_64.sh --no-check-certificate
- 下载完成后,执行安装,会提示你阅读授权,一直按回车就可以了
sh Anaconda3-2021.05-Linux-x86_64.sh
然后提示你是否同意,输入yes
安装过程中会询问你安装的位置,一般不用更改,输入回车就行,它会自动解压缩
最后会提示是否初始化Anaconda的一些配置,记得输入yes
- 安装好了之后,把Anaconda配置到环境变量,就可以用快捷 conda 命令了
vim ~/.bashrc #编辑环境配置文件
export PATH="~/anaconda3/bin:$PATH" # 在第一行加入这个
vim 输入 i 可以编辑,编辑好了之后按 Esc, 然后输入 :wq 保存修改
- 保存好了之后更新环境变量,在命令行输入:
source ~/.bash_profile
最后验证一下是否配置成功,没有保存的话就是配置成功了!
- 安装好了之后,创建一个 python3.8的环境,执行一下命令,会有一个确认,输入 y ,然后回车就可以了
conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- 激活 paddle_env 环境
conda activate paddle_env
3 安装 git
因为经常需要从paddle仓库中下载代码,需要用到git,这里需要先把git环境安装好。
3.1 下载
进入到要下载的目录
cd /usr/local
用wegt命令进行下载
wget https://www.kernel.org/pub/software/scm/git/git-2.19.2.tar.gz
3.2 解压
在已下载的目录解压到/usr/local目录下
tar -xzvf git-2.19.2.tar.gz -C /usr/local
3.3 安装
进入解压后的git目录
cd /usr/local/git-2.19.2
执行make configure
make configure
注意:执行此命令时,开始出错,错误如下:
错误信息1:
configure: Setting lib to ‘lib’ (the default)
configure: Will try -pthread then -lpthread to enable POSIX Threads.
configure: CHECKS for site configuration
checking for gcc… no
checking for cc… no
checking for cl.exe… no
configure: error: in/opt/git-2.19.0': configure: error: no acceptable C compiler found in $PATH See
config.log’ for more details
解决办法:通过yum providers gcc 和 yum providers cc 查询到c编译器没有安装,可通过执行yum -y install gcc安装gcc包及对> 应的依赖。错误信息2:
GIT_VERSION = 2.19.2
GEN configure
bin/sh:autoconf:未找到命令
make:***[configure]错误127
解决办法:通过yum providers autoconf 查询到没有安装autoconf,可通过执行yum -y install autoconf安装包及对应的依赖。
配置目录
./configure --prefix=/usr/local/git
执行 make profix=/usr/local/git等待编译完成
make profix=/usr/local/git
注意:执行此命令时,开始出错,错误如下:
错误信息1:
* new build flags
CC credential-store.o
In file included from credential-store.c:1:0:
cache.h:20:18: fatal error: zlib.h: No such file or directory
#include <zlib.h>
compilation terminated.
make: *** [credential-store.o] Error 1
解决办法:缺少zlib库,通过sudo yum install zlib-devel安装包及对应的依赖。
执行make install进行安装
make install
3.4 加入环境变量
echo "export PATH=$PATH:/usr/local/git/bin" >> /etc/profile
source /etc/profile //使修改的文件生效
3.5 检查版本
git --version
如果显示:git version 2.19.2 则证明安装成功!
4 安装 PaddlePaddle
PaddlePaddle 是百度开源的深度学习框架
PaddlePaddle官网:https://www.paddlepaddle.org.cn
-
安装时根据自己的服务器配置选择对应的安装脚本
-
由于国内服务器访问Anaconda官方源可能会很慢,所以这里可以设置一下清华的镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
- 开始安装GPU版Paddle, 也会有一个输入确认,输入y回车就好了,这里安装会有点久哦
conda install paddlepaddle-gpu==2.3.0 cudatoolkit=10.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/
- 安装好PaddlePaddle 之后就可以开始其他安装了,例如:PaddleOCR、PaddleClas等