Unbuntu配置Caffe以及调试DeepLab记录

本篇文档主要是记录这一个星期以来配置caffe和deeplab,以备以后忘记了使用。中间遇到无数坑,但是总算是配置好了。

配置caffe

首先我是拿到了一台导师给的空空的服务器,所以参考下面的文章首先进行了配置:
Ubuntu 16.04 安装配置Caffe 图文详解

上面的配置过程中遇到以下坑:
1、配置NVIDIA驱动的时候选择了NVIDIA-Linux-x86_64-384.98.run这个包,对应型号是GeForce的TITAN Xp。
2、安装NVIDIA驱动的时候由于要取消使用本机自带的驱动,所以此时重启一下看到ubuntu系统的信息中图形中为llvmpipe (LLVM 5.0, 256 bits),一查才知道是OpenGL,所以在安装的时候记得使用命令:

sudo ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files

后面的–no-opengl-files代表不安装OpenGL,否则就会陷入反复重启的无奈中,参考:
ubuntu 16.04 安装英伟达gtx1080显卡驱动 解决反复重启问题 以及 cuda8.0 cudnn 安装

3、安装CUDA的时候又是一个巨大的坑,导致反复重装多遍,大家不要用最新版的9.0,因为会有很多的兼容问题,一定找到之前的8.0版本就行,就是上面配置文档中的版本。
还有就是特别注意安装的过程中一定要注意提示!!!!!
注意:执行后会有一系列提示让你确认,但是注意,有个让你选择是否安装nvidia367驱动时,一定要选择否:
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?
因为前面我们已经安装了更加新的nvidia367,所以这里不要选择安装。其余的都直接默认或者选择是即可。

我就是没注意所以又得卸载重装,不过也有文档说也可以就装这个版本,但是毕竟我们找的NVIDIA版本是和我们的GPU最合适的,所以还是不要选了吧。

4、我的python是anaconda自带的python,很方便就可以安装python和很多科学计算的库,大家也可以参考:
ubuntu 16.04 +caffe+anaconda (CPU) 安裝詳細教程
进行anaconda的配置。

5、在配置的过程中还遇到了两个问题找了很久才找到的两个很好的解决方案:
(1)一个是关于matio的配置问题:
https://github.com/TheLegendAli/DeepLab-Context/issues/8
这位大佬的答案完美解决问题
其中的文件大家可以在上面链接中找到下载地址。
其中的cmake文件的产生是用下面这个方法来编译生成的:
https://github.com/BVLC/caffe/issues/3671
这里写图片描述

(2)还有就是一直出现的找不到opencv_dep_cudart
我在这里找到答案:
https://stackoverflow.com/questions/37534604/opencv-with-cmake-version-3-5-2-vs-cmake-2-x-x
其中的:

sudo cmake .. -DCUDA_USE_STATIC_CUDA_RUNTIME=false

完美解决,这里的cmake就是上面(1)中第二幅图的cmake时候使用。

基本上就是这些方法帮助我解决了配置的问题,每台机器的“个性”可能不太一样,所以大家在配置的时候会遇到各种坑,一个一个bug慢慢解决吧,最终总会成功的。

配置DeepLab

其中参考了:
http://blog.csdn.net/xmo_jiao
这个大牛的一系列配置文章,但是最终发现还是这个简单的比较好:
http://blog.csdn.net/ruotianxia/article/details/78331964

其中也有一些一些我遇到的坑:
1、首先是# USE_CUDNN := 1,我如果注释掉会出现很多bug,找不到各种层的文件,但是注释掉这个就好了,我也不知道为啥,有哪位大牛知道望告知(感谢!!!)

2、再有就是编译的时候一直显示找不到/.bulid_release/caffe.bin,闹了很久这个问题,主要是编译的问题,不要按照上面编译caffe时候用cmake编译,上面xmo_jiao的代码里面已经有了cmake编译好的文件,直接按照教程make就好了,还有就是run_pascal.sh文件里面按照下面教程里面的:

CAFFE_BIN=${CAFFE_DIR}/build/tools/caffe.bin

来填,而不是/.bulid_release/caffe.bin,因为我这样填一直找不到这个caffe.bin。

3、再就是这个Error loading shared library libhdf5_hl.so.XXX的问题,也是弄了很久,其实就是将anaconda2的lib文件夹里面的相关的这个文件拷贝到/usr/lib/x86_64-linux-gnu/这个文件夹下就好了。但是还是很困惑,我用

ldconfig -p | less

这个命令查看到很多这个报错的库都是已经在共享了,为什么还报错呢(也希望大牛告知)。

反正就是最终按照上面的第一篇文档就是将数据集融合了一下,始终没有配置成功,但是第二篇文档的步骤配置成功了。

猜你喜欢

转载自blog.csdn.net/sinat_28731575/article/details/78958348