SuperPoint学习训练纪录盘点各种报错解决方法（二）

企业开发 2022-07-31 19:22:31 阅读次数: 0

之前介绍了原版SuperPoint，可惜原版没有公开训练代码，接下来看一个复现版本。

为了成功运行这个版本，反复配置无数遍，建议大家就跟着我的方法来，一次就成功。

运行成功，cuda cudnn tensorflow-gpu 版本和之间的版本对应十分重要，配置有点不对，后面各种问题。

配置方法来源

1.配置虚拟安装环境

首先安装anaconda，用来配置虚拟环境，我用的3.5.3版本，我是系统是ubuntu18.04。

下载后终端命令安装（一路回车，yes，问到vscode，填no，安装完成。）

bash Anaconda3-5.3.0-Linux-x86_64.sh

安装完成后创造一个python=3.6的环境（3.7遇到tf1.12无法安装的错）

conda create --name superpoint python=3.6

2.开始superpoint环境配置

别用pip配TensorFlow 然后conda配cuda cudnn 那样版本都需要自己控制，非常容易出问题。用conda配TensorFlow，conda会适配cuda cudnn。

conda install tensorflow-gpu=1.12

安装完毕用查看一下配置

conda list

可以看见cuda cudnn都安装好了分别是10.0 和 7.6.5

由于已经安装了TensorFlow-gpu 则在编译源码前需要在requirement.txt中去掉TensorFlow-gpu

打开SuperPoint/requirement.txt 去掉第一行的TensorFlow==1.12

然后开始安装源码，在Superpont目录下。

make install

3.配置完毕盘点我遇到的小部分报错

Check failed: h != kInvalidChunkHandle TensorFlow版本问题 1.12改1.13。

load without loader yaml.load掉了参数改为config = yaml.load(f,Loader=yaml.FullLoader)

大概是input axle 0 200，shape must（50，150，0）调用两个以上gpu训练就会遇到，建议就两个来。

scores has incompatible shape tf cuda cudnn 之间的版本错误

Check failed: cusolverDnCreate(&cusolver_dn_handle) == CUSOLVER_STATUS_SUCCESS Failed to create cuSolverDN instance 终端运行export TF_FORCE_GPU_ALLOW_GROWTH=true

OP_REQUIRES failed at cholesky_op.cc:154 : Internal: tensorflow/core/kernels/cuda_solvers.cc:375: cuSolverDN call failed with status =7 tf cuda cudnn 之间的版本错误

猜你喜欢

转载自blog.csdn.net/weixin_48464886/article/details/120976621

SuperPoint学习训练纪录盘点各种报错解决方法（二）

SuperPoint学习训练纪录无训练版与带训练版本（一）

基于深度学习的特征提取系列（二）：SuperPoint 论文

YOLOv6训练时报错解决方法

PyTorch学习中遇到的各种问题（安装python，import出错，github下载速度慢的解决方法，from scipy.misc import imread 、import torch报错）

MAVEN学习(七)--maven报错与解决方法

【强化学习】安装gym==0.18.3报错的解决方法

[3D检测系列-PointRCNN]复现PointRCNN代码，并实现PointRCNN3D目标检测可视化，包含预训练权重下载链接（从0开始以及各种报错的解决方法）

深度学习模型训练痛点及解决方法

VUE学习遇到的问题及解决方法（二）

Idea下GPU训练时报错：cuDNN not found——解决方法

【AI实战】YOLOv7加载多GPU训练的模型报错解决方法

appium运行各种坑爹报错问题及解决方法

iOS 上传 App Store的各种报错解决方法

spark各种报错汇总以及解决方法

Sigma的个人训练纪录

使用opencv训练分类器时，traincascade训练报错：Train dataset for temp stage can not be filled.解决方法

记录学习元素定位法时出现的报错以及解决方法

Python3+Appium学习笔记05-报错及解决方法

Selenium 学习笔记，第一个例子就报错，解决方法

Caffe学习（一）：安装Windows版Caffe与Faster RCNN过程中的报错及解决方法

深度学习遇到报错Bug解决方法（不定时更新）

深度学习部署：Windows安装pycocotools报错解决方法

盘点ip地址冲突解决方法

【PyTorch教程】04-详解torchvision 0.13中的预训练模型加载的更新及报错的解决方法 (2022年最新)

带你深入AI（1） - 深度学习模型训练痛点及解决方法

深度学习训练过程耗时越来越长解决方法

python机器学习及实践第二章的2.1.2.1线性回归器程序报错Reshape your data either using array.reshap(-1,1)的原因及解决方法

学习多线程笔记二——使用多线程所面临的的问题及解决方法

Katalon Studio学习笔记(二)——请求响应中文乱码解决方法

今日推荐

周排行

3.5星|津巴多《时间的悖论》：未来导向的人更有可能取得个人的成功，但帮助他人的可能性更小

k8s无脑系列（二）-DNS服务搭建和访问

leetcode 26 从排序数组中删除重复项

Python Web 框架：Django、Flask 与 Tornado

中科院计算所研究员陈益强：越来越'聪明'的智能硬件

dotNET面试（二）

数据备份恢复

vue 路由知识点梳理及应用场景整理

ajax局部刷新流程

分段、分页&&内存碎片、外存碎片

每日归档

更多

2025-03-22(0)

2025-03-21(0)

2025-03-20(0)

2025-03-19(0)

2025-03-18(0)

2025-03-17(0)

2025-03-16(0)

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)