代码理解网络选择候选区域及确定最终目标框的过程 - 代码天地

代码理解网络选择候选区域及确定最终目标框的过程

其他 2018-07-09 09:48:24 阅读次数: 0

之前小鱼在获取Faster RCNN最终候选框坐标值中介绍怎么得到最终目标框的坐标值（左上角及右下角），但是因为还需要获取最终目标框的特征向量，所以简单的以为在代码中加入：

    fea=net.blobs['fc6'].data
    print fea.shape

但是结果只是达到一个1*4096维度的向量，很是郁闷，按道理最终目标框有多少个就应该会输出多少个1*4096维度的向量，所以小鱼的目标就是获取最终每个目标框的特征向量．在探究的过程中小鱼完全理清了网络如何选择候选区域和最终怎么确定目标框．

首先网络通过RPN网络得到2000个region proposals，然而并不是所有的都送入Fast RCNN进行分类和位置进修，而是通过去重叠和去边缘无效候选框等操作，得到前300个score 最高（已经从大到小进行排序过）的region proposals送入Fast RCNN．代码为~/py-faster-rcnn/tools/demo.py中：

dets = np.hstack((cls_boxes,
                          cls_scores[:, np.newaxis])).astype(np.float32)

这里可以加入：print dets.shape来查看dets的维度进行验证．

接着对这300个region proposals进行NMS非极大值抑制操作，又可以滤掉一部分region proposals，实现的代码是~/py-faster-rcnn/tools/demo.py中：

        keep = nms(dets, NMS_THRESH)
        dets = dets[keep, :]

keep为结果NMS操作之后剩下来的region proposals序列号，属于[0-299]
数字之间，再跳过dets[keep,:]就得到dets数组中序号为keep那一行的数组[x1,x2,x3,x4,score]．比如这里通过NMS操作之后剩下93个候选框，这些候选框的score值已经进行排序．

最后，对这剩下的93个候选框进行阈值判断，也就是对score进行判断，大于某个阈值就判定是有效正样本并保留为最终候选框．实现的代码是~/py-faster-rcnn/tools/demo.py中：

 inds = np.where(dets[:, -1] >= thresh)[0]

inds为最终比较完阈值剩下的目标框总数，假设这里为23，就表示最终可以进行可视化显示的bounding box为23个．

这里的各种变换有点绕，希望小鱼这篇博客对大家有帮助，有问题可以进行留言相互讨论，喜欢留个赞哦，谢谢．

猜你喜欢

转载自blog.csdn.net/zllljf/article/details/79525245

代码理解网络选择候选区域及确定最终目标框的过程

目标检测入门：候选区域选择

透彻理解RPN: 从候选区域搜索到候选区域提取网络

【59】候选区域

JavaEE 基于myeclipse的学习过程（最终目标：个人网站）

1.3 SOMTA代码生成器的最终目标

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解

基于深度学习的目标检测模型（基于候选区域的方法）

运维的最终目标是什么？

[DeeplearningAI笔记]卷积神经网络3.10候选区域region proposals与R-CNN

Faster RCNN原理及Pytorch代码解读——RPN（五）：生成候选区域

软件开发的最终目标将会是什么？

XShell配置跳板机访问最终目标主机

查看链接文件的最终目标的多种方法

JavaEE （一）登入界面（最终目标：个人网站）

3.10 候选区域-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

基于候选区域的深度学习目标检测算法R-CNN，Fast R-CNN，Faster R-CNN

深入理解 c# 第十四章最终目标:动态地调用方法直到你弄到正确的名字

最终目标展示：一个完善的操作系统

GPT-2和Transformer很好用，但不是AI生成文本的最终目标

瑞幸咖啡的最终目标并不是做国内市场大哥

Faster RCNN原理篇（三）——区域候选网络RPN（Region Proposal Network）的学习、理解

机器学习18:RPN区域候选网络

“开发和运维”只是一个开始，最终目标是构建高质量的软件工程

ArcGIS 实现框选区域查询要素后，要素点击弹出框

OpenCV目标追踪鼠标选择ROI区域

选择框代码记录

主图选择，附图放大进行主图所选区域的观察（即主图不变，附图负责观察详情）

idea输入法候选区不跟随光标

OpenCV鼠标框选区域 --源程序

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)