R2CNN论文思路记录

其他 2019-07-10 20:24:49 阅读次数: 0

Rotational region cnn

我们的目标是检测任意方向的场景文本，与RRPN类似，我们的网络也基于FasterR-CNN ，但我们采用不同的策略，而不是产生倾斜角度建议。

我们认为RPN有资格生成文本候选，并根据RPN提出的候选文本预测方向信息

检测步骤：

如图所示：a.原图片

　　　　　b.通过rpn得到的text regions

　　　　　c.预测轴对齐框和倾斜框

　　　　　d.对倾斜框进行非极大值抑制得到预测结果

整个检测网络的结构如图：

提取特征的步骤跟之前的RCNN系列一样，基础CNN网络提取出特征，

然后由RPN提取出文本区域(RPN生成包围任意方向文本的轴对齐边界框)，这里已经生成轴对齐框，送入ROI POOLING层进行多个尺度的池化操作（7*7，3*11，11*3）原先的Faster rcnn只有7*7,这三种是专门用来检测常见的文本框。并将pooled特征串联；

通过两个全连接层之后，进行

1.文本/非文本的分类

2.轴对齐框包围的倾斜框的预测，倾斜框的预测（x1,y1,x2,y2,h）这里解释下，倾斜框的坐标表示，通过矩形框顺时针的前两个点的坐标来确定一条线，然后通过h来确定宽度。

3.倾斜框的非极大值抑制，得到结果

倾斜框的坐标表示如图：

对于RPN做出的改动：

更多的小场景检测。通过在RPN中利用较小的anchor比例来解决这一问题。

在Faster R-CNN中的原始anchor 缩放是(8,16,32)

我们研究了两种策略：

　　a)将anchor比例缩放更改为较小的尺寸，并使用(4,8,16);

　　b)增加一个新的anchor缩放并利用(4,8,16,32)
对roi pooling做出的改动：

加入11*3和3*11，使用不同的roi pooling大小获取更多特征， pooled 特征被连接在一起以便进一步检测；

R2CNN的loss函数：

分为两部分，Lcls是分类的loss，下面分别是轴对齐框的Loss和倾斜框的Loss

猜你喜欢

转载自www.cnblogs.com/ywheunji/p/11166146.html

R2CNN论文思路记录

【论文】R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

R2CNN 算法笔记

R2CNN 算法的学习

R2CNN网络结构

R2CNN项目部分代码学习

R2CNN 倾斜框(inclined box)笔记

论文思路

写论文思路

毕业论文思路

Fast R-CNN论文阅读记录

R-CNN论文阅读记录

Faster R-CNN论文阅读记录

毕业论文思路及相关问题

R-CNN论文理解（2）

【遥感目标检测】基于遥感图像的目标检测算法综述（DOTA/R2CNN/ROI Transformer/CAD-Net/SCRDet/Gliding Vertex）

Mask R-CNN论文学习记录

姿态估计论文思路整理 -- Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

论文阅读: R-CNN

R-CNN论文详解

论文阅读：R-CNN

R-CNN论文详解（论文翻译）

R-CNN论文精读（论文翻译）

Fast R-CNN & Faster R-CNN 论文阅读

THOR: A NEW AND FLEXIBLE GLOBAL CIRCULATION MODEL TO EXPLORE PLANETARY ATMOSPHRRES论文思路

2021华数杯C题优秀论文思路分析02

2021华数杯C题优秀论文思路分析01

论文阅读: Faster R-CNN

Mask R-CNN论文导读

论文阅读: Fast R-CNN

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)