基于双重金字塔网络的视频目标分割方法学习笔记 - 代码天地

基于双重金字塔网络的视频目标分割方法学习笔记

其他 2019-09-15 00:25:56 阅读次数: 0

关键词

运用机器学习方法进行标签传播

之前提出的算法

1.用于时空密集滤波的时间双边网络。

2.只通过静态图像训练一个深度网络来细化前一帧掩码，并且在测试中使用测试视频的第一帧来记忆目标

的外观（即在线微调），从而提升了性能。

3.通过大量数据增强策略来实现更高的分割精度。

金字塔卷积方法最大的好处是不用微调

下图是基本思路

分割网络是基于 VGG16

[16] 的全卷积网络，且在除了

VGG16 的前四层外的所有卷积层中添加调制操作，具体的调

制过程和参数如下介绍。

视觉调制器用于使分割网络适应给定目标的外观，其从

给定注释帧中提取语义信息，例如，类别、颜色、形状和纹

理，并且生成对应通道的尺度参数以调整特征图中不同通道

的权重，从而在分割网络中重新定位给定目标的位置[14] 。本

文使用 VGG16 神经网络作为视觉调制器模型将第一帧图片

围绕目标裁剪为 224×224 像素大小作为输入，并且修改最后

一层用于分类的层，以匹配分割网络调制层中的参数数目。

所有视觉调制参数都与特征图相乘，具体表达式如式（1）所

示。

空间调制器生成像素级偏移参数，目的是为了在目标对

象的位置上提供粗略的先验信息。本文先在前一帧的预测掩码上生成二维热图，从而获

得目标位置的粗略估计，再将其作为空间调制器的输入。为

了匹配分割网络中的不同特征图的分辨率，空间调制器将二

维热图下采样为不同的尺度，进而获得对应于每个卷积层的

空间位移参数，空间调制参数与相应层的特征图相加

现在看来这篇文章的方法是基于vgg16的方法，每次有两个矩阵，分别代表了视觉参数，和偏移参数

然后根据式子

确定之后的Fcn，之后利用全卷积神经网络

关于本片论文的定性结果

2.5 定性结果

在图 3 中，本文展示了所提出的方法在部分遮挡（如图

3(a)）、杂乱背景（如图 3(b)）、运动模糊（如图 3(c)）以及

在 kite-surf 序列（如图 3(d)）上测试的效果图。部分遮挡的

情况下只需要分割未被遮挡目标部分，杂乱背景的情况下需

要将目标与背景中相似目标分离，运动模糊的情况下需要对

模糊的目标部位进行更加细致的分割。本文算法在以上情况

下都能准确地分割出给定目标，尤其在 kite-surf 序列中，可

以较为准确地分割出图中的小目标。从图 3(d)中可以看到小

目标的分割图与真实标签仍存在一些差距，如何更加充分地

利用局部信息（比如感兴趣区域中的一些关键特征点）和全

局信息（比如感兴趣区域中的类别、颜色和纹理等语义信息）

将是接下来的研究方向之一。

猜你喜欢

转载自www.cnblogs.com/coolwx/p/11517306.html

基于双重金字塔网络的视频目标分割方法学习笔记

《用于图像语义分割的金字塔注意力网络》论文笔记

目标检测学习--FPN(特征金字塔网络)-解决多尺度检测问题

OpenCV学习笔记-图像金字塔

opencv学习笔记--图像金字塔

学习金字塔

《金字塔原理》笔记

话说“学习金字塔”

对学习金字塔的认知

对“学习金字塔”的了解

python金字塔学习

opencv学习笔记十：图像金字塔

opencv学习笔记(七)---图像金字塔

Python + OpenCV 学习笔记（十）>>> 图像金字塔

OPENCV学习笔记之图像金字塔

Opencv-Python学习笔记（八）：图像金字塔

opencv 学习笔记（十三）图像金字塔

【OpenCV 学习笔记】第十一章: 图像金字塔

OpenCV-python学习笔记（十一）——图像金字塔

深度学习（十九）基于空间金字塔池化的卷积神经网络物体检测

基于卷积自编码器和图像高斯金字塔的布料缺陷无监督学习与检测方法

从学习金字塔思考如何学习

金字塔池化笔记

Opencv笔记（十五）——图像金字塔

《金字塔原理》读书笔记

阅读金字塔原理笔记1

opencv笔记—图像金字塔

OpenCV4学习笔记（18）——图像金字塔及拉普拉斯金字塔

OpenCV学习笔记之十——图像金字塔（高斯金字塔，拉普拉斯金字塔、图片尺寸缩放）

我理解的学习金字塔

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

事务隔离级及脏读、幻读和不可重复读

rtos：zephyr同步信号量

把对象转换为JSON格式的数据

iOS Dev (56) iTunes Store 销售日报更新时间

Failed to start mongod.service: Unit not found;mongodb in unbuntu

Upgrading PHP on CentOS 6.5 (Final)

（四）王道机试指南___排版问题

TensorFlow之手写体识别

xcode xib报错 Safe Area Layout Guide Before IOS 9.0

【LeetCode】76. Minimum Window Substring（C++）

每日归档

更多

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)