Inserting Videos into Videos_论文阅读 - 代码天地

Inserting Videos into Videos_论文阅读

其他 2020-01-17 21:38:47 阅读次数: 0

CVPR 2019

原文链接：https://arxiv.org/pdf/1903.06571v1.pdf

摘要

主要任务：将对象视频插入场景视频中的指定位置，使新得到的视频看起来真实。
亮点：不使用复杂的标注，处理不同的对象运动和复杂的背景。
方法：合成假数据对。

简述

遇到的挑战：在没有任何监督的情况下，需要处理不同背景，遮挡，光照条件和物体尺寸等挑战性问题。例如，过分依赖于对象分割方法的算法的性能，该算法通常无法在复杂场景中准确地裁剪前景对象。
解决方法：首先解决图像域中的相关问题，即如何将给定的对象图像插入到来自不同视频的其他帧中。为了缓解不成对数据的问题，提出合成可以为对象插入提供监控信号的伪数据。
　　通过混合来自每个视频的对象图像和随机背景补丁来生成伪数据。然后，网络学习如何从混合数据重建对象。由于重建误差提供了强有力的监督信号，这种方法利用不成对的真实数据促进了生成对抗框架的学习过程。在推理期间，将新对象混合到场景视频的目标位置，然后馈送到训练的网络。
　　使用去噪自动编码器的想法：在合成当前帧之前将随机噪声注入到先前的帧中。从而降低帧崩溃。它迫使网络学习先前帧和当前输入之间的语义，而不是盲目地复制和粘贴来自先前帧的大部分信息。

主要贡献

1）从图像到视频的对象插入领域。
2）提出了一种新颖的方法来合成有监督的假训练对，它可以帮助深层神经网络学习插入没有监督真实对的对象。
3）开发了一个新的条件GAN模型，以促进无人监督的真实和有监督的假训练对的联合训练。
4）证明了所提出的算法可以基于具有挑战性的真实世界输入视频来合成逼真的视频。

相关工作

图像插入

视频合成

算法

释然强

发布了5 篇原创文章 · 获赞 7 · 访问量 1236

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42640840/article/details/88886366

Inserting Videos into Videos_论文阅读

Atlassian Videos

论文笔记-Tracking Emerges by Colorizing Videos

论文解读：Temporal Relational Reasoning in Videos

Unbiased Scene Graph Generation in Videos论文讲解

HTML 视频(Videos)

Download Youtube videos for linux

IBM Technology Videos

Download Youtube Videos

Caltech Mechine Learning Videos

Videos Understanding Dataset

TruNet: Short Videos Generation from Long Videos via Story-Preserving Truncation（论文翻译）

【论文阅读记录】Unsupervised Hard Example Mining from Videos for Improved Object Detection

论文阅读笔记二十二：Learning to Segment Instances in Videos with Spatial Propagation Network（CVPR-20017）

【论文阅读笔记】UniPose: Unified Human Pose Estimation in Single Images and Videos

【论文阅读】Non-volume preserving-based fusion to group-level emotion recognition on crowd videos

论文阅读：Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos

[videos系列]日本的videos视频让男人产生了哪些误解?

Dense-Captioning Events in Videos

O'reilly Security Conference Videos

HDU 6437 Videos（费用流）

Get Watched Videos by Your Friends

Enhancing Quality for HEVC Compressed Videos

论文翻译：Learning Action Recognition Model From Depth and Skeleton Videos

论文笔记：Learning Video Object Segmentation from Unlabeled Videos

TruNet: Short Videos Generation from Long Videos via Story-Preserving Truncation ICCV.2019阅读总结

How to download videolectures.net videos with VLC

hdu 6437 Videos 最大费用流

hdu6437 Videos 费用流

AVFoundation Tutorial: Adding Overlays and Animations to Videos

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)