行人重识别-姿态检测

行人重识别-姿态检测前言从抽取图像特征进行分类, 行人重识别的方法可以分为基于全局特征 (Global feature) 和基于局部特征 (Local feature) 的方法. 全局特征比较简单,是指让网络对整幅图像提取一个特征, 这个特征不考虑一些局部信息. 正常的卷积网络提取的都是全局特征。然而, 随着行人数据集越来越复杂, 仅仅使用全局特征并不能达到性能要求, 因此提取更加复杂的局部特征成为一个研究热点.局部特征是指让手动或者自动地让网络去关注关键的局部区域, 然后提取这些区域的局部特征.
分类: 其他 发布时间: 03-31 09:43 阅读次数: 0

行人重识别-视频重识别

行人重识别–Video ReID前言目前主流的行人重识别方法大部分是基于单帧 图像的, 然而单帧图像给予的信息终究是有限的. 此外, 单帧的方法要求图像质量很高, 这对于相机 的布置和使用的场景是一个非常大的限制, 因此研究基于序列的方法便显得十分重要。介绍. 基于单帧图像 的 ReID 方法可以通过一个简单方法扩展到视频序 列, 即用所有序列图像特征向量的平均池化或者最 大池化作为该序列的最终特征. 但是仍然有很多工作在研究如何更好地利用视频序列来进行行人重识别。这类方法除了考虑了图像的内容信
分类: 其他 发布时间: 03-31 09:43 阅读次数: 0

【论文笔记】对抗生成网络在行人重识别的应用

Person Transfer GAN to Bridge Domain Gap for Person Re-IdentificationPerson Transfer GAN to Bridge Domain Gap for Person Re-Identification摘要虽然行人再识别(ReID)的性能已经得到了显著的提高,但在真实场景中的许多挑战性的问题还没有得到充分的研究。例如,复杂的场景和灯光变化,视点和姿态的变化,以及摄像机网络中大量的身份。为了促进对征服这些问题的研究,文章贡献了一
分类: 其他 发布时间: 03-31 09:43 阅读次数: 0

【论文笔记】ASTPN注意力空间池化网络

Jointly Attentive Spatial-Temporal Pooling Networks for Video-based Person Re-IdentificationJointly Attentive Spatial-Temporal Pooling Networks for Video-basedPerson Re-Identification摘要人的再识别(Person re-id)在视觉监控和人机交互方面的应用是一个非常重要的课题。在这项工作中,我们提出一个新颖的空间和时间关
分类: 其他 发布时间: 03-31 09:43 阅读次数: 0

【论文笔记】JAFN

Joint Attentive Spatial-Temporal Feature Aggregation for Video-Based Person Re-IdentificationJoint Attentive Spatial-Temporal Feature Aggregation for Video-Based Person Re-Identification摘要本文提出了一种基于视频的人脸识别的联合关注时空特征聚合网络(JAFN),同时学习质量感知模型和帧感知模型,获得基于注意的时空特征聚
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

[论文笔记]AlignedReID

AlignedReID: Surpassing Human-Level Performance in Person Re-IdentificationAlignedReID: Surpassing Human-Level Performance in Person Re-Identification前言开题结束了,又要开始肝论文的日子,这次要整理的是旷视2017年的一篇文章AlignedReID,为了防止自己忘记,这次会把代码部分也一起整理出来。这篇文章的创新点主要是利用了行人的局部区域之间的联系实现
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

从零开始AlignedReID_01

数据准备前言从这边博客开始, 就要记录一下复现AlignReID算法的代码,以及在复现过程中遇到的一些问题,作为后续自己实现模型的基础,阅读和理解别人的代码是非常有必要的。并且,在实现代码的过程,会尽量使得代码工程化。那么接下来,就开始吧!认识Market1501数据集在对行人重识别领域有过一定了解的情况下,应该都知道这个数据集了,这次我们就以该数据集进行训练和测试。...
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

从零开始AlignedReID_02

模型设计前言在前面已经提到了主要使用的CNN网络是ResNet50网络,那么我们需要在系统提供的库的基础上进行一定的修改,来实现整体的网络结构。1.主体结构实现
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

从零开始AlignedReID_03

loss模块实现前言前面两篇博客我们已经把数据的导入以及网络的主体实现了,那么这篇博客主要是为了实现网络的损失。还是上面这张图,我们可以看到,网络主要使用了两个损失函数,即softmax loss以及triplet loss。那么这篇博客主要包括以下几个部分:softmax cross entropy losslocal distanceTriplet lossdeepsupervision1.global feature的softmax loss这里的softmax loss其实是指
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

从零开始AlignedReID_05

损失计算前言深度学习需要根据损失来调整网络参数,本篇主要对于AlignedReID中的losses以及计算losses所需要的distance进行整理。
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

从零开始AlignedReID_04

模型评价指标前言在介绍行人重识别的时候就提到过,常用的评价指标有mAP、cmc、rerank等,那么这篇博客,主要是对这一部分的复现。
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

【论文笔记】Revisting Temporal Modeling for Video-based Person ReID

前言
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

Video-based-ReID_TP

前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:temporal pooling。这是比较简单的一种方式,效果也不错,是将通过CNN网络提取到的每一帧T图像特征根据seq_len,使用average pooling融合成每一个clips的特征。模型输入imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c为通道数为3,h图片高,w图片宽模型初始化参数
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

Video_based_ReID_TA

前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:temporal attention。在这个模型中对sequence of image feature使用attention weighted average,给每一个切片c一个attention系数。论文中叙述这是效果最好的一种方式,如C部分:模型输入imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

Video_based_ReID_RNN

前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:RNN。这是在序列模型训练中常用的一种模型,RNN可以提取到连续图像蕴含的信息,这里使用的是最简单的RNN结构。目前这种方式的试验结果不如其他几种,如B部分:模型输入输入和之前的相同 差别只在经过的网络:imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c为通道数为3,h图片高,w图片宽模型初始
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

[论文笔记]MGH

Learning Multi-Granular Hypergraphs for Video-Based Person Re-Identification论文链接代码链接Abstract新的基于图的框架 Multi-Granular Hypergraph (MGH)通过在多个粒度方面对时空依赖性进行建模来追求更好的表示能力使用各种级别的part-based特征来构建不同粒度的Hypergraph...
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

感受算法与程序之美

前言写在最开始,之所以整理这个专栏的目的,一方面是为了接下来的实习、秋招、春招做准备,另一方面也为了能够帮自己梳理算法的思路。因为断断续续的也刷了不少的题目,但是却都是硬解,没有一个明确地解题技巧,遇到困难题直接CV,这明显不行。这篇博客呢就作为一个总章,来整理各类型题目吧~与君共勉,希望看到博客的人都能拿到sp。贪心算法贪心算法说白了就是每次寻找局部最优解的过程,已达到最终结果是全局最优的目的。贪心算法一般按如下步骤进行:①建立数学模型来描述问题②把求解的问题分成若干个子问题③对每个子问题
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

455. Assign Cookies[easy]

455. Assign Cookies -分配问题问题描述假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。对每个孩子 i,都有一个胃口值 g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j,都有一个尺寸 s[j] 。如果 s[j] >= g[i],我们可以将这个饼干 j 分配给孩子 i ,这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子,并输出这个最大数值。示例 1:输入: g = [1,2,3], s = [1,1]输出: 1
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

135. Candy[hard]

135. Candy-分配问题问题描述老师想给孩子们分发糖果,有 N 个孩子站成了一条直线,老师会根据每个孩子的表现,预先给他们评分。你需要按照以下要求,帮助老师给这些孩子分发糖果:每个孩子至少分配到 1 个糖果。评分更高的孩子必须比他两侧的邻位孩子获得更多的糖果。那么这样下来,老师至少需要准备多少颗糖果呢?示例 1:输入:[1,0,2]输出:5解释:你可以分别给这三个孩子分发 2、1、2 颗糖果。示例 2:输入:[1,2,2]输出:4解释:你可以分别给这三个孩子分发 1、2
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0

435. Non-overlapping Intervals[medium]

435. Non-overlapping Intervals -区间问题题目描述给定一个区间的集合,找到需要移除区间的最小数量,使剩余区间互不重叠。注意:可以认为区间的终点总是大于它的起点。区间 [1,2] 和 [2,3] 的边界相互“接触”,但没有相互重叠。示例 1:输入: [ [1,2], [2,3], [3,4], [1,3] ]输出: 1解释: 移除 [1,3] 后,剩下的区间没有重叠。示例 2:输入: [ [1,2], [1,2], [1,2] ]输出: 2解
分类: 其他 发布时间: 03-31 09:42 阅读次数: 0