FSL学习笔记
最新论文&代码收集网站:网址连接
论文1:孪生网络 (Metric Based)
Siamese Neural Networks for One-shot Image Recognition
通过Siamese神经网络借助监督度量的方法学习图像表示,然后重用该网络的特征进行OneshowtLearning,而不需要任何再训练。
孪生网络由两个结构相同(参数也相同:权重绑定了)的网络组成,这两个网络接受不同的输入,并且这两个网络最后由一个能量函数(Energy fuction)汇合到一起。这个Energy Fuction用于计算两个特征图之间的距离。
使用加权的L1距离来进行特征向量之间的距离,并结合了sigmoid激活函数。(使用了交叉熵损失函数)
孪生网络的模型结构如图所示。 最后的卷积层中的单位被压平成一个矢量。
预测向量(prediction vector)的公式是:p =
其中,σ是sigmoi的函数,αj是对每个向量的第j维的权重进行调节(是可学习的参数)。
所定义的交叉熵损失函数如下所示:
当两张图片相同时y=1;当两张图片不同时y=0。
论文2 匹配网络 (Metric Based)
Matching Networks for One Shot Learning
比较高明的解读:链接
研究背景:
- 少样本数据经常存在,但是
- 数据增强和正则化方法能够避免过拟合,却不能让网络学习的很好
- 需要随机梯度下降多次,这是浪费时间的
研究贡献:
- 提出了一种匹配网络MN
- test and train conditions must match. (为了使得网络能够更快的适应新的模型算法,即 训练的时候就和测试一样都是一样的输入方式)
- 关键:经过训练后,匹配网络能够为未观察到的类产生合理的测试标签,而不需要对网络进行任何更改