March 11-CVPR 2019 paper reading PFLD: A Practical Facial Landmark Detector

PFLD: A Practical Facial Landmark Detector

最重要的是,本文中关于loss function的处理,提出了一种方法。
在这里插入图片描述


这是本文中比较重要的一个点,loss function,另一个重要的点,是本文中,mobilenet的使用。
在这里插入图片描述
这是本文的模型,mobilenet block的使用,减少模型的大小,减少内存的占用。

https://blog.csdn.net/huachao1001/article/details/79171447

这个博客是关于mobilenet 的介绍。

mobileNet 是在做卷积的时候,和一般的CNN的kernel处理不一样。

一般的CNN model kernel 卷积的时候,通道channel也要考虑到,所以导致那个kernel的参数很多,eg, 3 × 3 × 4 3\times3\times4 , 如果output有要求第三维是2,那么就要做两次这样子size的不同kernel的处理。

但是MobileNet中,它做卷积的时候,不再有那个第三维channel的同时处理,一开始就是2维的 $3\times3$ 的处理卷积,之后再用新的kernel 对卷积之后的那么多channel的结果处理,处理之后再做summation,如果最后要求的结果是第三维是2, 那么再重新找2组 那么多channel的1*1的kernel进行处理。像链接中举的例子那样的处理。

that’ s all.

猜你喜欢

转载自blog.csdn.net/weixin_39434589/article/details/88398860