转载自 http://blog.csdn.net/sparkexpert/article/details/70208572
图像分类识别目前已经得到了很大的飞跃,特别是15年微软提出的resnet已经超越人类,能够对图像中的物体进行更好的识别。
为了初步了解一下图像分类识别的过程,学习了一下大牛的主页,发现还是很有意思的。而且从imagenet的角度来说,这个经度还是可以接受的。
本实验主要参照了这个网页https://www.cs.toronto.edu/~frossard/post/vgg16/来进行。
VGG is a convolutional neural network modelproposed by K. Simonyan and A. Zisserman from the University of Oxford in thepaper “Very Deep Convolutional Networks for Large-Scale Image Recognition” . The model achieves 92.7% top-5 testaccuracy in ImageNet , which is adataset of over 14 million images belonging to 1000 classes.
vgg-16是一种深度卷积神经网络模型,16表示其深度,是alexnet后比较有代表性的深度模型之一,在图像分类等任务中取得了不错的效果。
为了更好地理解Vgg 16的原理,利用tensorflow进行了实践,发现利用预先训练好的模型,识别的速度非常之快。大约2秒钟就能出现结果。
(1) 实验一,对枪的检测实验
分类识别效果比例非常高,可以。
(2)小拼图的测试
检测效果也比较强,第一个出来就是。
(3)老虎的检测
对老虎的检测,也非常不错。
(4)多场景的检测
这里面居然把高山,教堂,城堡,山谷等都识别出来了,效果非常不错,虽然各种精度不高,但是类别是齐全的。