设计应用

基于改进VGG16的猴子图像分类方法

作者:田佳鹭,邓立国
发布日期:2020-12-14
来源:《信息技术与网络安全》2020年第5期

随着深度学习技术的不断进步,对于通用对象的类别分析,卷积神经网络已经达到了很高的水平,但对于细粒度图像分类的稳定性目前还有待提升。所谓细粒度图像分类,通常用于描述对同一类事物进行细致的划分,所以待分类图像的区别要更加精准,类内区别大而类间区别小,粒度则更为精细。本文方法基于改进的VGG16深度卷积神经网络。尽管原始的VGG16模型已经拥有了良好的普适性和实用价值,并且在各种图像分类和目标检测任务中都体现了极佳的效果,通过迁移学习改进的VGG16模型,能够将已习得的特征和性能应用到待解决的问题中,极大地节省了训练时间。此外在硬件上选取GPU进行训练,使得速度得到进一步提升。为了改善原始的交叉熵损失函数无法保证提取的特征具有识别度的缺点,在VGG16模型中引入将center loss损失函数与交叉熵损失函数相结合的办法。此外还运用了新型的Swish激活函数,以及拥有自适应学习率的Adam优化器。最后利用不同种类的猴子训练集对改进的模型重新训练,以获得少量微调的参数信息。经验证该方法对猴子图像识别的精准度可提升到98.875%,而原始的VGG16模型在该数据集上的分类仅能达到90.210%的准确率,可以证明改进后的模型具有更好的识别效果。




本文详细内容请下载http://www.chinaaet.com/resource/share/2000003088


作者信息:田佳鹭,邓立国(沈阳师范大学 数学与系统科学学院,辽宁 沈阳 110034)


此内容为AET网站原创,未经授权禁止转载。
迁移学习 VGG16 卷积神经网络 图像分类 TFRecord