设计应用

基于深度学习的鱼类识别与检测的算法研究

作者:王文成1,蒋 慧1,乔 倩1,祝捍皓2,郑 红2
发布日期:2020-12-17
来源:《信息技术与网络安全》2020年第8期



         海洋作为地球上最大的生态系统包含极其丰富的生物和非生物资源。虽然我国海洋面积有300多万平方千米,但是渔业资源作为海洋资源中重要的一项资源,近年来呈现逐渐衰退趋势。对周围海域内海底环境进行实时监测,分析研究海域中代表性鱼类的分布概况及生活习性,对于渔业资源可持续发展、探测未知生物资源有着重要意义。

         目标识别是计算机视觉领域重要的研究方向之一。随着科学技术的进步、计算硬件设备水平的提高,基于深度学习的目标识别检测方法受到了人们广泛关注。杜卫东等提出一种基于支持向量机(SVM)的多方位声散射数据决策融合的鱼类识别方法,识别准确率达到90%以上,姚润璐等通过分割鱼体,获得鱼肚、鱼背图像,通过提取纹理特征和形状特征,识别率达到75%,相较于传统的目标检测算法,基于卷积神经网络(CNN)的目标检测算法通过学习自动提取颜色、轮廓等底层的特征和更高级、抽象的特征,然后利用分类模型进行分类检测,其检测结果具有更高的精度和鲁棒性。林明旺等采用VGG16模型进行鱼类分类识别,但是数据集背景干扰强度大,虽然进行微调,稳定性仍然不好。王文成等用ResNet50网络模型对十种鱼类做了分类识别,准确率达到了93.33%,但是数据集数量有限,识别精度不高;张俊龙等提出在预处理过程中使用权重化卷积操作,对海洋鱼类识别准确率提升23%,在视频观测中精准识别鱼类;梁红等通过对图像进行水下降噪的方法,并且对预训练的网络微调参数,在海洋鱼类数据集上识别准确率达到85.08%。

         基于CNN的目标检测算法依据是否需要提取候选区域分为:基于有候选区域的目标检测算法和基于无候选区域的目标检测算法两种。区域卷积神经网络(R-CNN)、快速区域卷积神经网络(Fast R-CNN)、超快速区域卷积神经网络(Faster R-CNN),都属于代表性的基于候选区域的目标检测算法。该类算法从图像中事先提取一系列可能的对象候选区域,然后从这些候选区域中提取特征并进行判断分类。2019年,袁红春等人利用Faster R-CNN目标检测方法应用到水下鱼类种类识别中,识别准率达到98.12%。该类算法的检测准确率较高,但是处理速度较慢。无候选区域的目标检测算法的代表性算法有单级式目标检测(YOLO)、单点多盒检测器(SSD)及其改进的算法YOLO v2和深度监督对象检测器(DSOD)。此类算法去除候选区域提取过程,使用神经网络直接将一整张图片输入神经网络,然后预测出bounding box的坐标和物体的类别、置信度,检测物体速度较快。李庆忠等对YOLO实时目标检测算法进行了改进,采用迁移学习法训练网络,预处理中图像增强以及视频帧数检测速率上做了改变,该算法提升了对海底小目标检测的性能,但存在检测精度低、检测小目标会有遗漏等问题。SSD算法同时融合了proposal-free的提取和Faster R-CNNs算法的优点,与其他检测算法相比,即使输入图像尺寸小,SSD依然有更好的精度。DSOD是一种改进的SSD网络框架算法。相比于SSD目标检测算法,DSOD整个网络采用密集的短连接和通道拼接技术,使得DSOD 的模型参数更小,同时能直接在目标数据集上进行训练,而无需在ImageNet、COCO、PASCAL VOC等公开数据集上进行预训练。

         基于上述的分析,由于分类识别和检测任务在统计分布和损失函数的差异,存在学习上的偏差,为了解决这个问题,本文利用深度监督对象检测器(DSOD)方法对选定鱼类图像进行检测分类识别研究,该模型具有高效的目标检测网络,保持了处理速度,提升了对小目标的检测性能。



本文详细内容请下载http://www.chinaaet.com/resource/share/2000003248

作者信息:

王文成1,蒋  慧1,乔  倩1,祝捍皓2,郑  红2

(1.浙江海洋大学 船舶与机电工程学院,浙江 舟山316022;

2.浙江海洋大学 海洋科学与技术学院,浙江 舟山316022)


此内容为AET网站原创,未经授权禁止转载。
PyTorch框架 ResNet50网络 PyQt5可视化界面 DSOD目标检测器