引言
相机标定对于计算机视觉应用,如视觉测量、三维重建、虚拟现实[1]等有着至关重要的作用。目前,相机标定方法主要有三类:基于标定物的标定方法[2-4]、基于主动视觉的标定方法[5-6]以及相机自标定方法[7-9]。基于标定物的方法通过捕捉具有已知几何特征的标定物图像来估计相机参数;基于主动视觉的方法通过控制相机或标定物的运动来获取图像数据,以提高标定精度;相机自标定方法则无需使用特定标定物,而是通过分析图像序列中的特征点来自动估计相机参数。在这三类标定方法中,基于标定物的标定方法由于其灵活性较强、鲁棒性较高、操作相对简单等优点,受到了广泛青睐。然而,这类方法的标定准确性十分依赖于标定板特征坐标的精确定位。以张氏标定法[10]为例,标定过程需要对棋盘格标定板中的棋盘角点进行精确定位,一旦角点检测出现偏差,或者遇到图像模糊、畸变等情况,都会导致最终标定参数的不准确。因此,探索一种高精度且适应性强的角点检测方法是提高棋标定精度的一个关键问题。
传统角点检测算法大致可分为两类:基于灰度的方法和基于几何特征的方法。基于灰度的方法主要利用角点附近的灰度信息进行角点的检测,典型算法包括Harris角点检测[11]和Shi-Tomasi[12]角点检测。这种方法简单高效,但可能对图像噪声较为敏感,且在边缘和角点的区分上存在一定的局限性。基于几何特征的方法通过检测边缘的交点或者特定的几何形状(如圆、直线等)来确定角点,这种方法通常能够提供更准确的角点位置,尤其是在复杂场景中,但它们可能需要更多的计算资源,并且对图像预处理的要求较高。
随着深度学习的发展,基于学习的角点检测方法逐渐兴起。这类方法通过大量的数据训练模型,让模型自动学习角点的特征。基于卷积神经网络(Convolutional Neural Network , CNN)的角点检测利用CNN强大的特征提取能力,对图像进行多层卷积和池化操作,提取图像的高层语义特征。例如,CornerNet[13]将角点检测问题转化为目标检测问题,使用沙漏网络结构来预测角点的位置和类别。这种方法在复杂场景下的角点检测中表现出较高的准确率和鲁棒性,但模型训练需要大量的标注数据,且计算量较大。考虑到图像中角点之间的上下文关系,一些研究采用神经网络结合其他技术来进行角点检测。例如,NF-ECD[14]检测器将神经网络检测鲁棒特征点的能力与模糊逻辑相结合,通过模糊逻辑系统,依据关键角点参数对边角进行筛选,仅保留在匹配过程中作用大的显著角点。这种方法在提取关键点方面具有出色的鲁棒性和显著性,但在实际应用中,可能面临着模型复杂度、参数调优等挑战。
针对以上问题,本文提出双交叉注意亚像素棋盘角点检测方法。首先,基于U-Net卷积神经网络架构设计一个端到端的角点热图网络,该网络能够在不需要图像先验信息的条件下为每个棋盘角点生成标准高斯分布,在网络的上采样和下采样跳跃连接部分引入双交叉注意模块(Dual Cross-Attention, DCA),通过在特征提取过程中依次捕捉多尺度特征之间的通道和空间依赖关系,从而缩小上采样与下采样特征之间的语义差距。此外,本文提出以棋盘角点数量作为监督,将连续热图匹配损失与独特的分数损失相结合,该方法能够在保证细粒度空间学习能力的同时,实现角点预测的稀疏性和准确性。为了验证所提出的亚像素角点检测方法的有效性,本文将设计的角点检测模型应用于CCS相机标定系统,经过实验验证,该方法一定程度上提升了角点检测精度,为相机标定任务提供了更加精确的角点坐标。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006412
作者信息:
陈泽勇1,吴丽君1,李乙2
(1.福州大学物理与信息工程学院,福建福州350108;
2.福州大学先进制造学院,福建福州350108)