设计应用

基于深度学习的可视化图表分类方法研究

作者:张明凯1,胡军国1,刘江南2,邓飞1,尹文杰1
发布日期:2024-05-27
来源:电子技术应用

引言

可视化图表作为一种直观的信息表现形式,往往被用于文献或报告中展示关键的数据,在现代媒介中使用十分广泛。但受限于当下的技术水平,这些图表信息很难被计算机检索,大量的数据埋没在浩如烟海的网络中。随着相关数据的增加,图表的自动化解析逐渐被重视起来。图表通过简单的图形帮助人类理解数据背后隐含的差异或趋势等信息,但对于计算机来讲,读取这些图形所代表的含义却十分困难。不同类型的图表具有不同的视觉形式,很难用一套固定的模式或方法解析出来,目前较为有效的方法是根据图表类型使用特定的数据解析方案[1]。因此,理解图表的首要工作是图表类型识别,可视化图表的分类研究对于图表理解和文档解析具有很大的意义。

图表分类技术作为图像分类技术的子分支,与计算机视觉技术的发展联系十分密切。表1对相关研究进行了总结。早期研究[2-5]多使用一些手工设计的过滤器来提取图表图像的特征,先将提取到的特征降维,再通过一些机器学习方法实现分类。这些研究大都需要手工构建特征,数据集也相对较小,模型的泛化性不高。随着计算机视觉领域深度学习模型的发展,基于卷积神经网络的分类模型被用在图表分类任务中,这些研究[6-14]的分类效果有了很大提升,数据集也得到很大程度上的扩充。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000005988


作者信息:

张明凯1,胡军国1,刘江南2,邓飞1,尹文杰1

(1.浙江农林大学 数学与计算机科学学院,浙江 杭州 311300;2.浙江农林大学 化学与材料工程学院,浙江 杭州 311300)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
图表分类 图表理解 卷积神经网络 SwinTransformer 模型集成