设计应用

面向机器学习建模的数据治理技术路径研究

作者:李彦泽1,郭超2,孙旭明2,母东杰2
发布日期:2025-04-01
来源:网络安全与数据治理

引言

当前,人工智能(AI)和机器学习(ML)已广泛应用于语音技术、医疗研发、自动驾驶等多个日常生活领域。AI的核心构成是算法、数据和基础设施三者的有机结合[1]。单纯依靠算法优化和硬件性能提升不足以推动AI的发展,更需高质量数据集的支撑。关于如何优化数据处理和治理过程,大部分研究集中于标注质量的提升、数据集的构建及优化、模型评估等方面,缺乏系统化的技术路径和全面的解决方案。尤其是在面对不同类型的机器学习模型(如监督学习、无监督学习、强化学习等)时,如何提升数据质量和模型的稳定性、可解释性以及公平性,仍然是一个亟待解决的问题。

本文综合现有研究成果,提出了一套系统性的数据治理框架,结合机器学习建模需求,从数据采集、处理、标注到模型训练的全过程中提供可操作的治理方案,推动数据治理在机器学习应用中的深入实施。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006380


作者信息:

李彦泽1,郭超2,孙旭明2,母东杰2

(1.北京百分点科技集团股份有限公司,北京100096;

2.中国电子产业工程有限公司,北京100036)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
数据治理 机器学习 人工智能 系统框架 数据管理