设计应用

数据血缘关系构建方法综述

作者:吕琳1,田庆业2,焦冬冬1,郭金磊1,房志奇1,陈瑞1
发布日期:2025-12-23
来源:网络安全与数据治理

引言

在当今数据驱动的时代,数据已成为企业核心资产之一[1]。随着数据规模的指数级增长,如何管理和利用数据成为挑战[2]。数据血缘(Data Lineage)作为数据治理的核心组成部分,旨在通过追踪数据从采集、加工、存储到消费的全生命周期路径,揭示数据的演化关系与依赖链条,优化资源配置,从而提高公司的决策水平。 近年来,学术界形成了多种数据血缘构建方法。然而,不同方法在自动化程度、粒度等方面仍存在显著差异。本文梳理了目前构建数据血缘关系的方法,对比分析其优缺点和应用场景,并探讨未来研究方向,为数据血缘关系的应用及后续研究提供参考。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006893


作者信息:

吕琳1,田庆业2,焦冬冬1,郭金磊1,房志奇1,陈瑞1

(1.华北计算机系统工程研究所,北京100083;

2.中电智能科技有限公司,北京102200)


官方订阅.jpg

此内容为AET网站原创,未经授权禁止转载。
数据血缘 元数据 数据治理 大数据