Skip to content

数据血缘

OpenDataWorks 基于任务的输入输出关系自动构建数据血缘图谱,帮助理解数据流转路径和影响范围。

血缘生成

血缘关系通过以下方式自动生成:

  1. 任务输入输出 — 每个任务声明其读取的源表和写入的目标表
  2. 自动关联 — 系统根据输入输出关系自动建立表间血缘
  3. 链路追踪 — 支持从任意节点向上游或下游追踪完整链路

可视化

血缘图使用 ECharts 力导向图展示:

  • 节点代表数据表,颜色区分数据层级
  • 边代表数据流向
  • 支持拖拽、缩放、平移
  • 点击节点查看表详情

筛选能力

  • 按层级筛选 — 只显示特定层级(ODS/DWD/DWS/ADS)的节点
  • 按数据域筛选 — 只显示特定业务域的血缘关系
  • 深度控制 — 限制上下游追踪的层数

使用场景

影响分析

当需要修改某张源表时,通过下游血缘快速了解哪些表和任务会受到影响。

数据溯源

当发现数据异常时,通过上游血缘追踪数据来源,定位问题环节。

治理评估

通过血缘覆盖率评估数据资产的治理程度,发现孤立表和断裂链路。

基于 GPL-3.0 许可发布