数据血缘
OpenDataWorks 基于任务的输入输出关系自动构建数据血缘图谱,帮助理解数据流转路径和影响范围。
血缘生成
血缘关系通过以下方式自动生成:
- 任务输入输出 — 每个任务声明其读取的源表和写入的目标表
- 自动关联 — 系统根据输入输出关系自动建立表间血缘
- 链路追踪 — 支持从任意节点向上游或下游追踪完整链路
可视化
血缘图使用 ECharts 力导向图展示:
- 节点代表数据表,颜色区分数据层级
- 边代表数据流向
- 支持拖拽、缩放、平移
- 点击节点查看表详情
筛选能力
- 按层级筛选 — 只显示特定层级(ODS/DWD/DWS/ADS)的节点
- 按数据域筛选 — 只显示特定业务域的血缘关系
- 深度控制 — 限制上下游追踪的层数
使用场景
影响分析
当需要修改某张源表时,通过下游血缘快速了解哪些表和任务会受到影响。
数据溯源
当发现数据异常时,通过上游血缘追踪数据来源,定位问题环节。
治理评估
通过血缘覆盖率评估数据资产的治理程度,发现孤立表和断裂链路。