符合业务目标的数据战略建设

数据智能体(二):数据仓库建模与分析

在企业数据仓库建设中,业务复杂、数据源多,使建模周期长且容易出错。需求常分散、模糊,团队需花大量时间梳理指标口径、字段定义和业务规则,同时还面临命名不统一、口径多版本、规则难落地的问题,模型复用性低,治理成本高。

DDM Dora 9.0 的建模智能体可整合现有标准和业务知识,辅助团队快速理解业务逻辑、规范字段与指标,实现高质量模型标准化。通过减少手动查找和重复工作,它缩短建模周期、提高模型复用率,并增强治理可控性,使复杂业务场景下的数据仓库建设更高效可靠

01需求分析

在数据仓库建设中,需求分析往往最耗时,也最容易出错。业务提出指标或分析需求时,开发人员需要反复确认来源系统、历史口径、计算逻辑和数据可靠性,传统模式下高度依赖经验、文档和口头传递。

智能探源:让数据“自己讲清楚来龙去脉”

在 Dora 9.0 中,建模智能体将智能探源作为需求分析起点。通过整合数据仓库模型、元数据与血缘、指标定义,以及历史设计文档、评审材料和制度文件等非结构化资料,构建可被智能体理解的知识库。

建模人员只需用自然语言描述分析目标,智能体即可:

  • 自动定位相关主题域与核心事实表

  • 识别并复用已有指标口径

  • 追溯指标源系统与加工路径

  • 提示潜在的数据质量或口径差异风险

数据仓库需求分析因此从“人工翻资料、找人确认”,转变为基于模型与知识的智能探源流程,大幅提高效率与准确性。

02数据建模

在模型设计过程中,建模人员无需频繁切换系统、查找文档或手工对照标准,只需基于具体使用场景,以自然语言描述建模意图,并可明确指定

  • 当前模型

  • 当前实体

  • 当前字段或指标

建模智能体将结合当前模型上下文,通过大模型的规划能力与工具执行能力,自动完成一系列复杂但高度规范化的工作:

  • 知识库与文件的语义检索

智能体从企业知识库中检索相关规则、口径与历史实践,理解业务语义后,辅助生成符合业务要求的实体与属性。

  • 标准优先引用机制

在创建字段时,智能体将优先匹配并引用企业已有的数据标准与代码。一旦确认引用,字段的命名、数据类型、精度与约束将自动继承标准定义,并直接写入模型。

  • 中英文命名自动转换

对已存在标准词汇,严格按照标准进行中英文映射;对于暂无标准覆盖的字段,大模型将基于语义进行合理翻译与命名建议。

整个过程无需人工反复查表、翻文档,建模人员只需聚焦于业务意图本身。

03SQL生成

在完成需求澄清与智能探源后,生成式 SQL 才真正落地。

在 Dora 9.0 中,SQL 生成严格基于已确认的数据仓库模型、选定的事实表与维度关系,以及引用的指标口径。建模人员只需描述加工或分析意图,智能体即可:

  • 根据事实与维度关系生成标准化 SQL

  • 自动继承指标口径中的计算逻辑与过滤条件

  • 遵循企业 SQL 规范与命名规则

  • 结合自动测试闭环验证 SQL 可执行性与口径一致性

生成的 SQL 不仅“能跑”,更语义清晰、口径可解释、可长期维护,为数据仓库的高质量交付提供保障。

04编排与调度

在模型与 SQL 定义完成后,平台可基于模型血缘与依赖关系,自动参与到数据加工流程的编排与调度中:

  • 明确数据对象之间的依赖关系

  • 支持标准化的数据加工与指标计算流程

  • 为后续的数据质量校验与运行监控提供基础

调度不再只是“跑任务”,而是对数据逻辑的持续执行与验证。

05价值体现

建模智能体在数据仓库全流程中发挥作用:

  • 建模环节:通过知识驱动和智能探源,快速梳理业务逻辑、标准化字段与指标,降低对经验丰富建模人员的依赖,让新手也能高效产出高质量模型。

  • 开发环节:生成式 SQL 自动继承指标口径、遵循企业规范,并结合自动测试闭环验证可执行性与口径一致性,大幅减少手动编码和重复工作。

  • 治理环节:统一口径、可追溯的模型和 SQL 使标准自然落地,增强模型复用性和数据资产可控性,提升整体数据治理水平。

通过覆盖建模、开发、治理全流程,建模智能体不仅降低团队门槛,还显著提高效率和可靠性,使数据仓库建设更可控、可持续。

共 1 页 1 条数据