新闻资讯

数据治理将能否为数字化转型提供支撑?

在数字化转型过程中,数据治理提供基础性支撑,本文重点阐述数据治理对于数据湖、人工智能等数字化转型两个关键建设场景的支撑作用。

数据治理

1、数据治理是数据湖避免成为“数据沼泽”的关键

数据湖(Data Lake)是数据集合而并非数据平台,在这一数据集合基础之上,采用Hadoop大数据技术生态体系以构建大数据平台,实现对多源异构数据的统一汇聚,并采用典型的数据驱动型设计模式 — ELT架构模式,大规模捕获各种新旧类型的多源异构原始数据,并按需进行数据转换,形成多样化应用。

但是,数据湖的完美理念却面临着诸多问题,当越来越多的多源异构数据接入数据湖中,如果缺少有效的方法跟踪这些多源异构数据并对低质量数据进行有效治理,则企业花费巨资构建的数据湖极有可能成为“数据沼泽”,数据无法访问、难以检索,成为只进不出的 “数据黑洞”。


2、数据治理是人工智能的基石
人工智能分为基础资源支撑、人工智能技术和人工智能应用三个层面:基础资源支撑层主要解决“算力”和数据“底座”问题;人工智能技术实现主要分为感知智能和认知智能两个阶段,在感知智能阶段,主要通过传感器、探测仪等获取视频、语音、图像等数据资源,基于感知器获取的数据资源、结合深度学习算法训练出感知模型,如人脸识别技术;在认知智能阶段,主要通过自然语言处理NPL、知识图谱等技术,挖掘出数据所隐含的关联关系、业务逻辑、规律等认知知识,为人工智能应用场景奠定知识基础。人工智能应用场景是以AI应用需求为驱动、选择适当的AI技术进行落地实现,通过满足应用需求直接产生业务价值。

推荐阅读 查看更多