栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

ibm wkc-CP4D概念梳理

ibm wkc-CP4D概念梳理

第一阶段:提供业务就绪数据

1.数据类别:分类嵌套,包含子类别,用于管理组织各种数据治理的工件:业务术语、数据类、政策、治理规则等。

2.业务术语:可以理解为数据字典,定义了组织中使用的通用、标准化业务概念的定义,以便在整个企业中以统一且易于理解的方式描述数据。1>定义业务术语;2>业务术语遵循审批流程。

3.政策:保存政策法规和公司数据策略。规则可以与策略相关联。例如:可以将数据保护规则添加到策略中,以便可以实施保护敏感数据的策略。例如:1>银行金融机构数据治理指引;2>创建数据保护规则,动态隐藏隐私数据。

4.参考数据:记录和了解实体或概念的允许值,并进一步调整这些值以丰富、发展和识别术语表术语,策略或分类对象,或者作为对数据集成或数据质量分析的支持。例如:1>从csv文件导入参考数据;2>通过拖拽的方式定义csv文件中的数据分别对应目标数据列,包括代码、值和描述。

5.自定义数据类:支持使用不同的匹配方式来指定如何对数据进行分类。例如:1>数据类型详细信息;2>识别数据正则表达式;3>可选择多种不同的匹配方式,例如正则表达式;4>识别数据后升级。

6.数据分级:用于对信息资产进行分级,以便数据管理员或数据治理团队可以快速了解不同级别的数据在哪里。

第二阶段:数据监管

1.数据资产自动发现--数据自动分类、质量评估及自动分配业务术语

2.自动数据质量检验和打分,质量规则定义

自动业务术语分配-机器学习辅助

基于业务术语分配,数据类的自动业务规则建议自动化规则

自动发现-批量分析操作的快速方法,包括:

1)元数据导入;2)数据探查;3)数据质量分数;4)术语分配

3.数据质量工作台-定义数据质量规则以及检验数据质量

4.自动端到端的数据血缘分析

业务沿袭:业务人员关注的主要数据节点之间的流转关系视图

数据沿袭:技术人员关注的数据节点之间的详细流转过程视图

第三阶段:使用数据

1.搜索探索业务就绪数据目录,用户根据资产类型、资产来源、标签、名称、描述和字段名等资产信息来查询资产。

2.资产概览,资产名称、描述、(技术和业务)元数据、业务标签,级别

3.数据防护引擎实现动态数据保护,规则策略实施动态数据屏蔽。

4.数据轮廓分析和数据可视化

5.数据使用者可以自我优化数据

数据平台功能

场景一:随时随地管理数据-数据虚拟化

数据虚拟化将多个数据源连接到一个星座数据源或数据库的自平 衡集合中。

场景二:提供可信赖的数据-确保数据合规、提升数据质量。

场景三:实用性数据科学和AI-内置Cognos仪表板。

场景四:实用性数据科学和AI-实现企业商业智能。

数据资产管理目录解决数据领域

1.有什么?企业数据中总共有哪些数据

2.是什么?向企业各数据用户提供数据的唯一权威的解释

3.在哪里?数据是如何分布的,存储在什么位置

4.从哪来?对数据溯源,清晰定位问题发发生的数据源头

5.到哪儿去?分析变更数据对哪些下一业务造成影响

资产全貌:

1.采集频率

2.采集系统范围

3.采集结果统计

借助数据资产信息目录,可以解决数据‘有什么’的问题。

通过数据资产信息目录,浏览全行数据资产,包括基础标准、指标标准、外部数据、结构化数据与非结构化数据。

基础标准模块展现基础数据标准,支持数据标准的浏览与查看。

指标标准模块展现我行指标类数据标准,支持数据标准的浏览与查看。

外部数据模块展现数据的表结构和具体数据,结合权限配置可以支持用户查看。

源系统、数据平台模块分类展现系统、平台内部结构化数据表的情况,用户可以查看表的名称、位置、描述。

数据检索-搜索,可以查看相关的质量规则、数据字段、数据表信息。

选择字段后,可以看到所需数据库、数据表、创建时间、质量得分等内容。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/707135.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号