软考找老孙
软考找老孙guoruankao.com
付费第24讲 / 共165讲

【2026年版】第19讲:数据资源规划(中)——数据架构与标准化

更新于首发

主讲:老孙

适用:2026年下半年系统规划与管理师考试

预计阅读时间:45分钟

一、上节回顾

上一讲讲了数据资产、生命周期、形态、政策背景。

三件大事:

第一,数据三重身份:成本 → 资源 → 资产

第二,数据生命周期 7 阶段:产生→采集→传输→存储→加工→应用→归档销毁

第三,数据二十条四支柱:产权 / 流通 / 收益 / 安全

1.1 上一讲思考题点评

我看到一份精彩的"数据资产盘点"作业,来自一位制造业 CIO:

"用您的'四步法'盘点我们工厂,发现 80% 的设备数据从未被使用——这是巨大的数据浪费。重新规划后预计每年带来 300 万 的精益管理收益。"

这就是数据规划的真实价值——把"沉睡数据"变为"活资产"。

二、本讲导读

2.1 学习目标

学完这一讲,你应该能够:

  1. 【是什么】 准确说出数据架构的四大要素;说出数据建模的三层(概念/逻辑/物理);说出数据标准化的核心内容。
  2. 【为什么】 理解为什么"标准化"是数据治理的基础。
  3. 【怎么用】 能为清华园物业设计完整的数据架构与标准。

2.2 本讲在课程地图中的位置

本讲对标教材 第8章 数据规划中段,是数据规划的"工程化深化"。

【虚构案例提示】 本讲涉及"智慧邻里2.0项目""清华园物业""北京知知致用信息技术有限公司"均为培训教学所用的虚拟项目与虚构人物(详见第01讲首次案例声明)。

三、数据架构的"四大要素"

3.1 数据架构是什么

教材定义:

数据架构(Data Architecture)是组织数据资产的整体设计,包括数据资产清单、数据模型、数据流转、数据标准与治理。

3.2 数据架构的四大要素

数据架构四大要素

要素一:数据资产清单

  • 组织所有数据按类分类
  • 含主数据、业务数据、元数据
  • 含字段、负责人、敏感度

要素二:数据模型

  • 概念模型(业务视角)
  • 逻辑模型(数据库视角)
  • 物理模型(实施视角)

要素三:数据流图(DFD)

  • 数据从产生到消亡的全流转
  • 含数据接口、数据共享、数据集成

要素四:数据标准与治理

  • 数据格式标准
  • 命名规则
  • 质量规则
  • 主数据管理

3.3 数据架构与企业架构的关系

数据架构是 TOGAF 四大架构 之一(BDAT 的 D):

  • 业务架构:业务做什么
  • 数据架构:业务需要什么数据
  • 应用架构:处理数据的应用
  • 技术架构:支撑应用的技术

数据架构在四大架构中"承上启下" ——既支撑业务又被应用消费。

四、数据建模的"三层"

4.1 三层模型的关系

数据建模三层

第一层:概念模型(Conceptual Data Model)

  • 视角:业务视角
  • 受众:业务人员、决策者
  • 内容:实体、关系、属性
  • 工具:ER 图

第二层:逻辑模型(Logical Data Model)

  • 视角:数据库视角
  • 受众:数据架构师
  • 内容:表、字段、关系、约束
  • 工具:UML 类图、ERD

第三层:物理模型(Physical Data Model)

  • 视角:实施视角
  • 受众:DBA、开发
  • 内容:实际表结构、索引、分区
  • 工具:DDL 脚本

自上而下的关系

概念模型 → 逻辑模型 → 物理模型

4.2 案例锚点:清华园物业的业主数据建模

概念模型

业主、房产、缴费、报修等实体的关系

逻辑模型

业主表(业主ID/姓名/电话/身份证)、房产表(房产ID/楼栋/房号/面积)、缴费表(缴费ID/业主ID/金额/时间)

物理模型

MySQL 8.0 实现,业主表分库分表(按楼栋分),缴费表按月分区

三层一致 = 业务、架构、实施对齐

五、数据标准化

5.1 数据标准化的"5 大维度"

数据标准化五大维度

维度一:命名标准

  • 表名、字段名规则
  • 例:业主表 = t_owner,业主ID = owner_id

维度二:格式标准

  • 日期格式、电话格式、金额精度
  • 例:所有日期 YYYY-MM-DD

维度三:编码标准

  • 行业编码、自定义编码
  • 例:身份证按 GB11643、地址按 GB/T 2260

维度四:值域标准

  • 字典值、枚举值
  • 例:性别 = 男/女/未知

维度五:质量标准

  • 完整性、准确性、一致性、及时性
  • 例:身份证号必须 18 位且符合校验

5.2 数据标准化的"国家标准对接"

中国数据标准体系:

  • GB/T 35295-2017 信息技术 大数据 术语
  • GB/T 38673-2020 信息技术 大数据 数据分类指南
  • GB/T 41014-2021 信息技术 大数据 系统平台技术参考
  • GB/T 36073-2018 数据管理能力成熟度评估模型(DCMM)

DCMM 是 2024 年新增重点考点——必背!

5.3 DCMM 数据管理能力成熟度

DCMM 五个等级

等级 名称 特征
L1 初始级 数据混乱
L2 受管理级 部分管理
L3 稳健级 体系化管理
L4 量化管理级 量化指标
L5 优化级 持续优化

国内大多数组织在 L2-L3 之间——这是 数据治理的现状

5.4 案例锚点:清华园物业的数据标准

清华园物业数据标准化结果:

  • 命名标准:所有表加前缀 t_xxx
  • 格式标准:所有时间 ISO 8601
  • 编码标准:业主身份证按 GB11643
  • 值域标准:物业费状态 = 已缴/欠费/退费
  • 质量标准:手机号必须 11 位且 1 开头

DCMM 评估等级:从 L1 提升到 L2,目标 3 年到 L3。

六、主数据管理(MDM)

6.1 主数据是什么

主数据(Master Data):组织 核心实体的"独此一份"数据

典型主数据:

  • 业主主数据:清华园 1860 户
  • 房产主数据:1860 套
  • 员工主数据:68 人
  • 供应商主数据:物业的供应商清单
  • 物料主数据:维修物料

6.2 主数据管理的"4 大原则"

主数据管理四大原则

原则一:唯一性

每个主数据有唯一标识 ID

原则二:一致性

跨系统数据保持一致

原则三:权威性

有明确的"数据创建者"和"数据维护者"

原则四:及时性

变更后及时同步到所有使用方

6.3 主数据治理的"7 步法"

第1步:识别主数据

第2步:制定标准

第3步:选择 MDM 工具

第4步:数据清洗

第5步:建立 MDM 平台

第6步:制定治理流程

第7步:持续优化

MDM 是数据治理的"地基" ——必须先做。

6.4 主数据治理的"4 个典型场景"

场景一:客户主数据治理

银行/电信/零售业的常见场景

场景二:物料主数据治理

制造业的核心

场景三:员工主数据治理

集团公司的必修课

场景四:组织架构主数据

跨部门、跨子公司的协同

七、考点聚焦

7.1 选择题考点

以上为部分预览,完整内容请登录后查看
微信扫码登录

登录查看完整内容

本讲属于"系规精品图文课程"课程内容。微信扫码登录后,系统会自动识别你的课程权限并直接返回本页。

使用微信扫描二维码,授权后自动登录并返回本页

二维码未显示?点此打开
🎬

本讲配套视频版

图文不够直观时看视频, 老孙亲讲讲透
系规精品视频课程

第19讲:数据资源规划(中)· 数据架构与标准化

点击跳转 →

相关推荐

继续深入学习「系规精品图文课程」其他课时

意见反馈
回到顶部咨询