主讲:老孙
适用:2026年下半年系统规划与管理师考试
预计阅读时间:45分钟
一、上节回顾
上一讲讲了数据资产、生命周期、形态、政策背景。
三件大事:
第一,数据三重身份:成本 → 资源 → 资产
第二,数据生命周期 7 阶段:产生→采集→传输→存储→加工→应用→归档销毁
第三,数据二十条四支柱:产权 / 流通 / 收益 / 安全
1.1 上一讲思考题点评
我看到一份精彩的"数据资产盘点"作业,来自一位制造业 CIO:
"用您的'四步法'盘点我们工厂,发现 80% 的设备数据从未被使用——这是巨大的数据浪费。重新规划后预计每年带来 300 万 的精益管理收益。"
这就是数据规划的真实价值——把"沉睡数据"变为"活资产"。
二、本讲导读
2.1 学习目标
学完这一讲,你应该能够:
- 【是什么】 准确说出数据架构的四大要素;说出数据建模的三层(概念/逻辑/物理);说出数据标准化的核心内容。
- 【为什么】 理解为什么"标准化"是数据治理的基础。
- 【怎么用】 能为清华园物业设计完整的数据架构与标准。
2.2 本讲在课程地图中的位置
本讲对标教材 第8章 数据规划中段,是数据规划的"工程化深化"。
【虚构案例提示】 本讲涉及"智慧邻里2.0项目""清华园物业""北京知知致用信息技术有限公司"均为培训教学所用的虚拟项目与虚构人物(详见第01讲首次案例声明)。
三、数据架构的"四大要素"
3.1 数据架构是什么
教材定义:
数据架构(Data Architecture)是组织数据资产的整体设计,包括数据资产清单、数据模型、数据流转、数据标准与治理。
3.2 数据架构的四大要素

要素一:数据资产清单
- 组织所有数据按类分类
- 含主数据、业务数据、元数据
- 含字段、负责人、敏感度
要素二:数据模型
- 概念模型(业务视角)
- 逻辑模型(数据库视角)
- 物理模型(实施视角)
要素三:数据流图(DFD)
- 数据从产生到消亡的全流转
- 含数据接口、数据共享、数据集成
要素四:数据标准与治理
- 数据格式标准
- 命名规则
- 质量规则
- 主数据管理
3.3 数据架构与企业架构的关系
数据架构是 TOGAF 四大架构 之一(BDAT 的 D):
- 业务架构:业务做什么
- 数据架构:业务需要什么数据
- 应用架构:处理数据的应用
- 技术架构:支撑应用的技术
数据架构在四大架构中"承上启下" ——既支撑业务又被应用消费。
四、数据建模的"三层"
4.1 三层模型的关系

第一层:概念模型(Conceptual Data Model)
- 视角:业务视角
- 受众:业务人员、决策者
- 内容:实体、关系、属性
- 工具:ER 图
第二层:逻辑模型(Logical Data Model)
- 视角:数据库视角
- 受众:数据架构师
- 内容:表、字段、关系、约束
- 工具:UML 类图、ERD
第三层:物理模型(Physical Data Model)
- 视角:实施视角
- 受众:DBA、开发
- 内容:实际表结构、索引、分区
- 工具:DDL 脚本
自上而下的关系:
概念模型 → 逻辑模型 → 物理模型
4.2 案例锚点:清华园物业的业主数据建模
概念模型:
业主、房产、缴费、报修等实体的关系
逻辑模型:
业主表(业主ID/姓名/电话/身份证)、房产表(房产ID/楼栋/房号/面积)、缴费表(缴费ID/业主ID/金额/时间)
物理模型:
MySQL 8.0 实现,业主表分库分表(按楼栋分),缴费表按月分区
三层一致 = 业务、架构、实施对齐。
五、数据标准化
5.1 数据标准化的"5 大维度"

维度一:命名标准
- 表名、字段名规则
- 例:业主表 = t_owner,业主ID = owner_id
维度二:格式标准
- 日期格式、电话格式、金额精度
- 例:所有日期 YYYY-MM-DD
维度三:编码标准
- 行业编码、自定义编码
- 例:身份证按 GB11643、地址按 GB/T 2260
维度四:值域标准
- 字典值、枚举值
- 例:性别 = 男/女/未知
维度五:质量标准
- 完整性、准确性、一致性、及时性
- 例:身份证号必须 18 位且符合校验
5.2 数据标准化的"国家标准对接"
中国数据标准体系:
- GB/T 35295-2017 信息技术 大数据 术语
- GB/T 38673-2020 信息技术 大数据 数据分类指南
- GB/T 41014-2021 信息技术 大数据 系统平台技术参考
- GB/T 36073-2018 数据管理能力成熟度评估模型(DCMM)
DCMM 是 2024 年新增重点考点——必背!
5.3 DCMM 数据管理能力成熟度
DCMM 五个等级:
| 等级 | 名称 | 特征 |
|---|---|---|
| L1 | 初始级 | 数据混乱 |
| L2 | 受管理级 | 部分管理 |
| L3 | 稳健级 | 体系化管理 |
| L4 | 量化管理级 | 量化指标 |
| L5 | 优化级 | 持续优化 |
国内大多数组织在 L2-L3 之间——这是 数据治理的现状。
5.4 案例锚点:清华园物业的数据标准
清华园物业数据标准化结果:
- 命名标准:所有表加前缀
t_xxx - 格式标准:所有时间 ISO 8601
- 编码标准:业主身份证按 GB11643
- 值域标准:物业费状态 = 已缴/欠费/退费
- 质量标准:手机号必须 11 位且 1 开头
DCMM 评估等级:从 L1 提升到 L2,目标 3 年到 L3。
六、主数据管理(MDM)
6.1 主数据是什么
主数据(Master Data):组织 核心实体的"独此一份"数据。
典型主数据:
- 业主主数据:清华园 1860 户
- 房产主数据:1860 套
- 员工主数据:68 人
- 供应商主数据:物业的供应商清单
- 物料主数据:维修物料
6.2 主数据管理的"4 大原则"

原则一:唯一性
每个主数据有唯一标识 ID
原则二:一致性
跨系统数据保持一致
原则三:权威性
有明确的"数据创建者"和"数据维护者"
原则四:及时性
变更后及时同步到所有使用方
6.3 主数据治理的"7 步法"
第1步:识别主数据
第2步:制定标准
第3步:选择 MDM 工具
第4步:数据清洗
第5步:建立 MDM 平台
第6步:制定治理流程
第7步:持续优化
MDM 是数据治理的"地基" ——必须先做。
6.4 主数据治理的"4 个典型场景"
场景一:客户主数据治理
银行/电信/零售业的常见场景
场景二:物料主数据治理
制造业的核心
场景三:员工主数据治理
集团公司的必修课
场景四:组织架构主数据
跨部门、跨子公司的协同