阅读说明:这是《大话系规官方教材伴读》系列的付费正文。本系列按官方教材原章节顺序,一节一节用大白话讲透第2版教材。非会员可免费试读本讲约百分之二十。
这套伴读怎么用、和《系规精品图文课程》怎么搭着看,先读开篇导读:《大话系规官方教材伴读·开篇:这本又厚又硬的书,我陪你一节一节读完》。
付费方式:独立合集《大话系规官方教材伴读》合集价 299 元,购买后全部讲次解锁(微信小程序或官方网站均可学习)。已订阅《系规精品图文课程》的同学不再单独付费,登录学习平台即可直接读全部内容。
以下为本讲正文 ↓
大话第8章③:数据架构与数据标准化
一、先问你两个图书馆里的问题
同学,这一讲分量足,咱们一口气把两节合起来讲:8.3 数据架构和 8.4 数据标准化。别被这两个硬邦邦的标题吓住,我先用一个你都进过的地方——图书馆——给你把这两件事说明白。
第一个问题:一个大图书馆,几百万册书,它得先想清楚——书是集中放在一个总馆好,还是分散放在好几个分馆好?放总馆,好管,但人多了挤;分几个馆,方便就近借,但管起来麻烦、还得保证各馆的书目对得上。这个"书该怎么摆、放哪儿、几个馆怎么配合"的整体设计,就是图书馆的"架构"。数据架构,就是给一个组织的数据,做这件"该怎么摆、放哪儿、怎么配合"的整体设计。这是 8.3 要讲的。
第二个问题:图书馆怎么让你一搜就能找到想要的书?靠的是一套"编目规矩"——每本书都有统一的分类号、书名、作者、出版社这些标准化的著录信息,还有一张索书号贴在书脊上。正因为全国图书馆都按差不多的规矩编目,你在这个馆查到的书,换个馆也能照样找到。数据标准化,就是给数据制定这样一套"编目规矩",让数据能被统一描述、统一分类、统一找到。这是 8.4 要讲的。
你看,架构管"数据怎么放、怎么组织",标准化管"数据怎么描述、怎么编目"。一个管骨架,一个管规矩,合起来就是让一个组织的数据从"一团乱"变成"井井有条、随用随取"。这一讲就把这两件事讲透。
这一讲覆盖教材 8.3(含 8.3.1 到 8.3.6 六个小节)和 8.4(含 8.4.1 到 8.4.4 四个小节)。内容多、技术词多,我尽量用你熟的场景给你翻译。咱们开始。
二、这一节在教材里的位置
| 教材位置 | 官方小节 | 这一讲的大白话主题 |
|---|---|---|
| 8.3 | 数据架构 | 数据怎么组织、怎么放(骨架) |
| 8.3.1 | 数据架构定义与目标 | 数据架构是啥、要达到什么目标 |
| 8.3.2 | 数据模型 | 概念、逻辑、物理三层模型 |
| 8.3.3 | 数据流设计 | 数据从哪来、到哪去、数据血缘 |
| 8.3.4 | 数据架构演化的驱动因素 | 是什么力量推着架构一直在变 |
| 8.3.5 | 传统数据架构 | 集中式、分布式、CAP 理论 |
| 8.3.6 | 现代数据架构 | 数据湖、云原生、实时、数据应用 |
| 8.4 | 数据标准化 | 数据怎么描述、怎么编目(规矩) |
| 8.4.1 | 建立数据标准体系 | 三类标准:指导、通用、专用 |
| 8.4.2 | 元数据标准化 | "关于数据的数据" |
| 8.4.3 | 数据元标准化 | 数据的"基本单元" |
| 8.4.4 | 数据分类与编码标准化 | 给数据分类、编号的原则 |
这一讲的两节,是第 8 章里"技术名词最密集"的地方,也是选择题的概念辨析富矿。架构那部分(尤其 CAP 理论、传统/现代架构)爱出选择题;标准化那部分(元数据、数据元、分类编码原则)也是名词对应题的高发区。它跟前两讲的关系是:第一讲讲"数据资源规划是什么",第二讲讲"用什么方法规划",这一讲落到更具体的——规划出来的数据,怎么组织成架构、怎么定成标准。是从"方法"到"产物"的一步。
三、大白话逐节精讲(上篇:数据架构)
1. 数据架构是啥、要达到什么目标(8.3.1)
先说架构这个词本身。教材说,架构是系统的整体设计或结构,目的是优化整个系统的功能、性能、可行性、成本和用户体验。一个组织里通常有好几种架构:业务架构、数据架构、应用架构、技术架构。这四种架构你记一下,它们是组织架构的"四大块"。
那数据架构是干啥的?教材说,数据架构的主要目标是有效地管理数据,以及有效地管理存储和使用数据的系统。它是数据管理的基础,能让企业从"数据孤岛"走向"数据共享",让数据被更好地管理、流动和使用。
我打个比方。数据架构,就像一栋楼的水电管网设计图:水从哪进、电从哪来、管线怎么走、各个房间怎么接。它不管你房间里摆什么家具(那是具体业务的事),它管的是"数据这种资源在整栋楼里怎么流、存哪儿、怎么取"。
教材说数据架构主要包含几个构件:当前状态的描述、数据需求的定义、数据整合的指引、数据管控策略要求的数据资产管理规范。还说组织的数据架构描述必须包括数据模型和数据流设计——记住这句,"数据模型"和"数据流",正好是接下来 8.3.2 和 8.3.3 两个小节,它俩是数据架构的两根顶梁柱。
数据架构的主要职责,教材列了五条,你扫一眼有印象就行:利用新兴技术帮组织快速改变产品服务和数据、把业务需求转换为数据和应用需求、管理复杂数据并传递至整个企业、确保业务和 IT 技术保持一致、为企业改革转型提供支撑。这里头"确保业务和 IT 保持一致"是个容易考的点。
2. 数据模型:概念、逻辑、物理三层(8.3.2)
数据架构的第一根顶梁柱,是数据模型。
教材说,企业数据模型是组织中用于描述和表示数据的整体框架,它提供了一个通用、一致的数据视图。它通常是一个简化的高层级模型,表示不同抽象层级的数据实体、关系、规则和属性。
这一节最该记的考点,是数据模型的三个层级:概念模型、逻辑模型、物理模型。教材的图 8-4 就是讲它们怎么一层层关联、最终落到机器上的。我用"盖房子"给你翻译这三层:

- 概念模型:最抽象,讲的是业务里有哪些"概念或实体",比如"业主""房产""车辆"。它是给业务和管理者看的草图。
- 逻辑模型:往下细化,定义每个实体有哪些属性、哪个是主键、实体之间什么关系。它是详细的施工图。
- 物理模型:最具体,落到机器语言——真正的数据表、字段名、字段类型。它是盖出来的楼。