软考找老孙
软考找老孙guoruankao.com
付费第32讲 / 共81讲

大话第8章③:数据架构与数据标准化

更新于

阅读说明:这是《大话系规官方教材伴读》系列的付费正文。本系列按官方教材原章节顺序,一节一节用大白话讲透第2版教材。非会员可免费试读本讲约百分之二十。

这套伴读怎么用、和《系规精品图文课程》怎么搭着看,先读开篇导读:《大话系规官方教材伴读·开篇:这本又厚又硬的书,我陪你一节一节读完》。

付费方式:独立合集《大话系规官方教材伴读》合集价 299 元,购买后全部讲次解锁(微信小程序或官方网站均可学习)。已订阅《系规精品图文课程》的同学不再单独付费,登录学习平台即可直接读全部内容。

以下为本讲正文 ↓

大话第8章③:数据架构与数据标准化

一、先问你两个图书馆里的问题

同学,这一讲分量足,咱们一口气把两节合起来讲:8.3 数据架构和 8.4 数据标准化。别被这两个硬邦邦的标题吓住,我先用一个你都进过的地方——图书馆——给你把这两件事说明白。

第一个问题:一个大图书馆,几百万册书,它得先想清楚——书是集中放在一个总馆好,还是分散放在好几个分馆好?放总馆,好管,但人多了挤;分几个馆,方便就近借,但管起来麻烦、还得保证各馆的书目对得上。这个"书该怎么摆、放哪儿、几个馆怎么配合"的整体设计,就是图书馆的"架构"。数据架构,就是给一个组织的数据,做这件"该怎么摆、放哪儿、怎么配合"的整体设计。这是 8.3 要讲的。

第二个问题:图书馆怎么让你一搜就能找到想要的书?靠的是一套"编目规矩"——每本书都有统一的分类号、书名、作者、出版社这些标准化的著录信息,还有一张索书号贴在书脊上。正因为全国图书馆都按差不多的规矩编目,你在这个馆查到的书,换个馆也能照样找到。数据标准化,就是给数据制定这样一套"编目规矩",让数据能被统一描述、统一分类、统一找到。这是 8.4 要讲的。

你看,架构管"数据怎么放、怎么组织",标准化管"数据怎么描述、怎么编目"。一个管骨架,一个管规矩,合起来就是让一个组织的数据从"一团乱"变成"井井有条、随用随取"。这一讲就把这两件事讲透。

这一讲覆盖教材 8.3(含 8.3.1 到 8.3.6 六个小节)和 8.4(含 8.4.1 到 8.4.4 四个小节)。内容多、技术词多,我尽量用你熟的场景给你翻译。咱们开始。

二、这一节在教材里的位置

教材位置 官方小节 这一讲的大白话主题
8.3 数据架构 数据怎么组织、怎么放(骨架)
8.3.1 数据架构定义与目标 数据架构是啥、要达到什么目标
8.3.2 数据模型 概念、逻辑、物理三层模型
8.3.3 数据流设计 数据从哪来、到哪去、数据血缘
8.3.4 数据架构演化的驱动因素 是什么力量推着架构一直在变
8.3.5 传统数据架构 集中式、分布式、CAP 理论
8.3.6 现代数据架构 数据湖、云原生、实时、数据应用
8.4 数据标准化 数据怎么描述、怎么编目(规矩)
8.4.1 建立数据标准体系 三类标准:指导、通用、专用
8.4.2 元数据标准化 "关于数据的数据"
8.4.3 数据元标准化 数据的"基本单元"
8.4.4 数据分类与编码标准化 给数据分类、编号的原则

这一讲的两节,是第 8 章里"技术名词最密集"的地方,也是选择题的概念辨析富矿。架构那部分(尤其 CAP 理论、传统/现代架构)爱出选择题;标准化那部分(元数据、数据元、分类编码原则)也是名词对应题的高发区。它跟前两讲的关系是:第一讲讲"数据资源规划是什么",第二讲讲"用什么方法规划",这一讲落到更具体的——规划出来的数据,怎么组织成架构、怎么定成标准。是从"方法"到"产物"的一步。

三、大白话逐节精讲(上篇:数据架构)

1. 数据架构是啥、要达到什么目标(8.3.1)

先说架构这个词本身。教材说,架构是系统的整体设计或结构,目的是优化整个系统的功能、性能、可行性、成本和用户体验。一个组织里通常有好几种架构:业务架构、数据架构、应用架构、技术架构。这四种架构你记一下,它们是组织架构的"四大块"。

数据架构是干啥的?教材说,数据架构的主要目标是有效地管理数据,以及有效地管理存储和使用数据的系统。它是数据管理的基础,能让企业从"数据孤岛"走向"数据共享",让数据被更好地管理、流动和使用。

我打个比方。数据架构,就像一栋楼的水电管网设计图:水从哪进、电从哪来、管线怎么走、各个房间怎么接。它不管你房间里摆什么家具(那是具体业务的事),它管的是"数据这种资源在整栋楼里怎么流、存哪儿、怎么取"。

教材说数据架构主要包含几个构件:当前状态的描述、数据需求的定义、数据整合的指引、数据管控策略要求的数据资产管理规范。还说组织的数据架构描述必须包括数据模型和数据流设计——记住这句,"数据模型"和"数据流",正好是接下来 8.3.2 和 8.3.3 两个小节,它俩是数据架构的两根顶梁柱。

数据架构的主要职责,教材列了五条,你扫一眼有印象就行:利用新兴技术帮组织快速改变产品服务和数据、把业务需求转换为数据和应用需求、管理复杂数据并传递至整个企业、确保业务和 IT 技术保持一致、为企业改革转型提供支撑。这里头"确保业务和 IT 保持一致"是个容易考的点。

2. 数据模型:概念、逻辑、物理三层(8.3.2)

数据架构的第一根顶梁柱,是数据模型

教材说,企业数据模型是组织中用于描述和表示数据的整体框架,它提供了一个通用、一致的数据视图。它通常是一个简化的高层级模型,表示不同抽象层级的数据实体、关系、规则和属性。

这一节最该记的考点,是数据模型的三个层级:概念模型、逻辑模型、物理模型。教材的图 8-4 就是讲它们怎么一层层关联、最终落到机器上的。我用"盖房子"给你翻译这三层:

图1

  • 概念模型:最抽象,讲的是业务里有哪些"概念或实体",比如"业主""房产""车辆"。它是给业务和管理者看的草图。
  • 逻辑模型:往下细化,定义每个实体有哪些属性、哪个是主键、实体之间什么关系。它是详细的施工图。
  • 物理模型:最具体,落到机器语言——真正的数据表、字段名、字段类型。它是盖出来的楼。
以上为部分预览,完整内容请登录后查看
微信扫码登录

登录查看完整内容

本讲属于"大话系规官方教材伴读"课程内容。微信扫码登录后,系统会自动识别你的课程权限并直接返回本页。

使用微信扫描二维码,授权后自动登录并返回本页

二维码未显示?点此打开

相关推荐

继续深入学习「大话系规官方教材伴读」其他课时

意见反馈
回到顶部咨询