主讲:老孙
适用:2026年下半年系统规划与管理师考试
预计阅读时间:45分钟
一、上节回顾
阶段二上半段 + 网络两讲讲完了。我们一起走过了 ISP、TOGAF、云、网络——4 大核心规划领域。
今天起进入 数据资源规划(第18-20 三讲)。这是系规阶段二的另一个"重头戏"。
1.1 上一讲思考题点评
我看到一份精彩的"三网协同"作业,来自一位民营物流公司 CTO:
"用您的方法论给我们 50 家分公司做了三网协同设计——SD-WAN 替代 MPLS 节省 60%、WiFi 6 提升仓库 IoT 接入数 5 倍、5G 备用让司机端永不断线——3 年合计节省 1800 万。"
这就是网络规划的真实经济价值——它不只是技术,更是 ROI。
二、本讲导读
2.1 学习目标
学完这一讲,你应该能够:
- 【是什么】 准确说出数据资产的核心定义、数据生命周期、数据形态、数据要素改革背景。
- 【为什么】 理解为什么"数据是新时代的石油";理解数据规划在企业 IT 中的战略地位。
- 【怎么用】 能为清华园物业做完整的"数据资产盘点"。
2.2 本讲在课程地图中的位置
本讲对标教材 第8章"数据资源规划" 的前半部分。
【虚构案例提示】 本讲涉及"智慧邻里2.0项目""清华园物业""北京知知致用信息技术有限公司"均为培训教学所用的虚拟项目与虚构人物(详见第01讲首次案例声明)。
2.3 一句话理解数据规划
数据规划 = 让组织的数据从"沉睡"变为"资产"——这是数字化转型的核心战役。
三、数据资产:从"成本"到"资产"的认知跃迁
3.1 数据的"三重身份"
数据在企业中有三重身份,认知层级不同:

身份一:数据作为"成本"
- 视角:传统 IT 视角
- 表现:数据存储费、备份费、运维费
- 处置方式:能删就删,能压缩就压缩
身份二:数据作为"资源"
- 视角:现代 IT 视角
- 表现:数据驱动决策、业务智能化
- 处置方式:好好用,但还没量化价值
身份三:数据作为"资产"
- 视角:数据要素时代的视角
- 表现:数据可入表、可交易、可融资
- 处置方式:精细管理、价值经营
90% 企业还停留在"身份一"或"身份二" ——只有少数走到"身份三"。
这是数据规划的认知跃迁起点。
3.2 教材给数据资源的定义
教材定义:
数据资源是指在组织运营中产生、获取、加工、传输的、对组织和外部具有潜在价值的各种数据集合。
关键词:潜在价值——数据如果没被识别价值,就不是资产。
3.3 "数据是新时代石油"的三重含义
含义一:稀缺性
优质数据稀缺——大模型时代尤其明显。
含义二:流通价值
数据流通才有价值——孤岛数据等于无价值。
含义三:加工增值
原始数据 = 原油;加工后 = 汽油 = 价值大幅提升。
这是论文中"数据时代"段落的金句素材。
3.4 数据资产的"6 大特征"
| 特征 | 含义 | 与传统资产对比 |
|---|---|---|
| 非消耗性 | 用了不减少 | 物质资产用了会少 |
| 可复制性 | 复制成本极低 | 物质资产复制成本高 |
| 时效性 | 会过期 | 物质资产相对稳定 |
| 共享性 | 多人同时用 | 物质资产同时只一人用 |
| 加工增值 | 加工提升价值 | 物质资产可能贬值 |
| 网络效应 | 多人用价值更高 | 物质资产无此效应 |
这 6 个特征决定了数据需要"全新的管理方式"——传统资产管理方式不适用。
四、数据生命周期管理
4.1 数据生命周期的"七大阶段"

阶段一:产生
- 数据从哪里来
- 业务过程产生 / 用户行为 / IoT 设备 / 外部接入
阶段二:采集
- 数据如何收集
- ETL / 实时采集 / 日志收集
阶段三:传输
- 数据怎么流转
- 网络 / 消息队列 / API
阶段四:存储
- 数据怎么存放
- 关系数据库 / 数据湖 / 数据仓库
阶段五:加工
- 数据如何加工
- 清洗 / 转换 / 聚合 / 计算
阶段六:应用
- 数据如何使用
- 报表 / BI / AI 模型 / 业务系统
阶段七:归档/销毁
- 数据如何退役
- 冷存储 / 合规销毁
这 7 个阶段必背——案例分析常考。
4.2 每个阶段的"关键控制点"
产生阶段:
- 数据源管理
- 数据质量标准
采集阶段:
- 采集频率
- 采集合规(不采集多余数据)
传输阶段:
- 传输加密
- 数据完整性校验
存储阶段:
- 分类分级存储
- 备份策略
加工阶段:
- 加工逻辑文档化
- 中间结果可追溯
应用阶段:
- 应用权限管控
- 使用审计
归档/销毁阶段:
- 归档策略
- 合规销毁
每个控制点都是潜在的考点。
4.3 案例锚点:清华园物业的数据生命周期
清华园物业的视频数据生命周期:
| 阶段 | 处理方式 |
|---|---|
| 产生 | 220 路摄像头 7x24 录制 |
| 采集 | 实时上传到本地存储 |
| 传输 | 通过光纤上传 |
| 存储 | 边缘节点存 7 天 + 云端归档 |
| 加工 | AI 行为识别 + 事件标注 |
| 应用 | 安防告警 / 事件回查 |
| 归档/销毁 | 6 个月归档 / 1 年自动销毁 |
这是 1860 户社区视频数据的完整生命周期管理。
五、数据形态:结构化/半结构化/非结构化
5.1 三大形态再深入
第02讲简要讲过数据三大形态。本讲深挖:
结构化数据(15%-20%):
- 特征:有固定字段
- 例子:业主信息表、缴费记录
- 存储:关系型数据库(MySQL / Oracle)
半结构化数据(5%-10%):
- 特征:有标签但无严格表结构
- 例子:JSON、XML、邮件、日志
- 存储:NoSQL(MongoDB / ES)
非结构化数据(70%-80%):
- 特征:无预定义结构
- 例子:视频、音频、图像、文档
- 存储:对象存储(OSS / S3)
5.2 三大形态的"管理差异"
| 维度 | 结构化 | 半结构化 | 非结构化 |
|---|---|---|---|
| 模型设计 | 有标准 ER 模型 | 灵活 Schema | 元数据驱动 |
| 检索难度 | 低(SQL) | 中(JSON 查询) | 高(AI 识别) |
| 治理难度 | 容易 | 较难 | 最难 |
| 增长速度 | 慢 | 中 | 快 |
| AI 时代价值 | 已被充分利用 | 待挖掘 | 待大力挖掘 |