一、开篇:为什么真题速评从这道题开始
各位同学好,老孙在这里。
今天是 2026 年 5 月 31 日,距 10 月 24 日系规考试还剩 146 天。
从今天起,每周日老孙固定一篇真题速评——拆解一道近 3 年系规真题(2023 上 / 2024 下 / 2025 下案例回忆版),讲清楚这题考什么、为什么选这个、易错点在哪、能延伸出哪些考点。
第一期老孙故意选了 2023 年 5 月(上半年)综合知识第 1 题——香农信息熵公式题。
选这一题做开篇有 3 个理由:
- 它是系规教材第 1 章的"开篇第一题",多数同学翻开教材最先看到的就是这个概念
- 它是非数学背景同学最容易懵的一题——一看到 H(x) = -∑pᵢlogpᵢ 这种公式就头大
- 它是历年反复考查的题——2023 上、2018 上、2019 上 都出现过相似题型
读完今天这一篇,你不仅能记住这道题的答案,还能掌握所有围绕"信息熵"出题的解题套路。
二、原题完整回顾
【2023 年 05 月 - 第 1 题】系规 - 第 1 章 信息系统综合知识
香农用概率来定量描述信息的公式如下,其中 H(x) 表示 x 的(),Pᵢ 是()出现第 i 种状态的(_)。
H(x) = -∑Pᵢ log Pᵢ
A. 信息熵 | 事件 | 概率 B. 总熵 | 单位 | 概率 C. 信息熵 | 单位 | 概率 D. 总熵 | 单位 | 度量
【参考答案】A
这是一道3 个空 + 4 个选项的复合判断题。需要同时判断 3 个填空位的对错——错任意一空就整道题挂。
三、3 个空怎么判断:用"对照消元法"
老孙的解题套路:先把 3 个空的可能选项摊开,再用排除法逐一消元。
| 填空位 | 可能选项 | 排除分析 |
|---|---|---|
| 第 1 空 | 信息熵 / 总熵 | "总熵"在信息论里不是标准术语——香农定义的是"信息熵"。排除 B、D |
| 第 2 空 | 事件 / 单位 | "Pᵢ 出现第 i 种状态" 这里描述的主语是事件(事件 X 出现各种状态),"单位"在这里语法不通——单位不会"出现状态"。排除 C |
| 第 3 空 | 概率 / 度量 | 因为前面已经说"用概率描述信息",第 3 空指 Pᵢ 出现状态的概率。"度量"是名词级别更高的概念,不合。排除 D |
3 步排除后,只剩 A 是唯一自洽答案。
老孙的话:这种"3 空填空 + 4 选项"的题,70% 同学错在没逐空消元,只看了第 1 空就选。培养"逐空对照"的习惯,能避免至少 5 道这种复合题的失分。
四、信息熵到底是什么:用最简单的语言讲清楚
很多同学对这道题的真正障碍不是选项分析,而是看不懂信息熵公式本身。
老孙用最日常的比喻解释一遍:
比喻:抛硬币 vs 掷骰子的"不确定性"
| 场景 | 可能结果数 | 不确定性大小 | 信息熵 |
|---|---|---|---|
| 抛 1 枚均匀硬币 | 2(正 / 反) | 较小 | 1 bit |
| 掷 1 个均匀 6 面骰子 | 6(1-6) | 较大 | 约 2.58 bit |
| 掷 1 个均匀 8 面骰子 | 8 | 更大 | 3 bit |
| 抛已知作弊硬币(一定出正) | 1(确定) | 0 | 0 bit |
信息熵 = 不确定性的量化指标。结果越多 + 各结果概率越接近 → 不确定性越大 → 信息熵越大。
公式 H(x) = -∑Pᵢ log Pᵢ 拆解
| 符号 | 含义 |
|---|---|
| H(x) | 事件 x 的信息熵(不确定性大小) |
| Pᵢ | 事件第 i 种结果出现的概率 |
| log Pᵢ | 概率的对数(数学上的转换技巧) |
| -∑ | 把每种结果的"概率 × log 概率"加起来,前面加负号让结果为正 |
为什么前面加负号? 因为概率 Pᵢ 在 0-1 之间,log Pᵢ 是负数。加负号让 H(x) 变成正数(更直观)。
为什么用对数? 这是香农 1948 年论文里的数学技巧——用对数让"独立事件的信息量可加"。比如抛 2 枚硬币的信息量 = 抛 1 枚硬币的信息量 × 2。
单位是什么? 当 log 用 2 为底(log₂),单位是 比特(bit)——这也是计算机存储的基本单位。
五、这一题延伸出的 5 个常考考点
老孙带学员时发现,搞懂 1 道真题 = 能应对 5 道相似题。这一题延伸的高频考点如下:
延伸考点 1:信息熵的单位(bit / nat / Hart)
- log₂ 为底 → 单位是 比特(bit)
- ln 为底(自然对数)→ 单位是 奈特(nat)
- log₁₀ 为底 → 单位是 哈特(Hart)
老孙的话:考试里最常考的是 bit。这 3 个单位的换算关系不是高频考点,知道即可。
延伸考点 2:信息熵的最大值与最小值
- 最大值:所有结果等概率出现时(如均匀硬币),信息熵最大
- n 种结果的最大信息熵 = log₂ n
- 最小值:某一种结果概率为 1(确定事件),信息熵 = 0
考题示例:"5 种结果等概率出现,信息熵是多少?" → log₂ 5 ≈ 2.32 bit
延伸考点 3:信源 / 信宿 / 信道 / 噪声
香农的信息论 5 大概念:
| 概念 | 含义 | 现实例子 |
|---|---|---|
| 信源 | 信息的发出者 | 你说话的嘴 |
| 信宿 | 信息的接收者 | 对方的耳朵 |
| 信道 | 信息传输的介质 | 中间的空气 |
| 噪声 | 干扰信号的因素 | 嘈杂背景音 |
| 编码 / 解码 | 信息表达 / 还原 | 普通话发音 / 听音辨意 |
这 5 个概念几乎每年综合知识必考 1-2 题。
延伸考点 4:数据 vs 信息 vs 知识 vs 智慧(DIKW 金字塔)
| 层级 | 定义 | 例子 |
|---|---|---|
| 数据 Data | 原始符号 | 36.8(一串数字) |
| 信息 Information | 有意义的数据 | 体温 36.8℃(正常) |
| 知识 Knowledge | 信息的规律 | 体温 36-37℃ 是健康范围 |
| 智慧 Wisdom | 知识的运用判断 | 体温异常应何时就医 |
DIKW 金字塔在 2023 上 / 2024 下 都考过相似题——必背概念图。
延伸考点 5:信息的特征(5 大特征)
- 客观性:信息是客观存在的
- 普遍性:信息无处不在
- 可识别性:可以被感知
- 可存储性:可以被记录
- 可传递性:可以被传播
这 5 大特征多数年份会有 1 道选择题考其中 1 个。
六、这道题的"考试出题逻辑"反推
把这一题放在系规综合知识 75 题里看,它属于"开胃菜难度"——出在第 1 题位置,目的是给考生一个"我能搞定"的心理暗示。
如果你第 1 题就懵了,后面 74 题的状态会受影响。
老孙给的应对策略:
- 考前必须把第 1 章的所有概念性题型做一遍——信息熵、DIKW、5 大特征、信源信道
- 见到公式不要慌——系规综合的公式题大多只需要理解概念,不需要真做计算
- 进考场后第 1 题如果卡住,先标记跳过——系规支持机考标记跳过功能,别在第 1 题浪费时间影响后续状态
七、3 道相似题练手(自测)
老孙给你 3 道结构类似的题,你可以试着自己解一下:
自测题 1(仿 2018 上)
香农信息熵的最大值出现在()情况下。
A. 概率分布均匀 B. 单一结果概率为 1 C. 结果数量最多 D. 噪声最小
老孙提示:见前文"延伸考点 2"。
自测题 2(仿 2019 上)
DIKW 金字塔中,"36.8 ℃ 是正常体温" 属于()层级。
A. 数据 B. 信息 C. 知识 D. 智慧
老孙提示:见前文"延伸考点 4"。
自测题 3(仿 2022 上)
下列哪一项不是信息的基本特征()。
A. 客观性 B. 可识别性 C. 可计算性 D. 可传递性
老孙提示:见前文"延伸考点 5"。
八、本周作业:复习第 1 章 + 自建错题本
读完今天这一篇,建议你本周做 2 件事:
- 翻教材第 1 章信息系统综合知识 → 重点画 5 个延伸考点对应的页码
- 建立错题本 → 把这道 2023 上第 1 题 + 3 道自测题抄下来,记下你的错处 + 老孙的解析
错题本不是"做完就丢"——它是你考前 1 周回炉的"高频题清单"。
九、信息熵的现实应用:用 4 个生活案例帮你"真懂"
非数学背景的同学只靠公式背是不够的。老孙用 4 个生活案例帮你真懂信息熵——理解了就不会忘了。
案例 1:天气预报为什么"明天 100% 下雨"价值最高?
假设你是一个农民。
- 没有天气预报时:你不知道明天是晴是雨——信息熵 = 1 bit(两种可能性)
- 天气预报说"明天 50% 概率下雨":你的不确定性没有降低——信息熵 = 1 bit
- 天气预报说"明天 100% 下雨":你完全知道了——信息熵 = 0 bit
信息熵的减少量 = 天气预报对你的真实价值。从 1 bit 降到 0 bit = 这条预报值 1 bit 的信息。
应用到 IT 项目:你监控一台服务器的 CPU 使用率。如果监控系统每分钟告诉你"CPU 在 0-100% 之间"——这是没用的信息(信息熵没降)。如果监控系统告诉你"CPU 在 95-100% 区间"——这才降低了你的不确定性(信息熵降低了)。
案例 2:彩票为什么"双色球"信息量比"刮刮乐"大?
- 刮刮乐:你刮开就知道中没中——结果只有 2 种
- 双色球:6 + 1 个号码组合 = 约 1700 万种结果
按 H = log₂ n 公式计算:
- 刮刮乐信息熵 = log₂ 2 = 1 bit
- 双色球信息熵 = log₂ (1700 万) ≈ 24 bit
双色球的信息量是刮刮乐的 24 倍——也是你中奖概率低 1700 万倍的根本原因。
案例 3:26 个英文字母为什么比 10 个数字"信息密度高"?
- 1 位英文字母 = log₂ 26 ≈ 4.7 bit
- 1 位数字 = log₂ 10 ≈ 3.3 bit
这就是为什么短链接服务用字母而不用纯数字——同样 8 位长度:
- 8 位字母 = 4.7 × 8 = 37.6 bit(可表示约 2000 亿个不同链接)
- 8 位数字 = 3.3 × 8 = 26.4 bit(可表示约 1 亿个不同链接)
字母的信息密度高了 2000 倍。
案例 4:身份证号为什么是 18 位不是 10 位?
中国人口约 14 亿 ≈ 2³¹。
按 H = log₂ n:
- 中国身份证至少需要 31 bit 才能区分每一个人
- 1 个汉字数字 = 3.3 bit,需要 10 位数字 才达到 31 bit
- 但身份证还要 编码区域 + 出生日期 + 性别 + 校验位,所以总位数升到 18
身份证的设计完全遵循信息熵的数学约束。
十、信息熵在系规考试里的 5 种典型出题方式
老孙整理了近 8 年系规综合知识里所有涉及信息熵的题,总结出 5 种典型出题方式——见到这 5 种就秒选:
出题方式 1:公式直接判断(占 40%)
"下列哪个公式是香农信息熵的标准定义?"
应对:背公式 H(x) = -∑Pᵢ log Pᵢ + 记口诀("减求和概对概" = -∑Pᵢlog Pᵢ)
出题方式 2:单位判断(占 20%)
"log 以 2 为底时,信息熵的单位是?"
应对:背 3 个单位(bit / nat / Hart)
出题方式 3:场景应用(占 15%)
"下列哪种情况下信息熵最大?"
应对:记住"等概率分布 → 信息熵最大"
出题方式 4:信源 / 信宿等概念区分(占 15%)
"下列哪一项不是香农通信模型的组成?"
应对:背 5 大组成(信源、信宿、信道、噪声、编码 / 解码)
出题方式 5:DIKW 金字塔(占 10%)
"下列描述属于 DIKW 金字塔的哪一层?"
应对:背 4 层(数据 / 信息 / 知识 / 智慧)
5 种出题方式 + 对应应对 = 你能拿到信息熵相关题的 90% 分。
十一、3 类典型同学读这道题后的反应
老孙带学员时观察,不同背景的同学读这道题反应截然不同:
反应 1:理工科背景同学(程序员 / 工程师)
"这题不就是大学《信息论与编码》的开篇例题吗?我大学考过 90 分。"
老孙的提醒:你对公式熟悉,但不一定记得"哪些场景下信息熵最大"等扩展知识点。把第 9 节的 5 个案例 + 第 10 节的 5 种出题方式都过一遍,确认你能扛住扩展题。
反应 2:管理 / 文科背景同学(事业单位综合岗 / 行政管理)
"公式我看不懂,但我能记住答案 A。"
老孙的提醒:只记答案是不够的。考场上变种题就懵了。把第 4 节"用最简单的语言讲清楚" + 第 9 节生活案例反复读 3 遍——理解 > 记忆。
反应 3:完全跨行业背景同学(医务 / 教师 / 创业者)
"我打开教材第 1 章就看到这个公式,直接放弃了第 1 章。"
老孙的提醒:第 1 章是 A 档章节,每年综合知识 5-6 题——放弃 = 直接送分。第 1 章的难点只有公式题这一个,其他都是概念题。绕过公式部分先学其他,最后再回头啃公式。
十二、本周作业升级版:3 道真题 + 5 道延伸
读完今天这一篇,老孙建议你本周完成下面 2 件事:
事 1:把这 1 道真题 + 3 道自测题彻底掌握
- 用电脑做 1 遍(机考模拟)
- 写下你的解题思路
- 对照本文检查
事 2:找 5 道"信息熵 / DIKW / 信源信道 / 信息特征"延伸真题
- 教材第 1 章配套习题
- 历年综合知识真题(2017-2024)
- 老孙以后会陆续讲
十三、教材第 1 章其他高频考点速览
第 1 章除信息熵之外,还有 7 个高频考点——老孙一次性给你过完,这一章就基本拿下。
高频考点 1:信息系统的 5 大基本概念
教材开篇定义了 5 大基本概念,考试经常给 1 个定义让你判断是哪个概念:
| 概念 | 定义 |
|---|---|
| 数据 | 客观事物的符号表示(最原始) |
| 信息 | 经过加工的、有意义的数据 |
| 知识 | 经过分析、抽象、提炼的规律性认识 |
| 智慧 | 基于知识做出正确判断和决策的能力 |
| 数据资产 | 由组织拥有或控制、能够产生经济价值的数据资源 |
高频考点 2:信息系统的 5 大特征
- 目的性:信息系统是为特定目标而建
- 整体性:组件相互关联,不能割裂
- 层次性:多层结构(输入 / 处理 / 输出 / 反馈)
- 环境适应性:根据外部环境变化调整
- 目的性可达性:通过组件协作实现目的
高频考点 3:信息系统的发展阶段
| 阶段 | 时期 | 代表系统 |
|---|---|---|
| 数据处理(EDP) | 1950-1960s | 工资 / 库存系统 |
| 管理信息系统(MIS) | 1960-1970s | ERP 雏形 |
| 决策支持系统(DSS) | 1970-1980s | 高管决策 |
| 智能信息系统 | 1980-2000s | 专家系统 |
| 互联网 + AI 信息系统 | 2010s 至今 | 大数据、云计算、AI 应用 |
高频考点 4:信息技术的 4 次浪潮
- 机械化(蒸汽机时代)
- 电气化(电力时代)
- 信息化(计算机 + 互联网)
- 智能化(AI + 大数据 + 云)
高频考点 5:信息系统的 4 大组成
- 硬件:计算机 / 网络设备 / 存储
- 软件:操作系统 / 中间件 / 应用软件
- 数据:业务数据 / 元数据 / 日志
- 人员 + 流程:用户 / 管理员 / 业务流程
高频考点 6:5 种系统思想(与第 3 章呼应)
- 整体思想
- 联系思想
- 发展思想
- 矛盾思想
- 实践思想
高频考点 7:信息系统集成的 5 个层次
- 设备 / 硬件集成
- 数据集成
- 应用集成
- 业务集成
- 战略集成
老孙的话:上面 7 个考点 + 本文前面的"信息熵 + 5 延伸"= 第 1 章 95% 的题你都能拿下。
十四、第 1 章备考的 3 周节奏建议
按老孙第 004 篇的 22 周节奏,第 1 章的最佳备考时段是阶段 1 后期 + 阶段 2 第 1 周:
第 6-7 周(7/1 - 7/14):第 1 章首遍精读
- 任务:通读教材第 1 章约 30 页
- 重点:画出"信息熵 + 5 大基本概念 + 5 大特征 + 4 次浪潮 + 4 大组成 + 5 种系统思想 + 5 个集成层次"7 大考点
- 题量:配 30-40 道近 5 年真题
- 时长:约 8-10 小时
第 7 周后半段:第 1 章错题整理
- 把第 1 章做错的题抄到错题本
- 写下"为什么错 + 教材原文页码"
- 错题本结构:题目 → 我的错误答案 → 正确答案 → 错因分析 → 教材锚定
第 8 周(7/15 - 7/21):第 1 章与第 2 章衔接
- 第 1 章末尾的"信息系统集成 5 个层次"与第 2 章"数字中国"概念呼应
- 把两章的"政策类考点"汇总成一张"政策考点速记表"
十五、第 1 章可能出现的 5 种"陷阱题"
老孙整理了近 8 年第 1 章里出现过的"陷阱题"——这 5 种陷阱不知道 = 直接送分:
陷阱 1:用"知识"考"信息"的定义
"下列对'信息'的描述正确的是()"
陷阱选项:A. 经过加工的、有意义的数据;B. 客观事物的符号表示;C. 经过分析提炼的规律性认识;D. 由组织拥有的数据资源。
陷阱:A 是信息的定义,但 B 是数据、C 是知识、D 是数据资产——选错就掉坑。
陷阱 2:用"DSS"考"MIS"
"下列哪个系统主要支持企业高层决策?"
陷阱:MIS 是管理信息系统(多数情况下选 MIS),但实际答案是 DSS 决策支持系统——专门为高层决策设计。
陷阱 3:用"4 次浪潮"考"5 次浪潮"
"信息技术发展历经几次浪潮?"
教材是 4 次浪潮(机械 + 电气 + 信息 + 智能)。但部分老资料写 5 次——别用老资料的口径。
陷阱 4:用"信息系统组成"考"4 大"vs"5 大"
教材是 4 大组成(硬件 + 软件 + 数据 + 人员/流程)。陷阱选项可能列 5 大(拆分人员和流程为 2 项)——选 4 大。
陷阱 5:用"信息熵公式"考最大 / 最小值场景
老孙在本文第 5 节已经讲过——等概率分布时信息熵最大,确定事件时信息熵 = 0。这是高频考点。
十六、本周 1 道完整作业题(含老孙批改示范)
老孙给你 1 道完整的第 1 章自测题——你先做,再对照老孙的批改示范学习。
作业题
假设某通信信道传输 4 种字符(A、B、C、D),其出现概率分别为 P(A)=0.5、P(B)=0.25、P(C)=0.125、P(D)=0.125。计算该信道的信息熵。
你的作答区
H(x) = -[ 0.5 × log₂(0.5) + 0.25 × log₂(0.25) + 0.125 × log₂(0.125) + 0.125 × log₂(0.125) ]
老孙批改示范
H(x) = -[ 0.5 × (-1) + 0.25 × (-2) + 0.125 × (-3) + 0.125 × (-3) ]
H(x) = -[ -0.5 - 0.5 - 0.375 - 0.375 ]
H(x) = -[ -1.75 ]
H(x) = 1.75 bit
解读
- 4 种字符等概率时,信息熵 = log₂ 4 = 2 bit(最大值)
- 现在不等概率,信息熵 1.75 bit < 2 bit
- 概率分布越不均匀,信息熵越小——这就是"等概率分布信息熵最大"的数学证明
这道题在系规综合知识里属于简单计算题——会做意味着你掌握了第 1 章计算类考点的精髓。不会做也没关系——这种题在 75 题里最多出 1-2 道,重点保证概念题不丢分即可。
十七、给同学的一句话总结
香农信息熵公式是系规教材第 1 章的开篇——也是非数学背景同学最容易心理崩溃的题。但记住核心要诀:3 空填空 + 4 选项 = 用逐空对照消元法 + 等概率分布信息熵最大——你就能拿到 90% 的信息熵相关题。第 1 章其他 7 个高频考点(5 大基本概念 / 5 大特征 / 4 次浪潮 / 4 大组成 / 5 种系统思想 / 5 个集成层次 / 信息系统发展阶段)都是"记下来就能拿分"的实用知识——投入 8-10 小时啃完 = 综合知识里第 1 章 5-6 题稳拿。
十八、本周真题站延伸阅读建议
老孙建议你本周配合做下面 3 件延伸阅读:
延伸 1:找近 5 年(2019-2024)系规综合知识第 1 题——按本文第 4 节方法逐空消元做一遍。你会发现 5 年中 4 年第 1 题都属于第 1 章范围。
延伸 2:把第 1 章 7 大高频考点对应的教材原文页码标记出来——形成"页码索引卡"。考前 1 周翻这张卡 = 第 1 章核心 30 分钟过完。
延伸 3:找 1 位备考搭子互相提问——你问他"什么是 DIKW 金字塔",他问你"信息熵公式怎么写"。互相提问 1 周后,你对第 1 章的掌握度比独自学习提升 50%。
十九、给同学的鼓励
第 1 章对很多非数学背景的同学是入门第一道门槛。如果你看完今天这一篇仍然觉得信息熵公式有点抽象,不要焦虑。老孙的提醒是:理解大于死记——你不需要在考场上重新推导公式,你只需要看到公式时能选对答案。慢慢来,按节奏推进,152 天里这种"抽象感"会被反复练习的真题一点点磨掉。
二十、明日预告
明天 6/1(周一)第 008 篇,老孙会写:
《6 月报系规的 3 类人 vs 不该报的 2 类人》
进入 6 月,系规报名工作即将启动。这一篇老孙会用决策框架告诉你:6 月这个时点报系规的 3 类典型同学 vs 不该在 6 月做决定的 2 类同学。如果你今天还在犹豫"6 月该不该按下报名键",明天这一篇直接给你拍板依据。
明天见。
相关阅读
- 系规备考 2026-10-24 完全指南
- 系规 ITSS 四要素全解
- 高项 vs 系规怎么选
- 系规一对一辅导(论文不限次精修)
- 系规论文专班 ¥3999(6/30 前早鸟价)
- 软考论文常见问题(15 问)
老孙的免费连载到 10/24 系规考试共 152 篇,每天一篇。看完想跟老孙聊聊备考路径,加我微信告诉你的报考状态,老孙给你一份匹配你时间的建议。
