真题速评 001：2023 上综合第 1 题"香农信息熵公式"为什么选 A

一、开篇：为什么真题速评从这道题开始

各位同学好，老孙在这里。

今天是 2026 年 5 月 31 日，距 10 月 24 日系规考试还剩 146 天。

从今天起，每周日老孙固定一篇真题速评——拆解一道近 3 年系规真题（2023 上 / 2024 下 / 2025 下案例回忆版），讲清楚这题考什么、为什么选这个、易错点在哪、能延伸出哪些考点。

第一期老孙故意选了 2023 年 5 月（上半年）综合知识第 1 题——香农信息熵公式题。

选这一题做开篇有 3 个理由：

它是系规教材第 1 章的"开篇第一题"，多数同学翻开教材最先看到的就是这个概念
它是非数学背景同学最容易懵的一题——一看到 H(x) = -∑pᵢlogpᵢ 这种公式就头大
它是历年反复考查的题——2023 上、2018 上、2019 上都出现过相似题型

读完今天这一篇，你不仅能记住这道题的答案，还能掌握所有围绕"信息熵"出题的解题套路。

二、原题完整回顾

【2023 年 05 月 - 第 1 题】系规 - 第 1 章信息系统综合知识

香农用概率来定量描述信息的公式如下，其中 H(x) 表示 x 的（），Pᵢ 是（）出现第 i 种状态的（_）。

H(x) = -∑Pᵢ log Pᵢ

A. 信息熵｜事件｜概率 B. 总熵｜单位｜概率 C. 信息熵｜单位｜概率 D. 总熵｜单位｜度量

【参考答案】A

这是一道3 个空 + 4 个选项的复合判断题。需要同时判断 3 个填空位的对错——错任意一空就整道题挂。

三、3 个空怎么判断：用"对照消元法"

老孙的解题套路：先把 3 个空的可能选项摊开，再用排除法逐一消元。

填空位	可能选项	排除分析
第 1 空	信息熵 / 总熵	"总熵"在信息论里不是标准术语——香农定义的是"信息熵"。排除 B、D
第 2 空	事件 / 单位	"Pᵢ 出现第 i 种状态" 这里描述的主语是事件（事件 X 出现各种状态），"单位"在这里语法不通——单位不会"出现状态"。排除 C
第 3 空	概率 / 度量	因为前面已经说"用概率描述信息"，第 3 空指 Pᵢ 出现状态的概率。"度量"是名词级别更高的概念，不合。排除 D

3 步排除后，只剩 A 是唯一自洽答案。

老孙的话：这种"3 空填空 + 4 选项"的题，70% 同学错在没逐空消元，只看了第 1 空就选。培养"逐空对照"的习惯，能避免至少 5 道这种复合题的失分。

四、信息熵到底是什么：用最简单的语言讲清楚

很多同学对这道题的真正障碍不是选项分析，而是看不懂信息熵公式本身。

老孙用最日常的比喻解释一遍：

比喻：抛硬币 vs 掷骰子的"不确定性"

场景	可能结果数	不确定性大小	信息熵
抛 1 枚均匀硬币	2（正 / 反）	较小	1 bit
掷 1 个均匀 6 面骰子	6（1-6）	较大	约 2.58 bit
掷 1 个均匀 8 面骰子	8	更大	3 bit
抛已知作弊硬币（一定出正）	1（确定）	0	0 bit

信息熵 = 不确定性的量化指标。结果越多 + 各结果概率越接近 → 不确定性越大 → 信息熵越大。

公式 H(x) = -∑Pᵢ log Pᵢ 拆解

符号	含义
H(x)	事件 x 的信息熵（不确定性大小）
Pᵢ	事件第 i 种结果出现的概率
log Pᵢ	概率的对数（数学上的转换技巧）
-∑	把每种结果的"概率 × log 概率"加起来，前面加负号让结果为正

为什么前面加负号？ 因为概率 Pᵢ 在 0-1 之间，log Pᵢ 是负数。加负号让 H(x) 变成正数（更直观）。

为什么用对数？ 这是香农 1948 年论文里的数学技巧——用对数让"独立事件的信息量可加"。比如抛 2 枚硬币的信息量 = 抛 1 枚硬币的信息量 × 2。

单位是什么？ 当 log 用 2 为底（log₂），单位是 比特（bit）——这也是计算机存储的基本单位。

五、这一题延伸出的 5 个常考考点

老孙带学员时发现，搞懂 1 道真题 = 能应对 5 道相似题。这一题延伸的高频考点如下：

延伸考点 1：信息熵的单位（bit / nat / Hart）

log₂ 为底 → 单位是 比特（bit）
ln 为底（自然对数）→ 单位是 奈特（nat）
log₁₀ 为底 → 单位是 哈特（Hart）

老孙的话：考试里最常考的是 bit。这 3 个单位的换算关系不是高频考点，知道即可。

延伸考点 2：信息熵的最大值与最小值

最大值：所有结果等概率出现时（如均匀硬币），信息熵最大
- n 种结果的最大信息熵 = log₂ n
最小值：某一种结果概率为 1（确定事件），信息熵 = 0

考题示例："5 种结果等概率出现，信息熵是多少？" → log₂ 5 ≈ 2.32 bit

延伸考点 3：信源 / 信宿 / 信道 / 噪声

香农的信息论 5 大概念：

概念	含义	现实例子
信源	信息的发出者	你说话的嘴
信宿	信息的接收者	对方的耳朵
信道	信息传输的介质	中间的空气
噪声	干扰信号的因素	嘈杂背景音
编码 / 解码	信息表达 / 还原	普通话发音 / 听音辨意

这 5 个概念几乎每年综合知识必考 1-2 题。

延伸考点 4：数据 vs 信息 vs 知识 vs 智慧（DIKW 金字塔）

层级	定义	例子
数据 Data	原始符号	36.8（一串数字）
信息 Information	有意义的数据	体温 36.8℃（正常）
知识 Knowledge	信息的规律	体温 36-37℃ 是健康范围
智慧 Wisdom	知识的运用判断	体温异常应何时就医

DIKW 金字塔在 2023 上 / 2024 下都考过相似题——必背概念图。

延伸考点 5：信息的特征（5 大特征）

客观性：信息是客观存在的
普遍性：信息无处不在
可识别性：可以被感知
可存储性：可以被记录
可传递性：可以被传播

这 5 大特征多数年份会有 1 道选择题考其中 1 个。

六、这道题的"考试出题逻辑"反推

把这一题放在系规综合知识 75 题里看，它属于"开胃菜难度"——出在第 1 题位置，目的是给考生一个"我能搞定"的心理暗示。

如果你第 1 题就懵了，后面 74 题的状态会受影响。

老孙给的应对策略：

考前必须把第 1 章的所有概念性题型做一遍——信息熵、DIKW、5 大特征、信源信道
见到公式不要慌——系规综合的公式题大多只需要理解概念，不需要真做计算
进考场后第 1 题如果卡住，先标记跳过——系规支持机考标记跳过功能，别在第 1 题浪费时间影响后续状态

七、3 道相似题练手（自测）

老孙给你 3 道结构类似的题，你可以试着自己解一下：

自测题 1（仿 2018 上）

香农信息熵的最大值出现在（）情况下。

A. 概率分布均匀 B. 单一结果概率为 1 C. 结果数量最多 D. 噪声最小

老孙提示：见前文"延伸考点 2"。

自测题 2（仿 2019 上）

DIKW 金字塔中，"36.8 ℃ 是正常体温" 属于（）层级。

A. 数据 B. 信息 C. 知识 D. 智慧

老孙提示：见前文"延伸考点 4"。

自测题 3（仿 2022 上）

下列哪一项不是信息的基本特征（）。

A. 客观性 B. 可识别性 C. 可计算性 D. 可传递性

老孙提示：见前文"延伸考点 5"。

八、本周作业：复习第 1 章 + 自建错题本

读完今天这一篇，建议你本周做 2 件事：

翻教材第 1 章信息系统综合知识 → 重点画 5 个延伸考点对应的页码
建立错题本 → 把这道 2023 上第 1 题 + 3 道自测题抄下来，记下你的错处 + 老孙的解析

错题本不是"做完就丢"——它是你考前 1 周回炉的"高频题清单"。

九、信息熵的现实应用：用 4 个生活案例帮你"真懂"

非数学背景的同学只靠公式背是不够的。老孙用 4 个生活案例帮你真懂信息熵——理解了就不会忘了。

案例 1：天气预报为什么"明天 100% 下雨"价值最高？

假设你是一个农民。

没有天气预报时：你不知道明天是晴是雨——信息熵 = 1 bit（两种可能性）
天气预报说"明天 50% 概率下雨"：你的不确定性没有降低——信息熵 = 1 bit
天气预报说"明天 100% 下雨"：你完全知道了——信息熵 = 0 bit

信息熵的减少量 = 天气预报对你的真实价值。从 1 bit 降到 0 bit = 这条预报值 1 bit 的信息。

应用到 IT 项目：你监控一台服务器的 CPU 使用率。如果监控系统每分钟告诉你"CPU 在 0-100% 之间"——这是没用的信息（信息熵没降）。如果监控系统告诉你"CPU 在 95-100% 区间"——这才降低了你的不确定性（信息熵降低了）。

案例 2：彩票为什么"双色球"信息量比"刮刮乐"大？

刮刮乐：你刮开就知道中没中——结果只有 2 种
双色球：6 + 1 个号码组合 = 约 1700 万种结果

按 H = log₂ n 公式计算：

刮刮乐信息熵 = log₂ 2 = 1 bit
双色球信息熵 = log₂ (1700 万) ≈ 24 bit

双色球的信息量是刮刮乐的 24 倍——也是你中奖概率低 1700 万倍的根本原因。

案例 3：26 个英文字母为什么比 10 个数字"信息密度高"？

1 位英文字母 = log₂ 26 ≈ 4.7 bit
1 位数字 = log₂ 10 ≈ 3.3 bit

这就是为什么短链接服务用字母而不用纯数字——同样 8 位长度：

8 位字母 = 4.7 × 8 = 37.6 bit（可表示约 2000 亿个不同链接）
8 位数字 = 3.3 × 8 = 26.4 bit（可表示约 1 亿个不同链接）

字母的信息密度高了 2000 倍。

案例 4：身份证号为什么是 18 位不是 10 位？

中国人口约 14 亿 ≈ 2³¹。

按 H = log₂ n：

中国身份证至少需要 31 bit 才能区分每一个人
1 个汉字数字 = 3.3 bit，需要 10 位数字 才达到 31 bit
但身份证还要 编码区域 + 出生日期 + 性别 + 校验位，所以总位数升到 18

身份证的设计完全遵循信息熵的数学约束。

十、信息熵在系规考试里的 5 种典型出题方式

老孙整理了近 8 年系规综合知识里所有涉及信息熵的题，总结出 5 种典型出题方式——见到这 5 种就秒选：

出题方式 1：公式直接判断（占 40%）

"下列哪个公式是香农信息熵的标准定义？"

应对：背公式 H(x) = -∑Pᵢ log Pᵢ + 记口诀（"减求和概对概" = -∑Pᵢlog Pᵢ）

出题方式 2：单位判断（占 20%）

"log 以 2 为底时，信息熵的单位是？"

应对：背 3 个单位（bit / nat / Hart）

出题方式 3：场景应用（占 15%）

"下列哪种情况下信息熵最大？"

应对：记住"等概率分布 → 信息熵最大"

出题方式 4：信源 / 信宿等概念区分（占 15%）

"下列哪一项不是香农通信模型的组成？"

应对：背 5 大组成（信源、信宿、信道、噪声、编码 / 解码）

出题方式 5：DIKW 金字塔（占 10%）

"下列描述属于 DIKW 金字塔的哪一层？"

应对：背 4 层（数据 / 信息 / 知识 / 智慧）

5 种出题方式 + 对应应对 = 你能拿到信息熵相关题的 90% 分。

十一、3 类典型同学读这道题后的反应

老孙带学员时观察，不同背景的同学读这道题反应截然不同：

反应 1：理工科背景同学（程序员 / 工程师）

"这题不就是大学《信息论与编码》的开篇例题吗？我大学考过 90 分。"

老孙的提醒：你对公式熟悉，但不一定记得"哪些场景下信息熵最大"等扩展知识点。把第 9 节的 5 个案例 + 第 10 节的 5 种出题方式都过一遍，确认你能扛住扩展题。

反应 2：管理 / 文科背景同学（事业单位综合岗 / 行政管理）

"公式我看不懂，但我能记住答案 A。"

老孙的提醒：只记答案是不够的。考场上变种题就懵了。把第 4 节"用最简单的语言讲清楚" + 第 9 节生活案例反复读 3 遍——理解 > 记忆。

反应 3：完全跨行业背景同学（医务 / 教师 / 创业者）

"我打开教材第 1 章就看到这个公式，直接放弃了第 1 章。"

老孙的提醒：第 1 章是 A 档章节，每年综合知识 5-6 题——放弃 = 直接送分。第 1 章的难点只有公式题这一个，其他都是概念题。绕过公式部分先学其他，最后再回头啃公式。

十二、本周作业升级版：3 道真题 + 5 道延伸

读完今天这一篇，老孙建议你本周完成下面 2 件事：

事 1：把这 1 道真题 + 3 道自测题彻底掌握

用电脑做 1 遍（机考模拟）
写下你的解题思路
对照本文检查

事 2：找 5 道"信息熵 / DIKW / 信源信道 / 信息特征"延伸真题

教材第 1 章配套习题
历年综合知识真题（2017-2024）
老孙以后会陆续讲

十三、教材第 1 章其他高频考点速览

第 1 章除信息熵之外，还有 7 个高频考点——老孙一次性给你过完，这一章就基本拿下。

高频考点 1：信息系统的 5 大基本概念

教材开篇定义了 5 大基本概念，考试经常给 1 个定义让你判断是哪个概念：

概念	定义
数据	客观事物的符号表示（最原始）
信息	经过加工的、有意义的数据
知识	经过分析、抽象、提炼的规律性认识
智慧	基于知识做出正确判断和决策的能力
数据资产	由组织拥有或控制、能够产生经济价值的数据资源

高频考点 2：信息系统的 5 大特征

目的性：信息系统是为特定目标而建
整体性：组件相互关联，不能割裂
层次性：多层结构（输入 / 处理 / 输出 / 反馈）
环境适应性：根据外部环境变化调整
目的性可达性：通过组件协作实现目的

高频考点 3：信息系统的发展阶段

阶段	时期	代表系统
数据处理（EDP）	1950-1960s	工资 / 库存系统
管理信息系统（MIS）	1960-1970s	ERP 雏形
决策支持系统（DSS）	1970-1980s	高管决策
智能信息系统	1980-2000s	专家系统
互联网 + AI 信息系统	2010s 至今	大数据、云计算、AI 应用

高频考点 4：信息技术的 4 次浪潮

机械化（蒸汽机时代）
电气化（电力时代）
信息化（计算机 + 互联网）
智能化（AI + 大数据 + 云）

高频考点 5：信息系统的 4 大组成

硬件：计算机 / 网络设备 / 存储
软件：操作系统 / 中间件 / 应用软件
数据：业务数据 / 元数据 / 日志
人员 + 流程：用户 / 管理员 / 业务流程

高频考点 6：5 种系统思想（与第 3 章呼应）

整体思想
联系思想
发展思想
矛盾思想
实践思想

高频考点 7：信息系统集成的 5 个层次

设备 / 硬件集成
数据集成
应用集成
业务集成
战略集成

老孙的话：上面 7 个考点 + 本文前面的"信息熵 + 5 延伸"= 第 1 章 95% 的题你都能拿下。

十四、第 1 章备考的 3 周节奏建议

按老孙第 004 篇的 22 周节奏，第 1 章的最佳备考时段是阶段 1 后期 + 阶段 2 第 1 周：

第 6-7 周（7/1 - 7/14）：第 1 章首遍精读

任务：通读教材第 1 章约 30 页
重点：画出"信息熵 + 5 大基本概念 + 5 大特征 + 4 次浪潮 + 4 大组成 + 5 种系统思想 + 5 个集成层次"7 大考点
题量：配 30-40 道近 5 年真题
时长：约 8-10 小时

第 7 周后半段：第 1 章错题整理

把第 1 章做错的题抄到错题本
写下"为什么错 + 教材原文页码"
错题本结构：题目 → 我的错误答案 → 正确答案 → 错因分析 → 教材锚定

第 8 周（7/15 - 7/21）：第 1 章与第 2 章衔接

第 1 章末尾的"信息系统集成 5 个层次"与第 2 章"数字中国"概念呼应
把两章的"政策类考点"汇总成一张"政策考点速记表"

十五、第 1 章可能出现的 5 种"陷阱题"

老孙整理了近 8 年第 1 章里出现过的"陷阱题"——这 5 种陷阱不知道 = 直接送分：

陷阱 1：用"知识"考"信息"的定义

"下列对'信息'的描述正确的是（）"

陷阱选项：A. 经过加工的、有意义的数据；B. 客观事物的符号表示；C. 经过分析提炼的规律性认识；D. 由组织拥有的数据资源。

陷阱：A 是信息的定义，但 B 是数据、C 是知识、D 是数据资产——选错就掉坑。

陷阱 2：用"DSS"考"MIS"

"下列哪个系统主要支持企业高层决策？"

陷阱：MIS 是管理信息系统（多数情况下选 MIS），但实际答案是 DSS 决策支持系统——专门为高层决策设计。

陷阱 3：用"4 次浪潮"考"5 次浪潮"

"信息技术发展历经几次浪潮？"

教材是 4 次浪潮（机械 + 电气 + 信息 + 智能）。但部分老资料写 5 次——别用老资料的口径。

陷阱 4：用"信息系统组成"考"4 大"vs"5 大"

教材是 4 大组成（硬件 + 软件 + 数据 + 人员/流程）。陷阱选项可能列 5 大（拆分人员和流程为 2 项）——选 4 大。

陷阱 5：用"信息熵公式"考最大 / 最小值场景

老孙在本文第 5 节已经讲过——等概率分布时信息熵最大，确定事件时信息熵 = 0。这是高频考点。

十六、本周 1 道完整作业题（含老孙批改示范）

老孙给你 1 道完整的第 1 章自测题——你先做，再对照老孙的批改示范学习。

作业题

假设某通信信道传输 4 种字符（A、B、C、D），其出现概率分别为 P(A)=0.5、P(B)=0.25、P(C)=0.125、P(D)=0.125。计算该信道的信息熵。

你的作答区

H(x) = -[ 0.5 × log₂(0.5) + 0.25 × log₂(0.25) + 0.125 × log₂(0.125) + 0.125 × log₂(0.125) ]

老孙批改示范

H(x) = -[ 0.5 × (-1) + 0.25 × (-2) + 0.125 × (-3) + 0.125 × (-3) ]

H(x) = -[ -0.5 - 0.5 - 0.375 - 0.375 ]

H(x) = -[ -1.75 ]

H(x) = 1.75 bit

解读

4 种字符等概率时，信息熵 = log₂ 4 = 2 bit（最大值）
现在不等概率，信息熵 1.75 bit < 2 bit
概率分布越不均匀，信息熵越小——这就是"等概率分布信息熵最大"的数学证明

这道题在系规综合知识里属于简单计算题——会做意味着你掌握了第 1 章计算类考点的精髓。不会做也没关系——这种题在 75 题里最多出 1-2 道，重点保证概念题不丢分即可。

十七、给同学的一句话总结

香农信息熵公式是系规教材第 1 章的开篇——也是非数学背景同学最容易心理崩溃的题。但记住核心要诀：3 空填空 + 4 选项 = 用逐空对照消元法 + 等概率分布信息熵最大——你就能拿到 90% 的信息熵相关题。第 1 章其他 7 个高频考点（5 大基本概念 / 5 大特征 / 4 次浪潮 / 4 大组成 / 5 种系统思想 / 5 个集成层次 / 信息系统发展阶段）都是"记下来就能拿分"的实用知识——投入 8-10 小时啃完 = 综合知识里第 1 章 5-6 题稳拿。

十八、本周真题站延伸阅读建议

老孙建议你本周配合做下面 3 件延伸阅读：

延伸 1：找近 5 年（2019-2024）系规综合知识第 1 题——按本文第 4 节方法逐空消元做一遍。你会发现 5 年中 4 年第 1 题都属于第 1 章范围。

延伸 2：把第 1 章 7 大高频考点对应的教材原文页码标记出来——形成"页码索引卡"。考前 1 周翻这张卡 = 第 1 章核心 30 分钟过完。

延伸 3：找 1 位备考搭子互相提问——你问他"什么是 DIKW 金字塔"，他问你"信息熵公式怎么写"。互相提问 1 周后，你对第 1 章的掌握度比独自学习提升 50%。

十九、给同学的鼓励

第 1 章对很多非数学背景的同学是入门第一道门槛。如果你看完今天这一篇仍然觉得信息熵公式有点抽象，不要焦虑。老孙的提醒是：理解大于死记——你不需要在考场上重新推导公式，你只需要看到公式时能选对答案。慢慢来，按节奏推进，152 天里这种"抽象感"会被反复练习的真题一点点磨掉。

二十、明日预告

明天 6/1（周一）第 008 篇，老孙会写：

《6 月报系规的 3 类人 vs 不该报的 2 类人》

进入 6 月，系规报名工作即将启动。这一篇老孙会用决策框架告诉你：6 月这个时点报系规的 3 类典型同学 vs 不该在 6 月做决定的 2 类同学。如果你今天还在犹豫"6 月该不该按下报名键"，明天这一篇直接给你拍板依据。

明天见。