软考找老孙
软考找老孙guoruankao.com
真题解析2026-05-31

真题速评 001:2023 上综合第 1 题"香农信息熵公式"为什么选 A

系规免费连载第 7 篇。真题速评 001:2023 上综合第 1 题"香农信息熵公式"为什么选 A。老孙 152 天免费陪你备考 2026/10/24 系规考试。

系规

一、开篇:为什么真题速评从这道题开始

各位同学好,老孙在这里。

今天是 2026 年 5 月 31 日,距 10 月 24 日系规考试还剩 146 天

从今天起,每周日老孙固定一篇真题速评——拆解一道近 3 年系规真题(2023 上 / 2024 下 / 2025 下案例回忆版),讲清楚这题考什么、为什么选这个、易错点在哪、能延伸出哪些考点

第一期老孙故意选了 2023 年 5 月(上半年)综合知识第 1 题——香农信息熵公式题。

选这一题做开篇有 3 个理由:

  1. 它是系规教材第 1 章的"开篇第一题",多数同学翻开教材最先看到的就是这个概念
  2. 它是非数学背景同学最容易懵的一题——一看到 H(x) = -∑pᵢlogpᵢ 这种公式就头大
  3. 它是历年反复考查的题——2023 上、2018 上、2019 上 都出现过相似题型

读完今天这一篇,你不仅能记住这道题的答案,还能掌握所有围绕"信息熵"出题的解题套路


二、原题完整回顾

【2023 年 05 月 - 第 1 题】系规 - 第 1 章 信息系统综合知识

香农用概率来定量描述信息的公式如下,其中 H(x) 表示 x 的(),Pᵢ 是()出现第 i 种状态的(_)。

H(x) = -∑Pᵢ log Pᵢ

A. 信息熵 | 事件 | 概率 B. 总熵 | 单位 | 概率 C. 信息熵 | 单位 | 概率 D. 总熵 | 单位 | 度量

【参考答案】A

这是一道3 个空 + 4 个选项的复合判断题。需要同时判断 3 个填空位的对错——错任意一空就整道题挂。


三、3 个空怎么判断:用"对照消元法"

老孙的解题套路:先把 3 个空的可能选项摊开,再用排除法逐一消元

填空位可能选项排除分析
第 1 空信息熵 / 总熵"总熵"在信息论里不是标准术语——香农定义的是"信息熵"。排除 B、D
第 2 空事件 / 单位"Pᵢ 出现第 i 种状态" 这里描述的主语是事件(事件 X 出现各种状态),"单位"在这里语法不通——单位不会"出现状态"。排除 C
第 3 空概率 / 度量因为前面已经说"用概率描述信息",第 3 空指 Pᵢ 出现状态的概率。"度量"是名词级别更高的概念,不合排除 D

3 步排除后,只剩 A 是唯一自洽答案

老孙的话:这种"3 空填空 + 4 选项"的题,70% 同学错在没逐空消元,只看了第 1 空就选。培养"逐空对照"的习惯,能避免至少 5 道这种复合题的失分。


四、信息熵到底是什么:用最简单的语言讲清楚

很多同学对这道题的真正障碍不是选项分析,而是看不懂信息熵公式本身

老孙用最日常的比喻解释一遍:

比喻:抛硬币 vs 掷骰子的"不确定性"

场景可能结果数不确定性大小信息熵
抛 1 枚均匀硬币2(正 / 反)较小1 bit
掷 1 个均匀 6 面骰子6(1-6)较大约 2.58 bit
掷 1 个均匀 8 面骰子8更大3 bit
抛已知作弊硬币(一定出正)1(确定)00 bit

信息熵 = 不确定性的量化指标。结果越多 + 各结果概率越接近 → 不确定性越大 → 信息熵越大。

公式 H(x) = -∑Pᵢ log Pᵢ 拆解

符号含义
H(x)事件 x 的信息熵(不确定性大小)
Pᵢ事件第 i 种结果出现的概率
log Pᵢ概率的对数(数学上的转换技巧)
-∑把每种结果的"概率 × log 概率"加起来,前面加负号让结果为正

为什么前面加负号? 因为概率 Pᵢ 在 0-1 之间,log Pᵢ 是负数。加负号让 H(x) 变成正数(更直观)。

为什么用对数? 这是香农 1948 年论文里的数学技巧——用对数让"独立事件的信息量可加"。比如抛 2 枚硬币的信息量 = 抛 1 枚硬币的信息量 × 2。

单位是什么? 当 log 用 2 为底(log₂),单位是 比特(bit)——这也是计算机存储的基本单位。


五、这一题延伸出的 5 个常考考点

老孙带学员时发现,搞懂 1 道真题 = 能应对 5 道相似题。这一题延伸的高频考点如下:

延伸考点 1:信息熵的单位(bit / nat / Hart)

  • log₂ 为底 → 单位是 比特(bit)
  • ln 为底(自然对数)→ 单位是 奈特(nat)
  • log₁₀ 为底 → 单位是 哈特(Hart)

老孙的话:考试里最常考的是 bit。这 3 个单位的换算关系不是高频考点,知道即可。

延伸考点 2:信息熵的最大值与最小值

  • 最大值:所有结果等概率出现时(如均匀硬币),信息熵最大
    • n 种结果的最大信息熵 = log₂ n
  • 最小值:某一种结果概率为 1(确定事件),信息熵 = 0

考题示例:"5 种结果等概率出现,信息熵是多少?" → log₂ 5 ≈ 2.32 bit

延伸考点 3:信源 / 信宿 / 信道 / 噪声

香农的信息论 5 大概念:

概念含义现实例子
信源信息的发出者你说话的嘴
信宿信息的接收者对方的耳朵
信道信息传输的介质中间的空气
噪声干扰信号的因素嘈杂背景音
编码 / 解码信息表达 / 还原普通话发音 / 听音辨意

这 5 个概念几乎每年综合知识必考 1-2 题

延伸考点 4:数据 vs 信息 vs 知识 vs 智慧(DIKW 金字塔)

层级定义例子
数据 Data原始符号36.8(一串数字)
信息 Information有意义的数据体温 36.8℃(正常)
知识 Knowledge信息的规律体温 36-37℃ 是健康范围
智慧 Wisdom知识的运用判断体温异常应何时就医

DIKW 金字塔在 2023 上 / 2024 下 都考过相似题——必背概念图

延伸考点 5:信息的特征(5 大特征)

  1. 客观性:信息是客观存在的
  2. 普遍性:信息无处不在
  3. 可识别性:可以被感知
  4. 可存储性:可以被记录
  5. 可传递性:可以被传播

这 5 大特征多数年份会有 1 道选择题考其中 1 个


六、这道题的"考试出题逻辑"反推

把这一题放在系规综合知识 75 题里看,它属于"开胃菜难度"——出在第 1 题位置,目的是给考生一个"我能搞定"的心理暗示

如果你第 1 题就懵了,后面 74 题的状态会受影响

老孙给的应对策略:

  1. 考前必须把第 1 章的所有概念性题型做一遍——信息熵、DIKW、5 大特征、信源信道
  2. 见到公式不要慌——系规综合的公式题大多只需要理解概念,不需要真做计算
  3. 进考场后第 1 题如果卡住,先标记跳过——系规支持机考标记跳过功能,别在第 1 题浪费时间影响后续状态

七、3 道相似题练手(自测)

老孙给你 3 道结构类似的题,你可以试着自己解一下:

自测题 1(仿 2018 上)

香农信息熵的最大值出现在()情况下。

A. 概率分布均匀 B. 单一结果概率为 1 C. 结果数量最多 D. 噪声最小

老孙提示:见前文"延伸考点 2"。

自测题 2(仿 2019 上)

DIKW 金字塔中,"36.8 ℃ 是正常体温" 属于()层级。

A. 数据 B. 信息 C. 知识 D. 智慧

老孙提示:见前文"延伸考点 4"。

自测题 3(仿 2022 上)

下列哪一项不是信息的基本特征()。

A. 客观性 B. 可识别性 C. 可计算性 D. 可传递性

老孙提示:见前文"延伸考点 5"。


八、本周作业:复习第 1 章 + 自建错题本

读完今天这一篇,建议你本周做 2 件事:

  1. 翻教材第 1 章信息系统综合知识 → 重点画 5 个延伸考点对应的页码
  2. 建立错题本 → 把这道 2023 上第 1 题 + 3 道自测题抄下来,记下你的错处 + 老孙的解析

错题本不是"做完就丢"——它是你考前 1 周回炉的"高频题清单"。


九、信息熵的现实应用:用 4 个生活案例帮你"真懂"

非数学背景的同学只靠公式背是不够的。老孙用 4 个生活案例帮你真懂信息熵——理解了就不会忘了。

案例 1:天气预报为什么"明天 100% 下雨"价值最高?

假设你是一个农民。

  • 没有天气预报时:你不知道明天是晴是雨——信息熵 = 1 bit(两种可能性)
  • 天气预报说"明天 50% 概率下雨":你的不确定性没有降低——信息熵 = 1 bit
  • 天气预报说"明天 100% 下雨":你完全知道了——信息熵 = 0 bit

信息熵的减少量 = 天气预报对你的真实价值。从 1 bit 降到 0 bit = 这条预报值 1 bit 的信息。

应用到 IT 项目:你监控一台服务器的 CPU 使用率。如果监控系统每分钟告诉你"CPU 在 0-100% 之间"——这是没用的信息(信息熵没降)。如果监控系统告诉你"CPU 在 95-100% 区间"——这才降低了你的不确定性(信息熵降低了)。

案例 2:彩票为什么"双色球"信息量比"刮刮乐"大?

  • 刮刮乐:你刮开就知道中没中——结果只有 2 种
  • 双色球:6 + 1 个号码组合 = 约 1700 万种结果

按 H = log₂ n 公式计算:

  • 刮刮乐信息熵 = log₂ 2 = 1 bit
  • 双色球信息熵 = log₂ (1700 万) ≈ 24 bit

双色球的信息量是刮刮乐的 24 倍——也是你中奖概率低 1700 万倍的根本原因。

案例 3:26 个英文字母为什么比 10 个数字"信息密度高"?

  • 1 位英文字母 = log₂ 26 ≈ 4.7 bit
  • 1 位数字 = log₂ 10 ≈ 3.3 bit

这就是为什么短链接服务用字母而不用纯数字——同样 8 位长度:

  • 8 位字母 = 4.7 × 8 = 37.6 bit(可表示约 2000 亿个不同链接)
  • 8 位数字 = 3.3 × 8 = 26.4 bit(可表示约 1 亿个不同链接)

字母的信息密度高了 2000 倍。

案例 4:身份证号为什么是 18 位不是 10 位?

中国人口约 14 亿 ≈ 2³¹。

按 H = log₂ n:

  • 中国身份证至少需要 31 bit 才能区分每一个人
  • 1 个汉字数字 = 3.3 bit,需要 10 位数字 才达到 31 bit
  • 但身份证还要 编码区域 + 出生日期 + 性别 + 校验位,所以总位数升到 18

身份证的设计完全遵循信息熵的数学约束


十、信息熵在系规考试里的 5 种典型出题方式

老孙整理了近 8 年系规综合知识里所有涉及信息熵的题,总结出 5 种典型出题方式——见到这 5 种就秒选:

出题方式 1:公式直接判断(占 40%)

"下列哪个公式是香农信息熵的标准定义?"

应对:背公式 H(x) = -∑Pᵢ log Pᵢ + 记口诀("减求和概对概" = -∑Pᵢlog Pᵢ)

出题方式 2:单位判断(占 20%)

"log 以 2 为底时,信息熵的单位是?"

应对:背 3 个单位(bit / nat / Hart)

出题方式 3:场景应用(占 15%)

"下列哪种情况下信息熵最大?"

应对:记住"等概率分布 → 信息熵最大"

出题方式 4:信源 / 信宿等概念区分(占 15%)

"下列哪一项不是香农通信模型的组成?"

应对:背 5 大组成(信源、信宿、信道、噪声、编码 / 解码)

出题方式 5:DIKW 金字塔(占 10%)

"下列描述属于 DIKW 金字塔的哪一层?"

应对:背 4 层(数据 / 信息 / 知识 / 智慧)

5 种出题方式 + 对应应对 = 你能拿到信息熵相关题的 90% 分。


十一、3 类典型同学读这道题后的反应

老孙带学员时观察,不同背景的同学读这道题反应截然不同

反应 1:理工科背景同学(程序员 / 工程师)

"这题不就是大学《信息论与编码》的开篇例题吗?我大学考过 90 分。"

老孙的提醒:你对公式熟悉,但不一定记得"哪些场景下信息熵最大"等扩展知识点。把第 9 节的 5 个案例 + 第 10 节的 5 种出题方式都过一遍,确认你能扛住扩展题。

反应 2:管理 / 文科背景同学(事业单位综合岗 / 行政管理)

"公式我看不懂,但我能记住答案 A。"

老孙的提醒:只记答案是不够的。考场上变种题就懵了。把第 4 节"用最简单的语言讲清楚" + 第 9 节生活案例反复读 3 遍——理解 > 记忆

反应 3:完全跨行业背景同学(医务 / 教师 / 创业者)

"我打开教材第 1 章就看到这个公式,直接放弃了第 1 章。"

老孙的提醒:第 1 章是 A 档章节,每年综合知识 5-6 题——放弃 = 直接送分。第 1 章的难点只有公式题这一个,其他都是概念题。绕过公式部分先学其他,最后再回头啃公式。


十二、本周作业升级版:3 道真题 + 5 道延伸

读完今天这一篇,老孙建议你本周完成下面 2 件事

事 1:把这 1 道真题 + 3 道自测题彻底掌握

  • 用电脑做 1 遍(机考模拟)
  • 写下你的解题思路
  • 对照本文检查

事 2:找 5 道"信息熵 / DIKW / 信源信道 / 信息特征"延伸真题

  • 教材第 1 章配套习题
  • 历年综合知识真题(2017-2024)
  • 老孙以后会陆续讲

十三、教材第 1 章其他高频考点速览

第 1 章除信息熵之外,还有 7 个高频考点——老孙一次性给你过完,这一章就基本拿下。

高频考点 1:信息系统的 5 大基本概念

教材开篇定义了 5 大基本概念,考试经常给 1 个定义让你判断是哪个概念

概念定义
数据客观事物的符号表示(最原始)
信息经过加工的、有意义的数据
知识经过分析、抽象、提炼的规律性认识
智慧基于知识做出正确判断和决策的能力
数据资产由组织拥有或控制、能够产生经济价值的数据资源

高频考点 2:信息系统的 5 大特征

  1. 目的性:信息系统是为特定目标而建
  2. 整体性:组件相互关联,不能割裂
  3. 层次性:多层结构(输入 / 处理 / 输出 / 反馈)
  4. 环境适应性:根据外部环境变化调整
  5. 目的性可达性:通过组件协作实现目的

高频考点 3:信息系统的发展阶段

阶段时期代表系统
数据处理(EDP)1950-1960s工资 / 库存系统
管理信息系统(MIS)1960-1970sERP 雏形
决策支持系统(DSS)1970-1980s高管决策
智能信息系统1980-2000s专家系统
互联网 + AI 信息系统2010s 至今大数据、云计算、AI 应用

高频考点 4:信息技术的 4 次浪潮

  1. 机械化(蒸汽机时代)
  2. 电气化(电力时代)
  3. 信息化(计算机 + 互联网)
  4. 智能化(AI + 大数据 + 云)

高频考点 5:信息系统的 4 大组成

  • 硬件:计算机 / 网络设备 / 存储
  • 软件:操作系统 / 中间件 / 应用软件
  • 数据:业务数据 / 元数据 / 日志
  • 人员 + 流程:用户 / 管理员 / 业务流程

高频考点 6:5 种系统思想(与第 3 章呼应)

  1. 整体思想
  2. 联系思想
  3. 发展思想
  4. 矛盾思想
  5. 实践思想

高频考点 7:信息系统集成的 5 个层次

  • 设备 / 硬件集成
  • 数据集成
  • 应用集成
  • 业务集成
  • 战略集成

老孙的话:上面 7 个考点 + 本文前面的"信息熵 + 5 延伸"= 第 1 章 95% 的题你都能拿下。


十四、第 1 章备考的 3 周节奏建议

按老孙第 004 篇的 22 周节奏,第 1 章的最佳备考时段是阶段 1 后期 + 阶段 2 第 1 周

第 6-7 周(7/1 - 7/14):第 1 章首遍精读

  • 任务:通读教材第 1 章约 30 页
  • 重点:画出"信息熵 + 5 大基本概念 + 5 大特征 + 4 次浪潮 + 4 大组成 + 5 种系统思想 + 5 个集成层次"7 大考点
  • 题量:配 30-40 道近 5 年真题
  • 时长:约 8-10 小时

第 7 周后半段:第 1 章错题整理

  • 把第 1 章做错的题抄到错题本
  • 写下"为什么错 + 教材原文页码"
  • 错题本结构:题目 → 我的错误答案 → 正确答案 → 错因分析 → 教材锚定

第 8 周(7/15 - 7/21):第 1 章与第 2 章衔接

  • 第 1 章末尾的"信息系统集成 5 个层次"与第 2 章"数字中国"概念呼应
  • 把两章的"政策类考点"汇总成一张"政策考点速记表"

十五、第 1 章可能出现的 5 种"陷阱题"

老孙整理了近 8 年第 1 章里出现过的"陷阱题"——这 5 种陷阱不知道 = 直接送分:

陷阱 1:用"知识"考"信息"的定义

"下列对'信息'的描述正确的是()"

陷阱选项:A. 经过加工的、有意义的数据;B. 客观事物的符号表示;C. 经过分析提炼的规律性认识;D. 由组织拥有的数据资源。

陷阱:A 是信息的定义,但 B 是数据、C 是知识、D 是数据资产——选错就掉坑。

陷阱 2:用"DSS"考"MIS"

"下列哪个系统主要支持企业高层决策?"

陷阱:MIS 是管理信息系统(多数情况下选 MIS),但实际答案是 DSS 决策支持系统——专门为高层决策设计。

陷阱 3:用"4 次浪潮"考"5 次浪潮"

"信息技术发展历经几次浪潮?"

教材是 4 次浪潮(机械 + 电气 + 信息 + 智能)。但部分老资料写 5 次——别用老资料的口径。

陷阱 4:用"信息系统组成"考"4 大"vs"5 大"

教材是 4 大组成(硬件 + 软件 + 数据 + 人员/流程)。陷阱选项可能列 5 大(拆分人员和流程为 2 项)——选 4 大。

陷阱 5:用"信息熵公式"考最大 / 最小值场景

老孙在本文第 5 节已经讲过——等概率分布时信息熵最大确定事件时信息熵 = 0。这是高频考点。


十六、本周 1 道完整作业题(含老孙批改示范)

老孙给你 1 道完整的第 1 章自测题——你先做,再对照老孙的批改示范学习。

作业题

假设某通信信道传输 4 种字符(A、B、C、D),其出现概率分别为 P(A)=0.5、P(B)=0.25、P(C)=0.125、P(D)=0.125。计算该信道的信息熵。

你的作答区

H(x) = -[ 0.5 × log₂(0.5) + 0.25 × log₂(0.25) + 0.125 × log₂(0.125) + 0.125 × log₂(0.125) ]

老孙批改示范

H(x) = -[ 0.5 × (-1) + 0.25 × (-2) + 0.125 × (-3) + 0.125 × (-3) ]

H(x) = -[ -0.5 - 0.5 - 0.375 - 0.375 ]

H(x) = -[ -1.75 ]

H(x) = 1.75 bit

解读

  • 4 种字符等概率时,信息熵 = log₂ 4 = 2 bit(最大值)
  • 现在不等概率,信息熵 1.75 bit < 2 bit
  • 概率分布越不均匀,信息熵越小——这就是"等概率分布信息熵最大"的数学证明

这道题在系规综合知识里属于简单计算题——会做意味着你掌握了第 1 章计算类考点的精髓。不会做也没关系——这种题在 75 题里最多出 1-2 道,重点保证概念题不丢分即可。


十七、给同学的一句话总结

香农信息熵公式是系规教材第 1 章的开篇——也是非数学背景同学最容易心理崩溃的题。但记住核心要诀:3 空填空 + 4 选项 = 用逐空对照消元法 + 等概率分布信息熵最大——你就能拿到 90% 的信息熵相关题。第 1 章其他 7 个高频考点(5 大基本概念 / 5 大特征 / 4 次浪潮 / 4 大组成 / 5 种系统思想 / 5 个集成层次 / 信息系统发展阶段)都是"记下来就能拿分"的实用知识——投入 8-10 小时啃完 = 综合知识里第 1 章 5-6 题稳拿。


十八、本周真题站延伸阅读建议

老孙建议你本周配合做下面 3 件延伸阅读:

延伸 1:找近 5 年(2019-2024)系规综合知识第 1 题——按本文第 4 节方法逐空消元做一遍。你会发现 5 年中 4 年第 1 题都属于第 1 章范围。

延伸 2:把第 1 章 7 大高频考点对应的教材原文页码标记出来——形成"页码索引卡"。考前 1 周翻这张卡 = 第 1 章核心 30 分钟过完。

延伸 3:找 1 位备考搭子互相提问——你问他"什么是 DIKW 金字塔",他问你"信息熵公式怎么写"。互相提问 1 周后,你对第 1 章的掌握度比独自学习提升 50%


十九、给同学的鼓励

第 1 章对很多非数学背景的同学是入门第一道门槛。如果你看完今天这一篇仍然觉得信息熵公式有点抽象,不要焦虑。老孙的提醒是:理解大于死记——你不需要在考场上重新推导公式,你只需要看到公式时能选对答案。慢慢来,按节奏推进,152 天里这种"抽象感"会被反复练习的真题一点点磨掉


二十、明日预告

明天 6/1(周一)第 008 篇,老孙会写:

《6 月报系规的 3 类人 vs 不该报的 2 类人》

进入 6 月,系规报名工作即将启动。这一篇老孙会用决策框架告诉你:6 月这个时点报系规的 3 类典型同学 vs 不该在 6 月做决定的 2 类同学。如果你今天还在犹豫"6 月该不该按下报名键",明天这一篇直接给你拍板依据。

明天见。

相关阅读


老孙的免费连载到 10/24 系规考试共 152 篇,每天一篇。看完想跟老孙聊聊备考路径,加我微信告诉你的报考状态,老孙给你一份匹配你时间的建议。

老孙微信

文 / 老孙

20年一线IT老兵,软考高级培训导师。有问题随时加微信聊。

联系老孙

相关文章

软考核心专题

深入了解软考各个科目和服务方向

备考指南

从基础认知到通关策略,老孙带你走完整个备考路径

意见反馈
回到顶部咨询