编码
- 字母表、字
- 字母表
是一个有限集,它生成的自由半群为
中的元素称为字。字的长度为
- 字母表
- 基本码字、码字
- 设
、
为字母表。如果
是单射,那么
称为编码,
中的元素称为基本码字
- 进一步,如果
的自由扩张
也是单射,那么
称为唯一译码的编码,
中的元素称为码字
- 设
唯一译码的编码
- 如果
为唯一译码的编码,那么
- 设长度为
的基本码字的个数为
的码字的个数为
- 一个长度为
的码字乘以一个长度为
的基本码字(
),或者一个长度为
的基本码字是一个长度为
的码字。也就是说,
为唯一译码的编码,所以相反方向的不等式、以及等式也成立。定义
,
。那么,
- 由于
,故
在
上为解析函数。另一方面,
在
上没有零点。由
,可得
,并且
- 设长度为
- 反过来,如果
满足
,使得
- 定义
,使得
,
- 由
,可得
,使得
。让
将
一一映射到
- 由
,可得
,
已经取定,并且满足
,那么,由于
,使得
,并且
将
一一映射到
- 由数学归纳法,我们可以得到编码
,满足
,
,并且
是唯一译码的编码,原因是如果一个码字有两种不同的译码方法,那么我们可以将其从左到右分解为基本码字,直到得到矛盾
- 定义
最小平均长度
- 设
为字母表(带有离散
-代数)。如果
是一个概率空间,那么
称为基本信源(Elementary Information Source,EIS)
- 如果
是一个EIS,那么唯一译码的编码
的平均长度为
- 进一步,最小平均长度为平均长度的理论极限,
- 下面我们证明,Shannon熵给出了最小平均长度的最佳估计。设
为EIS,并且
。我们有
时,
称为Shannon熵
- 由上面的笔记,
- 证明左侧不等式:
- 对任意
满足
,定义
- 由
得到,
- 对所有的
取下确界,左侧不等式成立
- 对任意
- 证明右侧不等式:
- 取
满足
- 那么,
- 取
- 由上面的笔记,