离散无记忆信源发出a,b两种符号,其概率分布为1/4,3/4.若信源输出的序列为babba,对其进行算术编码并计算编码效率
时间: 2023-06-10 21:06:42 浏览: 515
首先,我们需要计算这个序列的概率。根据独立性假设,整个序列的概率可以通过各个符号的概率相乘得出:
P(babba) = P(b) × P(a) × P(b) × P(b) × P(a) = (3/4) × (1/4) × (3/4) × (3/4) × (1/4) = 27/1024
接下来,我们可以使用算术编码来对这个序列进行编码。算术编码将整个序列编码为一个小数,范围在0到1之间。因为编码后的小数越长,它所代表的信息就越多,所以编码效率可以通过编码后的小数的位数来衡量。
具体实现步骤如下:
1. 初始化编码范围为[0,1)。
2. 对于序列中的每一个符号,将编码范围按照符号的概率进行等比例分割。例如,对于第一个符号b,如果它的概率是3/4,那么将编码范围分割为[0,3/4)和[3/4,1)两个部分,其中第一个部分对应的是b这个符号。
3. 重复步骤2,直到处理完整个序列。
4. 最后,编码结果为编码范围的中点。
对于这个序列,我们可以按照如下方式进行编码:
1. 初始化编码范围为[0,1),即0 <= 编码结果 < 1。
2. 对于第一个符号b,将编码范围分割为[0,3/4)和[3/4,1),其中第一个部分对应的是b这个符号。因此,编码范围更新为[0,3/4),编码结果取中点为0.375。
3. 对于第二个符号a,将编码范围分割为[0,1/4)和[1/4,3/4),其中第二个部分对应的是a这个符号。因此,编码范围更新为[1/4,3/4),编码结果取中点为0.5。
4. 对于第三个符号b,将编码范围分割为[1/4,5/16)和[5/16,3/4),其中第一个部分对应的是b这个符号。因此,编码范围更新为[1/4,5/16),编码结果取中点为0.3125。
5. 对于第四个符号b,将编码范围分割为[1/4,35/64)和[35/64,3/4),其中第一个部分对应的是b这个符号。因此,编码范围更新为[1/4,35/64),编码结果取中点为0.3984375。
6. 对于第五个符号a,将编码范围分割为[1/4,9/64)和[9/64,35/64),其中第二个部分对应的是a这个符号。因此,编码范围更新为[9/64,35/64),编码结果取中点为0.484375。
因此,整个序列的编码结果为0.375 × 0.5 × 0.3125 × 0.3984375 × 0.484375 = 0.0072345733642578125。
编码效率可以用编码结果的位数来衡量。将编码结果转化为二进制后,位数为22位。因此,编码效率为22/5 ≈ 4.4位/符号。
阅读全文