(2)
有损压缩:有损压缩是用压缩后的数据进行重构,重构后的数据与原来的数据有所
不同,但不影响人对原始资料表达的信息造成误解的数据压缩技术。有损压缩适用于重构数
据不一定非要和原始数据完全相同的应用。例如,图像、视像和声音数据就可采用有损压缩,
因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而
不至于对图像、视像或声音所表达的意思产生误解。
1.2.3 三种类型的编码
在数据压缩技术中,编码技术可分成三种类型:熵编码、源编码和混合编码,见表
1-1
。
(1)
熵编码:不考虑数据源的无损数据压缩技术。它把待编码的数据看成是不具媒体特
性的“纯数据”,不论数据代表的是文字、声音、图像还是视像,都把数据当作“符号”对
待。熵编码的核心思想是按照符号出现的概率大小给符号分配长度合适的代码,对常用的符
号给它分配长度较短
(
即位数较少
)
的代码,对不常用的符号给它分配长度较长
(
即位数较多
)
的代码。最常见的熵编码技术是霍夫曼编码和算术编码。
(2)
源编码:考虑数据源特性的数据压缩技术。编码时考虑信号源的特性和信号的内容,
因此也称
“
基于语义的编码
(semantic-based coding)”
。例如,图像编码考虑相邻像素的值可能
完全相同或相近,视像相邻帧之间的变化不大,也可能完全相同。为获得比较大的压缩比,
源编码通常采用有损数据编码技术。
(3)
混合编码:通常是指组合源编码和熵编码的数据有损压缩技术。影视、图像和声音
媒体几乎都采用这种编码方式,如
JPEG
,
MPEG-Video
和
MPEG-Audio
。
1.2.4 压缩与编码
从减少数据量的角度来看,多媒体数据压缩是取消或减少冗余数据的过程,而多媒体编
码是用代码替换文字、符号或数据的过程。根据这种观点,可将大部分压缩和编码技术归纳
在表
1-1
中。除矢量量化之外,其余的编码技术将在后续章节中陆续介绍。
表
1-1
压缩与编码技术
压缩类型
编码类型
编码技术
行程长度编码
(run-length coding)
霍夫曼
(Huffman coding)
无损压缩
(lossless
compression)
熵编码
(entropy coding)
统计编码
(statistical coding)
算术编码
(arithmetic coding)
差分脉冲编码调制
(DPCM)
预测
(prediction)
增量调制
(
delta modulation
)
快速傅里叶变换
(FFT)
离散余弦变换
(DCT)
变换
(transformation)
离散小波变换
(DWT)
二进制位的位置
(bit position)
子采样
(subsampling)
(
按重要性的
)
分层编
码
(layered coding)
子带编码
(subband coding)
源编码
(source coding)
矢量量化
* (vector quantization
,
VQ)
JPEG
,
JPEG 2000
MPEG-1
,
-2
,
-4
,
H.261~H.264
有损压缩
(lossy
compression)
混合编码
(hybrid coding)
其他专有的编码方法
*
矢量量化是一种数据有损压缩技术,它用待编码的数据块匹配预先定义的有限数目的码字
4