没有合适的资源?快使用搜索试试~ 我知道了~
首页多媒体编解码学习资料详细介绍
多媒体编解码学习资料详细介绍
5星 · 超过95%的资源 需积分: 34 79 下载量 109 浏览量
更新于2023-03-03
评论 2
收藏 625KB PDF 举报
编解码学习笔记(一):基本概念 2 编解码学习笔记(二):codec类型 6 编解码学习笔记(三):Mpeg系列——Mpeg 1和Mpeg 2 10 编解码学习笔记(四):Mpeg系列——Mpeg 4 20 编解码学习笔记(五):Mpeg系列——AAC音频 29 编解码学习笔记(六):H.26x系列 31 编解码学习笔记(七):微软Windows Media系列 35 编解码学习笔记(八):Real系列 43 编解码学习笔记(九):QuickTime系列 46 编解码学习笔记(十):Ogg系列 51 编解码学习笔记(十一):Flash Video系列 55 编解码学习笔记(十二):其他编解码 59 编解码学习笔记(十三):容器(上篇) 62 编解码学习笔记(十四):容器(下篇) 67
资源详情
资源评论
资源推荐
integrated documents from the network resource http://zhaixishan.cublog.cn
编解码学习笔记
目录:
编解码学习笔记(一):基本概念.................................................................................................2
编解码学习笔记(二):codec类型 ...............................................................................................6
编解码学习笔记(三):Mpe
g系列——Mpeg 1 和Mpeg 2........................................................10
编解码学习笔记(四):Mpe
g系列——Mpeg 4 .........................................................................20
编解码学习笔记(五):Mpe
g系列——AAC音频 .....................................................................29
编解码学习笔记(六):H
.26x系列.............................................................................................31
编解码学习笔记(七):微
软Windows Media系列.....................................................................35
编解码学习笔记(八):Real系列 ...............................................................................................43
编解码学习笔记(九):Quick
Time系列.....................................................................................46
编解码学习笔记(十):Og
g系列................................................................................................51
编解码学习笔记(十一):Flash V
ideo系列................................................................................55
编解码学习笔记(十二):其他编解码.......................................................................................59
编解码学习笔记(十三):容器(上篇)...................................................................................62
编解码学习笔记(十四):容器(下篇)...................................................................................67
1
integrated documents from the network resource http://zhaixishan.cublog.cn
编解码学习笔记(一):基本概念
媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用
开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、
释放 license 收费等等。最近因为项目的关系,需要理清媒体的 codec,比较搞
的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不
同的要求,而且有些要求就我看来应当是历史的延续,也就是现 在已经很少采
用了。所以豆丁上看不出所以然,从 wiki 上查。中文的 wiki 信息量有限,很短,
而 wiki 的英文内容内多,删减版也减肥得太过。我在网上 还看到一个山寨的中
文 wiki,长得很像,红色的,叫“天下维客”。wiki 的中文还是很不错的,但
是阅读后建议再阅读英文。
我对媒体 codec 做了一些整理和总结,资料来源于 wiki,小部分来源于网
络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁
过留声,我们只能给出某个轨迹。
基本概念
编解码
编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换 的
设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传
输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理
从 这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会
议和流媒体等应用中。
容器
很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些
用 于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的
程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是
被封装在 一起的。通常这种封装是通过视频文件格式来实现的,例如常见的
*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使
用某些编解码器,而更多可以以容器的方式使用各种编解码器。
FourCC 全称 Four-Character Codes,是由 4 个字符(4 bytes)组成,是一
种独立标示视频数据流格式的四字节,在 wav、avi 档案之中会有一段 FourCC
来描述这个 AVI 档案,是利用何种 codec 来 编码的。因此 wav、avi 大量存在等
于“IDP3”的 FourCC。
视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人
们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回
2
integrated documents from the network resource http://zhaixishan.cublog.cn
放。视频档实际上都是一个容器里面 包裹着不同的轨道,使用的容器的格式关
系到视频档的可扩展性。
参数介绍
采样率
采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组
成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期
或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,
亦称“位速率”)相混淆。
采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说
法 是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是 100Hz,那
么为了避免混叠现象采样频率必须大于 200Hz。换句话说就是采样频率必须至少
是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。
对于语音采样:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz
22,050 Hz - 无线电广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用
采样率
47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录
音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字
声音所用采样率
50,000 Hz - 二十世纪七十年代后期出现的 3M 和 Soundstream 开发的
第一款商用数字录音机所用采样率
50,400 Hz - 三菱 X-80 数字录音机所用所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、Blu-ray
Disc(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
2.8224 MHz - SACD、 索尼 和 飞利浦 联合开发的称为 Direct Stream
Digital 的 1 位 sigma-delta modulation 过程所用采样率。
在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。图像
采样频率是传感器积分周期的循环速度。由于积分周期远远小于重复所需时间,
采样频率可能与采样时间的倒数不同。
50 Hz - PAL 视频
60 / 1.001 Hz - NTSC 视频
3
integrated documents from the network resource http://zhaixishan.cublog.cn
当模拟视频转换为数字视频的时候,出现另外一种不同的采样过程,这次是
使用像素频率。一些常见的像素采样率有:
13.5 MHz - CCIR 601、D1 video
分辨率
分辨率,泛指量测或显示系统对细节的分辨能力。此概念可以用时间、空间
等 领域的量测。日常用语中之分辨率多用于图像的清晰度。分辨率越高代表图
像品质越好,越能表现出更多的细节。但相对的,因为纪录的信息越多,文件也
就会越 大。目前个人电脑里的图像,可以使用图像处理软件,调整图像的大小、
编修照片等。例如 photoshop,或是 photoimpact 等软件。
图像分辨率 :
用以描述图像细节分辨能力,同样适用于数字图像、胶卷图像、及其他类型
图 像。常用'线每毫米'、 '线每英吋'等来衡量。通常,“分辨率”被表示成每
一个方向上的像素数量,比如 640x480 等。而在某些情况下,它也可以同时表示
成“每英吋像素” (pixels per inch,ppi)以及图形的长度和宽度。比如 72ppi,
和 8x6 英吋。
视频分辨率 :
各种电视规格分辨率比较视 频的画面大小称为“分辨率”。数位视频以像素为
度量单位,而类比视频以水平扫瞄线数量为度量单位。标清电视频号分辨率为
720/704/640x480i60(NTSC)或 768/720x576i50(PAL/SECAM)。新的高清电视
(HDTV)分辨率可达 1920x1080p60,即每条水平扫瞄线有 1920 个像素,每个画
面有 1080 条扫瞄线,以每秒钟 60 张画面的速度播放。
画面更新率fps
Frame rate 中文常译为“画面更新率”或“帧率”,是指视频格式每秒钟
播放的静态画面数量。典型的画面更新率由早期的每秒6或8张(frame per
second,简称 fps),至现今的每秒 120 张不等。PAL (欧洲,亚洲,澳洲等地
的电视广播格式) 与 SECAM (法国,俄国,部分非洲等地的电视广播格式) 规定
其更新率为 25fps,而 NTSC (美国,加拿大,日本等地的电视广播格式) 则规定
其更新率为 29.97 fps。电影胶卷则是以稍慢的 24fps 在拍摄,这使得各国电视
广播在播映电影时需要一些复杂的转换手续(参考 Telecine 转换)。要达成最
基本的视 觉暂留效果大约需要 10fps 的速度。
压缩方法
有损压缩和无损压缩
4
integrated documents from the network resource http://zhaixishan.cublog.cn
在视频压缩中有损 (Lossy )和无损(Lossless)的概念与静态图像中基
本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采
用 RLE 行程编码算法。有损 压缩意味着解压缩后的数据与压缩前的数据不一致。
在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的
信息不可恢复。几乎所有高压缩 的算法都采用有损压缩,这样才能达到低数据
率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩
后的效果一般越差。此外,某些有损压 缩算法采用多次重复压缩的方式,这样
还会引起额外的数据丢失。
无损格式,例如 WAV,PCM,TTA,FLAC,AU,APE,TAK,WavPack(WV)
有损格式,例如 MP3,Windows Media Audio(WMA),Ogg Vorbis(OGG),
AAC
帧内压缩和帧间压缩
帧内 (Intraframe)压缩也称为空间压缩(Spatial compression)。当压
缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与
静态图像压缩类似。帧内一般采用有损压缩算法, 由于帧内压缩时各个帧之间
没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一
般达不到很高的压缩。
采用帧间 (Interframe)压缩是基于许多视频或动画的连续前后两帧具有
很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧
之间具有 冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提
高压缩量,减小压缩比。帧间压缩也称为时间压缩 (Temporalcompression),
它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差
值(Frame differencing)算法是一种典型的时间压缩法,它通过比较本帧与相
邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。
对称编码和不对称编码
对称性 (symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压
缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视
频会议 应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应
用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称
(asymmetric)编码。不对称或非对称意味着压缩时需要花费大量的处理能力和
时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解 压缩。
一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,
压缩一段三分钟的视频片断可能需要 10 多分钟的时间,而该片断实时回放 时间
只有三分钟。
5
剩余69页未读,继续阅读
zhaixishan
- 粉丝: 3
- 资源: 10
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- ExcelVBA中的Range和Cells用法说明.pdf
- 基于单片机的电梯控制模型设计.doc
- 主成分分析和因子分析.pptx
- 共享笔记服务系统论文.doc
- 基于数据治理体系的数据中台实践分享.pptx
- 变压器的铭牌和额定值.pptx
- 计算机网络课程设计报告--用winsock设计Ping应用程序.doc
- 高电压技术课件:第03章 液体和固体介质的电气特性.pdf
- Oracle商务智能精华介绍.pptx
- 基于单片机的输液滴速控制系统设计文档.doc
- dw考试题 5套.pdf
- 学生档案管理系统详细设计说明书.doc
- 操作系统PPT课件.pptx
- 智慧路边停车管理系统方案.pptx
- 【企业内控系列】企业内部控制之人力资源管理控制(17页).doc
- 温度传感器分类与特点.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论10