没有合适的资源?快使用搜索试试~ 我知道了~
首页多媒体技术 PDF 清晰
资源详情
资源评论
资源推荐
多媒体技术
第一章 绪 论
1 有关多媒体的基本概念
·多媒体信息处理技术:是指能够同时捕捉、处理、编辑、存储和播放两种以上不同类型信息媒体的
技术。常见信息媒体类型包括:文本、图形、图像、动画、音频、视频等。
· 静态媒体与连续媒体:
静态媒体(如文本)是没有时间维的媒体,即其播放速度不会影响所含信息的再现。
连续媒体(如视频和音频)是由媒体“量子”(如音频采样和视频帧)组成的,具有隐含的时间维,
播放速度影响其所含信息的再现,因此,需要在一段特定的时间里按特定的速度播放;如果播放速度得不
到满足,媒体信息的完整性就会受到影响。
· 捕捉媒体与合成媒体
捕捉媒体是指从现实世界中捕捉到的真实媒体信息。
合成媒体是指通过计算机合成的媒体。
2 单机与网络化多媒体
单机多媒体是指完全由本机提供多媒体应用所需的全部资源。例如,基于计算机的培训与教育(CBT
与 CBE)、多媒体制作、多媒体写作、多媒体演示。多媒体计算机
网络多媒体是指基于计算机网络(LAN,MAN,WAN)的多媒体应用。例如,多媒体电子邮件、计
算机会议、Internet 电话,等等。多采用客户/服务器模式,也有对等模式。
3 多媒体应用领域
· 多媒体出版
· 多媒体办公自动化系统
· 计算机会议
· 多媒体信息查询系统
· 交互式电视与视频点播
· 交互式影院与数字化电影
· 数字化图书馆
· 家庭信息中心:回家工作
· 远程教育
·
远程医疗
· 计算机支持下的协同工作(Computer Supported Cooperative Work)
· 媒体空间(MediaSpace)与赛博(CyberSpace)空间
将办公室、公共活动区、公共资源设备等通过计算机网络互联起来,形成超越时空距离的环境,供工
作人员交换信息、传递数据或进行讨论,就形成了所谓的媒体空间。
当媒体空间发展到相当大的范围,信息内容极其丰富,用户访问的界面更加方便而且更具沉浸感时,
就成为赛博空间。
· 虚拟现实(Virtual Reality)
第二章 数字化多媒体系统
1 基本概念
计算机化的数字式多媒体信息系统。
数字式不等于计算机化。例如,数字式影碟机就不能称为是数字化多媒体系统。
2 基本特征
· 计算机化
至少对终端用户来说媒体信息的播放是由计算机控制的。
· 集成化
涉及的设备的类型与数量尽可能地单一。包括存储集成化、捕捉集成化、播放集成化、网络集成化
(ISDN 与 ISPN)
· 数字化
主要是指媒体信息表示的数字化
模拟信号-->数字信号:采样、量化、编码、AD/DA
优点:有利于计算机化与集成化,方便存储、传输与处理
缺点:失真
权衡:数字化的精确性(采样速率与编码位数)与(存储器与网络)带宽
· 交互性
四种用户定制化程度:媒体播放开始时间、媒体播放次序、媒体播放速度、播放形式
第三章 常见媒体类型
1 文本
· 非格式化文本:可以使用的字符个数有限(即简单的字符集,如 ASCII)而且通常字符的大小固定,仅
能按照一种形式和内容使用。纯文本文件
· 格式化文本:字符集丰富(如增加罗马字母、各种特殊符号),多种字体、多种大小、多种排版格式。
文本外观可与印刷文本媲美。
2 图形与图像
· 图形:是可修正的文件,在文件格式中必须包含结构化信息即语义内容被包含在对图形的描述中,作为
一个对象存储。一般是用图形编辑器产生或者由程序产生,因此也常被称作计算机图形。
· 图像:是不可修正的,在文本格式中没有任何结构信息,因此没有保存任何语义内容,作为位图存储。
图像有两种来源:扫描静态图像和合成静态图像。前者是通过扫描仪、普通相机与模数转换装置、数字
相机等从现实世界中捕捉;后者是由计算机辅助创建或生成,即通过程序、屏幕截取等生成。
象素是图象数字化的基本单位。每一个象素对应一个数值,称为象素的振幅。数字化位数称为振幅深
度或者象素深度,如 1(黑白图象)和 24(真彩色图象)
3 视频与动画
·帧:一个完整且独立的窗口视图,作为要播放的视图序列的一个组成部分。它可能占据整个屏幕,
也可能只占据屏幕的一部分。
·帧速率:每秒播放的帧数。两幅连续帧之间的播放时间间隔即延时通常是恒定的。
在什么样的帧速率下会开始产生平稳运动的印象取决于个体与被播放事物的性质。通常,平稳运动印
象大约开始于每秒 16 帧的帧速率。
电影 24 帧/秒。美日电视标准 30 帧/秒,欧洲 25 帧/秒。HDTV60 帧/秒。
·视频(运动图象):以位图形式存储,因此缺乏语义描述,需要较大的存储能力,分为捕捉运动视
频与合成运动视频。前者是通过普通摄像机与模数转换装置、数字摄像机等从现实世界中捕捉;后者是由
计算机辅助创建或生成,即通过程序、屏幕截取等生成。
·动画(运动图形):存储对象及其时空关系,因此带有语义信息,但是在播放时需要通过计算才能
生成相应的视图。通常是通过动画制作工具或程序生成。
4 声音
录制、存储、播放与合成
5 其他类型媒体
以上媒体类型实质上只涉及到视听。人类的认知媒体除此之外还包括触觉、味觉、嗅觉等。因此,多
媒体与多感知是两个不同的概念。
第四章 多媒体数据压缩
1 基本概念
数字化的音频与视频信息的数据量极其庞大-->数据存储与网络带宽的压力极大-->需要压缩
多媒体信息存在自然冗余,例如,帧与帧之间的象素具有极大的相关性-->能够压缩
无损压缩与有损压缩
衡量一种数据压缩技术优劣的指标:压缩比、压缩算法是否适于实现、恢复效果
2 常见压缩标准
2.1 ISO 指定的国际标准
. JPEG 标准
JPEG(Joint Photographic Expert Group)小组 1991 年 3 月提出了 ISO CD10918 号建议草案:“多灰
度静止图象的数据压缩编码”,用于连续色调灰度级或彩色图象的压缩标准,采用离散余弦变换、量化、
行程与哈夫曼编码等技术,支持几种操作模式,包括无损(压缩比 2:1)与各种类型的有损模式(压缩比
可达 30:1 且没有明显的品质退化)。
Motion JPEG-->Motion Video
.JBIG 标准
JBIG(Joint Bi-level Image Group)是一种无损的二值图象压缩标准。JBIG 可以支持很高的图象分辨
率,常用的文件格式为 1728×2376 或 2304×2896,压缩比可达 10:1。
虽然 JBIG 是二值图象的编码标准,但是它也可以对含灰度值的图象或彩色图象进行无失真压缩,在
这种情况下,JBIG 是对图象的每个比特面作压缩变换。
.MPEG 系列标准
ISO 于 1992 年制定了运动图象数据压缩编码的标准 ISO CD11172,简称 MPEG(Motion Picture Expert
Group)标准,它是视频图象压缩的一个重要标准。MEPG 编码技术的发展十分迅速,从 MPEG-1、MPEG-2
到 MPEG-4,不仅图象质量得到了很大的提高,而且在编码的可伸缩性方面,也有了很大的灵活性。
MPEG-1
是以 1.5Mbps 的速率传输电视质量的视频信号,其亮度信号的分辨率为 352×240,色度信号的分辨
率为 180×120,每秒 25 或 30 帧。MPEG-1 标准有三个部分组成:MPEG 视频(速率小于 1.5Mbps)、
MPEG 音频(速率为 64.2Kbps 和 19.2Kbps)和 MPEG 系统(视频和音频的同步)。因此 MPEG-1 涉及的
问题是视频/音频压缩和多种压缩数据流的复合和同步问题。
采用两个基本技术:一是基于 16×16 子块的运动补偿,可以减少帧序列的时域冗余度;二是基于 DCT
的压缩技术,可以减少空域冗余度。设计 MPEG 算法本身面临着一个矛盾:为了满足随机访问的需要,
最好对其使用帧内编码,但是,仅靠帧内编码是无法达到在保证画面质量的前提下而满足高压缩比的需要
的。因此,MPEG 采取了预测和插值两种帧编码技术。MPEG 中的 DCT 技术不仅用于帧内压缩,而且对
于帧间预测误差也作了 DCT 变换,大大减少了空间域的冗余,达到了进一步压缩的目的。
I帧(I-Frame)(Intracoded Frame):基准帧(reference frame)。
P帧(P-Frame)(Predicted Frame):只能根据 I 帧重建,同时作为重建 B 帧的基准帧之一。
B 帧(B-Frame)(Bidirectional Frame):根据 I 帧与 P 帧重建。
MPEG-1 是为中等分辨率视频图象制定的一个标准,特别适合于 VCD 的性能要求。
MPEG-2
1993 年 ISO/IEC/JTC/SC29/WG11 推出的 ISO/IEC 13818 标准,是一种高带宽的视频数据流标准。
MPEG-2 既可以工作在隔行扫描模式下,也可以工作在逐行扫描模式下,最多支持 5 个音频声道,可以实
现立体声环绕。MPEG-2 提供了较为广泛的应用,典型的应用有 HDTV。
MPEG-2标准主要包括四个部分:
1) MPEG-2 视频:主要定义了视频数据的编码表示和图象再现的解码方法及过程;
2) MPEG-2 音频:主要定义了音频数据的编码表示和音频编码信息的解码方法及过程;
3) MPEG-2 系统:该部分定义了包含视频/音频的复合结构,以及实时播放视频/音频所需的时间同
步信息;
4) MPEG-2 的一致性测试规范。
MPEG-3
:
是为 1920 x 1080 x 30Hz
的 HDTV 制定的。后来,人们
又发现 MPEG-2 标准也能够很
好地支持这种应用,所以
MPEG-3 后来成为 MPEG-2 标
准的一部分,称为 MPEG-2
High-1440。
MPEG-4
是一种低带宽的视频标准,主要用于视频会议,其视频速率只有 64Kbps,分辨率为 176 x 144 x 10Hz。
极低比特率(Very Low Bit Rate Transfer)
表2.6 MPEG-2的级别
级 别 最大的分辨率 每秒的点数 传输率
Low 352 x 240 x 30 3.05 M 4 Mb/s
Main 720 x 480 x 30 10.40 M 15 Mb/s
High 1440 1440 x 1152 x 30 43.00 M 60 Mb/s
High 1920 x 1080 x 30 62.70 M 80 Mb/s
向前预测
双向预测
I
I
P
B
B
B
B
B
B
2.2 ITU 指定的国际标准
T.120
有关电视会议的国际标准 T.120,但不太成功,没有被广泛使用。
标准 功能及定义
T.121 应用程序开发指南,一般应用程序范本
T.122 流向控制及编址,数据及应用程序共用的多点通讯协定
T.123 OSI传送界面,一般电话系统及区域性网络的互联和协定
T.124 会议建立,一般会议控制设定和管理,包括加入或删除参与者
T.125 协定服务的形式,多点通信服务协定规范
T.126 批注及应用程序支持,多点固定图象检测及固定图象批注协定
T.127 将文档传给一方或多方,多点二进制文档传送
T.128 实时音频/图象管理,多点系统的控制
H.320
H.320
(其原名为 Narrow Band ISDN visual telephone systems and terminal equipment),但是 H.320 标
准还是只适合在
ISDN、E1、T1 等高速率的数字网上运行,而并不适合于象在电话线这种窄带网上使用。
因此,
ITU 从 1993 年开始着手制定一套新的标准 H.324。
标准 功能定义
H.261 图象数据编码标准,P×64Kbps数字化图象的编码器
G.711 音频编码压缩标准,使用PCM语音频率,需要专用的64Kbps
G.722 音频编码压缩标准,在64Kbps以内的7KHz音频编码
G.728 音频编码压缩标准,以64Kbps的速度使用CELP的语音编码
H.221 帧结构定义,定义传送音频和图象的频道的结构
H.230 系统控制规程的监控与显示标准,音频及图象的同步化控制
H.242 多点桥接的控制标准,可视电话连接及切断标准操作程序
H.233 数据加密
H.231 多点电视会议控制标准,多点控制单元连接规范
剩余48页未读,继续阅读
SlpingKing
- 粉丝: 5
- 资源: 16
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论6