数字媒体技术导论

来源：免费论文网　|　时间：2017-01-01 11:17:15　|　移动端：数字媒体技术导论

篇一：《数字媒体技术导论》作业讲评 4

《数字媒体技术导论》作业讲评

Chap1-3

一、填空题

1．对于媒体的含义，可以从媒介和媒质两个范畴理解。

2. 体、存储媒体和传输媒体。

二、简答题

1．请你谈谈对数字媒体的认识，其主要特点有哪些？

答：数字媒体（Digital Media）是指基于计算机信息网络技术，以二进制数的形式记录、处理、传播和获取的能在全球范围内即时互动传播信息的信息载体，这些载体包括数字化的文字、图形、图像、声音、视频影像和动画等感觉媒体，和表示这些感觉媒体的编码等，统称为表示媒体，以及存储、传输、显示逻辑的存储媒体与表现媒体。

数字媒体的主要特点：简

（1）数字媒体的多媒体集成性：将多种媒体信息进行多通道的统一获取、存储、组织、表现与合成

（2）数字媒体的受众抢占主动、主导地位：网民可以发布信息、互动

（3）数字媒体的PIR特征

P（Personal）个人化，I（Iteraction）交互性，R（Realtime）实时性。

（4）数字媒体是技术与艺术的融合

Chap4

1.什么是MIDI？有什么特点？

MIDI，即Musical Instrument Digital Interface（电子乐器数字接口）的缩写，是一种应用于在音乐合成器（Music Synthesizers）、乐器（Musical Instruments）和计算机之间交换音乐信息的标准协议。MIDI是乐器和计算机使用的标准语言，是一套指令。

MIDI文件的特点：简

① 用乐谱指令代替声音数据。

② 有效记录和重现各种乐器声音。

③ 占用存储空间极小。

④ 编辑灵活：用户可以自由地改变音调、音色等属性，直到自己想要的效果。 ⑤ 适合乐曲创作和远距离传输。

2. 数字信号的主要优点：简

①数字信号调制简单，抗扰能力强，信号处理中失真小；

②易于压缩，能加密；

③能与计算机结合通用性好；

④设备成本低等。

3.录制4分钟采样频率为44.1KHZ、16bit量化的立体声音乐，如果不经压缩，需要多大的存储空间？

44.1*1000*16/8*2*4*60/1024/1024= 40.37 (MB)

Chap 5

1. 概述几种主要的颜色模型

RGB色彩模型：彩色最基本模型，适合于计算机系统。RGB色彩模型即采用红、绿和蓝三基色以不同比例进行颜色叠加的模型。由以下公式进行表述： C＝r[R]＋g[G]＋b[B]

CMY(CMYK)色彩模型：以红、绿、蓝的补色青（Cyan）、品红（Magenta）、黄（yellow）为原色构成的色彩模型。用于印刷;

HSB 模型建立在人类对颜色的感觉基础之上。H表示色调（也称色相,hue）、S表示饱和度(saturation)、B表示亮度(brightness)。

YUV(亮度、色差)色彩模型：用于PAL电视信号传输；其中的Y表示亮度，UV用来表示色差，U、V是构成彩色的两个分量

YIQ色彩模型：用于NTSC彩色电视广播；其中的Y表示亮度，I、Q是两个彩色分量。 YCbCr色彩模型：数字视频常用的颜色模型。

CIE L*a*b*颜色模型：使用b*, a *和 L*坐标轴定义CIE 颜色空间，其中L*值代表光亮度，其值从0(黑色)~100(白色)。b*和a*代表色度坐标，其中a* 代表红-绿轴，b* 代表黄-蓝轴，它们的值从0到10。a* = b* = 0表示无色。L*a*b 颜色模型与设备无关。

2. 计算未经压缩的1024*768的真彩色图像的文件大小。

1024*768*24/8/1024/1024=2.25 (MB)

3. 矢量图形与位图的区别矢量图是指完全由计算机的指令生成的图像形式。矢量图像的基本构成元素是一些点、线、矩形、多边形、圆和弧线等简单图形。矢量图文件体积一般较小。矢量图形最大的优点是无论放大、缩小或旋转等不会失真，矢量图形与分辨率无关；最大的缺点是难以表现色彩层次丰富的逼真图像效果。

位图它是通过相机、扫描仪、摄像机等设备将模拟图像信号转换为数字图像数据阵列的图像形式。它由像素（Pixel）点组成的，像素是位图最小的信息单元，存储在图像栅格中。位图文件占据的存储器空间比较大。位图的优点是可以表现色彩层次丰富的逼真图像效果，适用于相片或要求精细的图像。缺点是由于位图像素的总数是一定的，所以，当旋转或缩放位图时会产生失真和畸变（如：产生锯齿、形变、像素化等）。

Chap6

1. 若用1024*768真彩色图像以25fps构成视频，若未压缩，问650M的光盘可存储多长时间这样的视频影像？

每帧: 1024*768*24/8/1024/1024=2.25 (MB)

每秒的数据量: 2.25*25=56.25 (MB)

可存时长：650/56.25=11.6 ( S )

2. 与模拟视频相比，数字视频的优点主要有哪些？

答：

（1）再现性好，抗干扰能力强。数字视频是由一系列二进位数字组成的编码信号，它比模拟信号更精确，不容易受到干扰；

（2）清晰度高且索引方便，便于存储、处理、交换，多次复制不会失真；

（2）安全性高，便于加密处理；

（3）数字信号可被压缩，使更多的信息能够在带宽一定的频道内传输，大大增加了节目资源。

（4）适合网络应用，远程传输无噪声积累，并可以突破单向式的数字信号传输，实现交互式的信号传输。

（5）易于编辑和处理。可以运用多种的编辑工具（如编辑软件）对数字视频进行编辑加工，对数字视频的处理方式也是多种多样，可以制作许多特技效果。将视频融入计算机化的制作环境，改变了以往视频处理的方式，也便于视频处理的个人化、家庭化；

（6）数字视频可扩展性强，便于跨平台使用。可与其他数字平台无缝连接。

Chap8

Chap9

流媒体的传输原理

数据流RTP/UDP

①用户启动浏览器并输入要访问网页的URL地址，向Web服务器（Web Server）发出访问流媒体视频的服务请求。浏览器与Web服务器之间用HTTP/TCP来交换控制信息。 ② Web服务器把URL地址转化成文件路径，提交给流媒体服务器（A/V Server）； ③ 流媒体服务器找到相应的媒体文件，经过Web服务器将该流媒体文件所在的服务器地址、资源路径以及媒体的编码类型等相关信息打包提供给客户端（Web Browser）；

④ 客户端浏览器自动启动流媒体播放器（A/V Player），用Web服务器提供的相关参数对播放程序进行初始化。

⑤播放程序和流媒体服务器之间通过RTSP协议建立连接，控制输视音频数据流的播放。 ⑥同时，流媒体服务器通过RTP/UDP将音视频流传输给流媒体播放器，用户进行在线收看。

主要的网络协议：

1. 资源预订协议（RSVP）

RSVP（Resource Reserve Protocol）是一种支持多媒体通信的传输协议，它主要是为流媒体的实时播放而提前在Internet上预留一部分网络资源（带宽），并为传输过程提供Qos（服务质量）。

2．实时传输协议（RTP）与实时传输控制协议（RTCP）

RTP（Real-time Transport Protocol）是由多媒体传输工作小组（IETF）1996年在开发的用于Internet针对多媒体数据流的一种实时传输协议，可以在面向连接或无连接的下层协议上工作，通常和UDP协议一起使用，但也可以在TCP或ATM等其他协议上工作。

3. 实时流协议（RTSP）

实时流协议RTSP（RealTime Streaming Protocol）是由RealNetworks和Netscape共同提出的TCP/IP协议体系中一个应用层的实时流传输协议，该协议定义了一对多应用程序如何有效地通过IP网络传送多媒体数据。

4. 多功能网际邮件扩充协议（MIME）

多功能网际邮件扩充协议（MIME，Multipurpose Internet Mail Extensions）是一个扩展了的电子邮件互联网标准，在1992年最早应用于电子邮件系统，使其能够支持非ASCII字符、二进制格式附件等多种数据类型的邮件消息。后来，MIME也被应用于浏览器，HTTP协议中也使用了该协议框架。

3G的四个国际标准

1）WCDMA：全称为Wideband CDMA，意为宽频分码多重存取，这是基于GSM网发展出来的3G技术规范。

2）CDMA2000：是由窄带CDMA（CDMA IS95）技术发展而来的宽带CDMA技术，也称为CDMA Multi-Carrier。

3）TD-SCDMA：该标准将智能无线、同步CDMA和软件无线电等当今国际领先技术融于

其中，在频谱利用率、对业务支持具有灵活性、频率灵活性及成本等方面的独特优势。

4）WiMAX：全名是微波存取全球互通（Worldwide Interoperability for Microwave Access），是一种为企业和家庭用户提供“最后一英里”的宽带无线连接方案。

Chap10

一、填空题

1. 目前主要的图形API有。

二、简答题

1. 简述数字游戏开发的过程。

1前期策划。策划团队首先要根据当前和未来一段时间的市场趋势、可用的人力资源、时间等要素撰写游戏策划书，完成策划方案、游戏制作过程的规划与协调工作。

2中期制作：制作阶段，不同工作组围绕游戏的预定目标进行紧张的制作，其中包括程序组、美工组、动画组、策划组、音效组、项目经理的各项具体工作。

3后期测试。完成了中期制作阶段后所生成的游戏被称为Alpha版，即内部测试版。但是这个版本有很多问题需要解决和完善。Bate版指游戏过程完全不会死机、可以顺利运行，图像、动画位置正确，界面完成的状态。而Master版是指该游戏的开发已经全部完成，可以进入到第四个阶段出版发布。

4出版发布。将master版游戏进行标准化：加上官方编号、版权信息等。经过标准化处理的文件随后就连同其他一些资料被提交给主管进行审批。

篇二：数字媒体技术导论习题集

第一章数字媒体技术概论

一、填空题

1、对于媒体的含义，可以从_______和________两个范畴理解。传

递信息的载体、存储信息的实体

2、国际电信联盟定义了五种媒体，它们分别是_______、_______、

_______、_______和________。感觉媒体，表示媒体，显示媒体，存储媒体，传输媒体。

3、计算机记录和传播的信息媒体的一个共同的重要特点就是信息的

最小单元是_______。比特

4、数字媒体的特点有_______、_______、_______、_______和

________。数字化，交互性，趣味性，集成性，技术与艺术的融合

5、数字媒体概念

第二章数字音频技术基础

一、单项选择

1、声音的数字化过程不包括（）。A

A．解码 B．采样 C．编码 D．量化

2、下列文件格式属于音频格式的是（）。B

A．ASF B．WAV C．MOV D．RMVB

3、下列采集的波形声音质量最好的是（）。B

A．单声道、16位量化、22.05kHz采样频率

B．双声道、16位量化、44.1kHz采样频率

C．单声道、8位量化、22.05kHz采样频率

D．双声道、8位量化、44.1kHz采样频率

4、下列软件不是音频专业处理软件的是（）。C

A．Cool Edit B．Adobe Audition C．Auto CAD D．Vegas Audio

5、以下的采样频率中，（）是目前声卡所支持的。D

A．100kHz B．20kHz C．22.5kHz D．48kHz

6、在PC中播放音频文件必须安装下列（）设备。C

A．网络适配卡器B．视频卡 C．声卡D．光驱

7、模拟音频处理设备不包括（）。D

A．音箱

二、填空题

2、按照声音的来源及作用，可分为______、_______和________。

人声、乐音、响音

3、人耳可感受声音频率的范围为20-20000Hz。声音高于20000Hz

为_______，低于20Hz为_______。超声波、次声波

4、话筒的主要功能就是________。进行声音能量的收集

5、音箱的主要功能就是________，将音频电流信号变换成声音信号。

还原声音

6、一般而言，音频数字化通常经过三个阶段，即______、_______、

_______。采样、量化、编码

B．话筒 C．模拟调音台 D．声卡

7、数字化过程中，有两个非常重要的指标，一是________，二是

________。量化深度、采样频率

8、采样频率越高，量化深度______，声音质量_______。越大、越

好

9、_________也称为比特率，即每秒种音频的二进制数据量。音频

流码率

10、数字音频的常用格式有_______、_______、________(任意列举

三种)。WAV格式、MIDI格式、MP3格式、CDA、MP3 Pro、WMA、MP4

11、数字音频的技术操作具体可以归纳为六点,即_________、

_________、_________、_________、________、________。数字录音、数字音乐创作、声音剪辑、声音合成、增加特效、文件操作

12、_________是将模拟的音频电压流信号转换成数字脉冲电压信

号。模数转换器

13、数字音频编辑软件可分为两种，一种是_________，另一种是

_________。音源软件（音序器软件）、编辑软件

14、_________就是声音录制时的音源数量或回放时相应的扬声器数

量。声道数

15、_________是指用一连串二进制数据来保存的声音信号。数字音

频

17、__数字音频处理设备________可以分为两类：一类是专用数字

音频设备，另一类是非专为处理音频而设计的多媒体计算机。

三、判断题

1、计算机可以直接对声音信号进行处理。（）错，因为声音信号为模拟信号，计算机是数字化信号，所以必须将模拟音频信号转换成数字音频信号。

2、音频数字化的三个阶段是采样、量化、编码。（）对

3、采样频率越高，量化深度越小，声音质量越差。（）错，因为采样频率越高，量化深度越大，声音质量越好。

4、MAC声音格式是Apple计算机公司开发的声音文件格式，其扩展名为.snd。（）对

5、音频流码率也称比特率。（）对

四、简答题

2、什么是数字音频？

答：数字音频是指用一连串二进制数据来保存的声音信号。这种声音

信号在储存和电路传输及处理过程中，不在是连续的信号，而是离散的信号。

五、计算题

1、选择采样频率为44.1KHZ、样本精度为16bit的声音数化参数，在

不采用压缩技术的情况下，录制2min的双声道的音频信号需要的存储空间为多少（MB）?

解：（44.1*1000*16*2*60*2）/8/1024/1024=20.19 MB

六、论述题

1、数字音频处理过程中最关键的问题是音频的数字化问题。答：这句话是正确的。

数字音频处理过程中最关键的问题：音频的数字化问题，也就是如何获得数字音频问题。

要获得数字化音频信号，可以考虑两种途径：一是将现场声源的模拟

信号或已存储的模拟声音信号通过某中方法转换成数字音频；二是在数字化设备中创作出数字音频，比如电子作曲。一般而言，数字化通常经过三个阶段，即采样—量化—编码。

第三章数字图像的处理技术

一、选择题

3. 一幅320×240的真彩色图像，未压缩的图像数据量是A

A 225KB B 230.4KB C900KB D921.6KB

4. 下列哪个是photoshop图象最基本的组成单元：（ C ）

A．节点 B．色彩空间

C．像素 D．路径

5. 下列哪组图像格式全是位图格式（ A）

A.PSD BMP JPEG B.JPEG GIF CDR

C.GIF CDR DWG D.DWGEPSDXF

6．色彩深度是指在一个图象中什么的数量：（ A ）

A．颜色 B．饱和度 C．亮度 D．灰度

7.当图象是何种模式时，所有的滤镜都不可以使用（假设图象是8位/

篇三：数字媒体技术导论复习题

数字媒体技术导论复习题

第1章数字媒体技术概论

1. 媒体概念分类及特性

媒体概念是：媒体包括两层含义：（1）传递信息的载体，称为媒介，是由人类发明创造的记录和表述信息的抽象载体，也称为逻辑载体，如文字、符号、图形、编码等。（2）存储信息的实体，称为媒质，如纸、磁盘、光盘、磁带、半导体存储器等。载体包括实物载体、或由人类发明创造的承载信息的实体，也称为物理媒体。媒体的分类：媒体依据信息划分具有不同表现形式。按照人的感觉，媒体可分为视觉媒体、听觉媒体等；按照信息的表现形式，媒体可分为语言媒体、文字媒体、音乐媒体、图形媒体、动画媒体和视频媒体等；按照信息的种类，媒体可分为新闻媒体、科技信息媒体、生活媒体等。媒体依据信息的载体不同又有不同分类。按载体的种类不同，媒体可分为报纸、信件、电话、计算机、网络等；按照不同应用方式，媒体可分为印刷媒体、幻灯、电影媒体、广播电视媒体、计算机媒体、计算机多媒体、网络媒体等。按照媒体产生的时间和历史，媒体又可以分为新媒体和旧媒体（也有人说是传统媒体）。按人们对载体的心理承认度，媒体又可分为时尚媒体和传统媒体。按载体的传播范围，媒体又可分为个人媒体和大众媒体。国际电信联盟（International Telecommunication，ITU）从技术的角度定义媒介（Medium）：感觉媒体（Perception）、表示媒体、显示媒体（Display）、存储媒体（Storage）和传输媒体（Transmission）。媒体的特性：主要特性为多样性、集成性、交互性和信息接收/使用方便等。

2. 数字媒体及其特性

数字媒体概念：数字媒体是数字化的内容作品以现代网络为主要传播载体，通过完善的服务体系，分发到终端和用户进行消费的全过程。（我国的数字媒体概念）

数字媒体特性：主要特性为数字化、交互性、趣味性、集成性、技术与艺术的融合等。

3. 数字媒体传播模式

包括：大众传播模式、媒体信息传播模式、数字媒体传输模式和超媒体传播模式

4、数字媒体技术的主要研究方向

（1）数字声音处理包括：音频及其传统技术（记录、编辑技术）、音频的数字化技术（采样、量化、编码）、数字音频的编辑技术、话音编码技术（如PCM、DA、ADM）。数字音频技术可应用于个人娱乐、专业制作、数字广播等。

（2）数字图像处理包括：数字图像的计算机表示方法（位图、矢量图等）、数字图像的获取技术、图像的编辑与创意设计。常用的图像处理软件有Photoshop等。数字图像处理技术可应用于家庭娱乐、数字排版、工业设计、企业徽标设计、漫画创作、动画原形设计、数字绘画创作。

（3）数字视频处理包括：数字视频及其基本编辑技术、后期特效处理技术。常用的视频处理软件有Premiere等。数字视频处理技术可应用于个人、家庭影像记录、电视节目制作、网络新闻。

（4）数字动画设计包括：动画的基本原理、动画设计基础（包括环节：构思、剧本、情节链图片、模板与角色、背景、配乐）、数字二维动画技术、数字三维动画技术、数字动画的设计与创意。常用的动画设计软件有3DMAX、Flash等。数字动画可应用于少儿电视节目制作、动画电影制作、电视节目后期特效包装、建筑和装潢设计、工业计算机辅助设计、教学课件制作等。

（5）数字游戏设计包括：游戏设计相关软件技术（Directx、OpenGL、Director等）、游戏设计与创意。

（6）数字媒体压缩包括：数字媒体压缩技术及分类、通用的数据压缩技术（行程编码、字典编码、熵编码等）、数字媒体压缩标准，如用于声音的MP3、MP4、用于图像的JPEG、用于运动图像的MPEG。

（7）数字媒体存储包括：内存储器、外存储器、光盘存储器等。

（8）数字媒体管理与保护包括：数字媒体的数据管理、媒体存储模型及应用、数字媒体版权保护概念及框架、数字版权保护技术，如加密技术、数字水印技术、权利描述语言等。

（9）数字媒体传输技术包括：流媒体传输技术、P2P技术、IPTV技术等。

第一章：

媒体的分类：

1.(1)按照人的感觉，媒体可分为视觉媒体、听觉媒体等；(2)按照信息的表现形式，媒体可分为语言媒体、文字媒体、音乐媒体、图形媒体、动画媒体和视频媒体等；(3)按照信息的种类，媒体可分为新闻媒体、科技信息媒体、生活媒体等。(4)国际电信联盟（International Telecommunication，ITU）从技术的角度对媒体分如下种类：感觉媒体（Perception），是指能够直接作用于人的感觉器官，使人产生直接感觉(视、听、嗅、味、触觉)的媒体，如语言、音乐、各种图像、图形、动画、文本等。表示媒体（Presentation），是指为了传送感觉媒体而人为研究出来的媒体，借助这一媒体可以更加有效地存储感觉媒体，或者是将感觉媒体从一个地方传送到远处另外一个地方的媒体，如语言编码、电报码、条形码、语言编码，静止和活动图象编码以及文本编码等。显示媒体（Display），是显示感觉媒体的设备。显示媒体又分为两类，一类是输入显示媒体，如话筒，摄象机、光笔以及键盘等，另一种为输出显示媒体，如扬声器、显示器以及打印机等，指用于通信中，使电信号和感觉媒体间产生转换用的媒体。存储媒体（Storage），用于存储表示媒体，也即存放感觉媒体数字化后的代码的媒体称为存储媒体。例如磁盘、光盘、磁带、纸张等。简而言之，是指用于存放某种媒体的载体。传输媒体（Transmission），传输媒体是指传输信号的物理载体，例如同轴电缆、光纤、双绞线以及电磁波等都是传输媒体。

1.1.2媒体特性

多样性、集成性、交互性、信息接收/ 使用方便

1.2.1数字媒体概念

数字媒体是数字化的内容作品以现代网络为主要传播载体，通过完善的服务体系，分发终端和用户进行消费的全过程。（我国的数字媒体概念）

或：数字媒体是指最终以二进制数的形式记录、处理、传播、获取的信息媒体。

1.2.2数字媒体特性

（1）数字化（2）交互性（3）趣味性（4）集成性（5）技术与艺术的融合

1.2.3数字媒体传播模式

数字媒体是利用数字电视技术、网络技术，通过互联网、宽带局域网、无线通信网和卫星等渠道，以电视、电脑和手机为终端，向用户提供视频、音频、语音数据服务、连线游戏、远程教育等集成信息和娱乐服务的一种传播形式。

数字媒体价值产业链包括哪几个过程？

（1）内容创建（2）内容管理（3）内容发行（4）应用开发（5）运营接入（6）价值链集成

（7）媒体应用

1.3.2数字媒体技术发展趋势

数字媒体内容产业将内容制作技术以及平台、音视频内容搜索技术、数字版权保护技术、数字媒体人机交互与终端技术、数字媒体资源管理平台与服务、数字媒体产品交易平台等六个方向为发展重点。

数字媒体技术六个重点发展方向

内容制作技术以及平台音视频内容搜索技术数字版权保护技术数字媒体人机交互与终端技术数字媒体资源管理平台与服务数字媒体产品交易平台与服务

1.3.3数字媒体技术研究领域

主要技术范畴包括：

（1）数字媒体表示与操作，包括数字声音及处理、数字图像及处理、数字视频及处理、数字动画技术等。

（2）数字媒体压缩，包括通用压缩编码、专门压缩编码（声音、图像、视频）技术等。

（3）数字媒体存储与管理，包括光盘存储（CD技术、DVD技术等）、媒体数据管理、数字媒体版权保护等。

（4）数字媒体传输，包括流媒体技术、P2P技术等。

数字媒体技术主要的研究方向

?数字媒体的技术范畴规划了数字媒体技术的研究领域，其主要的研究方向包括：

（1）数字声音处理（2）数字图像处理（3）数字视频处理（4）数字动画设计（5）数字游戏设计（6）数

字媒体压缩（7）数字媒体存储（8）数字媒体管理与保护（9）数字媒体传输技术

1.3.4数字媒体应用领域

数字媒体有着广泛的应用和开发领域，包括教育培训、电子商务、信息发布、游戏娱乐、电子出版、创意

设计等。

第2章数字音频技术基础

1. 模拟音频的基本概念

定义：声音是一种机械振动，振动越强，声音就越大。例如话筒把机械振动转换成电信号，这是一种模拟的音频，它是以模拟电压的幅度表示声音的强弱。

声音的分类：（1）按照人耳可听到的频率范围，声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20～20000赫兹间。声音高于20000赫兹为超声波，低于20赫兹为次声波。（2）按照声音的来源以及作用来看，可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑，感叹等；乐音也可成为音乐，是指人类通过相关乐器演

奏出来的声音，如影视作品中的背景声音，一般起着渲染气氛的作用；响音是指除语言和音

乐之外电影中所有声音的统称，如动作音响、自然音响、背景音响、机械音响、特殊音响。

2. 数字音频的基本概念

(1) 数字音频技术和数字音频

数字音频技术是把表示声音强弱的模拟电压用数字表示，如0.5V电压用数字20表示，2V

电压用80表示。模拟电压的幅度，即使在某电平范围内，也可以取无穷多个，如1.2V、1.21V、

1.215V……。而用数字来表示音频幅度时，只能把无穷多个电压幅度用有限个数字表示。把

某一幅度范围的电压用一个数字表示，这叫做量化。

数字音频是：通过采样量化把模拟量表示的音频信号转换成许多二制数1和0组成数字音频文件。

(2) 数字音频的文件格式与转换

常用的声音文件格式有：⑴WAV文件，WAV是Microsoft公司的音频文件格式。Microsoft sound system软件Sound Finder 可以转换AIF，SND和VOC文件到WAV格式。其中AIF

是Apple计算机的音频文件格式；SND是另一种计算机的波形音频文件格式；⑵VOC文件，VOC文件是Creative公司波形音频文件格式。利用声霸卡提供的软件可实现VOC和WAV文件的转换。程序VOC2WAV转换Creative的VOC文件到Microsoft的WAV

文件。程序WAV2VOC转换Microsoft的WAV文件到Creative的VOC文件。

⑶MIDI文件，MIDI文件是（Musical Instrument Digital Interface）乐器数字接口的缩写。 RMI是Microsoft公司的MIDI文件格式。

(3) 音频卡的功能

音频卡的功能有以下几个主要方面：音频录放、编辑、音乐合成、文语转换、CD-ROM接

口、MIDI接口、游戏接口等。

(4) 音频卡的工作原理

音频卡的工作原理主要由以下几个部分组成：

① 声音的合成与处理，这是音频卡的核心部分，它由数字声音处理器、调频（FM）音乐合成器及乐器数字接口（MIDI）控制器组成。这部分的主要任务是完成声波信号的模/数（A/D）和数/模（D/A）转换，利用调频技术控制声音的音调、音色和幅度等。② 混合信号处理器，混合信号处理器内置数字/模拟混音器，混音器的声源由以下几种信号如MIDI信号、CD音频、线路输入、麦克风等。可以选择一个声源或几个不同的声源进行混合录音。

③ 功率放大器，由于混合信号处理器输出的信号功率还不够大不能推动扬声器或音箱，所以一般都有一个功率放大器作为功率放大使得输出的音频信号有足够的功率。④ 总线接口和控制器，总线接口有多种，早期的音频卡为ISA总线接口，现在的音频卡一般是PCI总线接口。总线接口和控制器是由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及直接存储器访问（DMA）控制逻辑组成。

第二章数字音频技术基础

2.1 音频技术及特性

2.1.1音频的概念及特性

在物理学上声音的三个基本特性：频率、振幅和波形，对应到人耳的主观感觉就是音调、响度和音色。 ?频率：发声物体在振动时，单位时间内的振动的次数，单位为赫兹（HZ）。

?振幅是指发声物体在振动时偏离中心位置的幅度，代表发声物体振动时动势能的大小。

?音色是指声音的纯度，它由声波的波形形状所决定。

?2.1.1音频的概念及特性

声音的分类按照人耳可听到的频率范围，声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20～20000赫兹之间。声音高于20000赫兹为超声波，低于20赫兹为次声波。

2.1.3模拟音频处理设备

（1）话筒（Microphone麦克风）（2）音箱（speaker，扬声器）（3）模拟调音台

2.2 音频数字化

2.2.1数字音频

数字音频是指用一连串二进制数据来保存的声音信号。这种声音信号在存储和电路传输及处理过程中，不再是连续的信号，而是离散的。

2.2.2音频的数字化过程

数字化的音频信号两种途径：

第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频；第二种途径就是在数字化设备中创作出数字音频，比如电子作曲。

音频数字化一般经过三个阶段“采样——量化——编码”。

2.2.2音频的数字化过程

音频数字化过程的具体步骤包括：

第一步，将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集，这个过程就叫采样；第二步，将采集到的样本电压或电流值进行等级量化处理，这个过程就是量化；

第三步将等级值变换成对应的二进制表示值（0和1），并进行存储，这个过程就是“编码”。通过这三个环节，连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。

2.2.2音频的数字化过程

数字化过程两个指标：

一是量化深度，也可称之为量化分辨率，是指单位电压值和电流值之间的可分等级数；

二是采样频率，即采样点之间的时间间隔。

两者与音质还原的关系是：采样频率越高，量化深度越大，声音质量越好。

在数字音频的衡量指标中，采样频率的单位是HZ，量化深度一般用比特（Bit）来度量。

根据Nyquist（奈奎斯特）定理：要想不产生低频失真，则采样频率至少是录制的最高频率的两倍

2.3 数字音频质量及格式

2.3.1音频数据率及质量

?数字音频文件存储在计算机中要占据一定的空间，然而不同的采样频率、量化深度和录制时间生成的音频文件大小也不同。

?例如：用44.1kHz、16bit来进行立体声（即两个声道）采样（标准的CD音质），录制（或采集）3分钟的音频，那么在该未经压缩的声音数据文件的大小为：

一秒钟内采样44.1×1000次，每次的数据量是16×2＝32bit（因为立体声是两个声道），那么3分钟的总共数据量是44100×32×60×3= 254016000（bit），换算成计算机中的常用单位(Byte)，总共数据量是254016000/8/1024/1024= 30.28MByte。

?比特率，即每秒钟音频的二进制数据量。

–上述例题的比特率是176.4kB/s。

2.3.1音频数据率及质量

衡量一个数字音频的音质好坏的话，通常可以参考以下指标：

采样频率：即采样点之间的时间间隔，采样间隔时间越短，音质越好。

量化深度(量化分辨率)：是指单位电压值和电流值之间的可分等级数，可分等级越多，音质越好。音频流码率：数字化后，单位时间内音频数据的比特容量，流码率越大音质越好。以

上三个方面的指标中，前面两个指标是绝对指标，而音频流码率是一个相对指标，可以间接用来考察音频的质量。

2.3.2声音文件格式

数字音频的常见格式有以下几种：

（1）WAV格式:WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道， WAV格式对存储空间需求太大不便于交流和传播。（2）MIDI格式:MIDI是Musical Instrument Digital Interface的缩写，又称作乐器数字接口，是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式，规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议，可以模拟多种乐器的声音。（3）CDA格式，其取样频率为44.1kHz，16位量化位数。CD存储采用了音轨的形式，记录的是波形流，是一种近似无损的格式。（4）MP3格式:其全称是MPEG-1 Audio Layer

3。MP3能够以高音质、低采样率对数字音频文件进行压缩。（5）MP3 Pro格式:MP3 Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下，最大程度地保持压缩前的音质。（6）WMA格式:WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的，其压缩率一般可以达到1:18。此外，WMA还可以通过DRM（Digital Rights Management）方案加入防止拷贝，或者加入限制播放时间和播放次数，甚至是播放机器的限制，可有力地防止盗版。（7）MP4格式:MP4在文件中采用了保护版权的编码技术，只有特定的用户才可以播放，有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15，体积较MP3更小，但音质却没有下降。不过因为只有特定的用户才能播放这种文件，因此其流传与MP3相比差距甚远。（8）SACD格式:SACD（SA＝SuperAudio）是由Sony公司正式发布的。它的采样率为CD格式的64倍，即2.8224MHz。SACD重放频率带宽达100kHz，为CD格式的5倍，24位量化位数，远远超过CD，声音的细节表现更为丰富、清晰。（9）Quicktime格式:QuickTime是苹果公司于1991年推出的一种数字流媒体，它面向视频编辑、Web网站创建和媒体技术平台，QuickTime支持几乎所有主流的个人计算平台，可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。（10）VQF格式:VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术，它的压缩率能够达到1:18，因此相同情况下压缩后VQF的文件体积比MP3小30%～50%，更便利于网上传播，同时音质极佳，接近CD音质(16位

《数字媒体技术导论》由：免费论文网互联网用户整理提供；
链接地址：http://www.csmayi.cn/show/136485.html
转载请保留,谢谢!

推荐专题

相关文章

1数字媒体技术导论