多媒体技术
复习思考题及参考答案
第1章 引论
1.ITU定义了哪五类媒体?通常所说的媒体是指此中的什么媒体?
答:感觉(Perception)、暗示(Representation)、展现(Presentation)、存储(Storage) 和传输(Transmission)媒体;感觉。
2.目前多媒体所能处置的有哪些具体媒体对象?它们被分为哪两类?
答:文本、图形、图像、声音、动画、视频等;静态媒体〔文本、图形、图像〕、流式媒体〔声音、动画、视频〕。
3.多媒体技术的特点有哪些?为什么传统电视不是多媒体?举出几种常见的多媒体设备。
答:多样性 、集成性、交互性、[实时性];不交互;DVD、计算机、 、数字电视。
4.多媒体的核心技术是什么?
答:数据压缩
第2章 文字
1.计算机对文字的处置,包罗 哪三个局部?
答:文字输入、字符编码、文字输出。
2.文字录入计算机的方法主要有哪几类?
答:键盘输入、手写输入、语音输入、扫描输入。
3.汉字有哪三个要素,各对应于什么键盘输入法?
答:形、音、义,对应形码〔如五笔字形〕、音码〔如全拼〕、基于词汇与整句的智能化输入法〔如微软拼音〕。
4.语音识别系统可以如何分类?语音识此外目标是开发什么样的语音识别系统?
答:小/中/大词汇量、孤立词/连接词/持续语音、特定人(1人)/限定人(n人)/非特定人(任意人);大词汇量、非特定人的持续语音识别系统。
5.ASCII的英文原文和中文译文是什么? ASCII是由什么组织在什么时候制定的?
答: American Standard Code for Information Interchange,美国信息交换尺度码;ANSI于1963年制定。
6.ASCII所对应的ISO尺度号是多少?该ISO尺度是什么时候制定的?
答:646;1972年。
7.给出尺度化组织ANSI、ISO和IEC的含义。
答: ANSI = American National Standards Institute,美国国家尺度协会;ISO = International Organization for Standardization,国际尺度化组织——是由各国的尺度协会联合组成的一个非当局国际组织;IEC = International Electrotechnical Commission,国际电工技术委员会——国际尺度化权威组织,属于联合国的甲级咨询机构,负责制定关于电工电子各方面的尺度。
8.常用的中文编码的国家尺度有哪些?它们各自的特点与适用范围是什么?
答:GB 2312—早期、底子、经典、收字少〔6千7百多〕,适用于老式中文软件;GBK/GB 18030—过渡、收字多〔2万7千多〕、与GB 2312兼容,适用于此刻的中文软件;GB 13000—通用、与国际尺度Unicoe和ISO/IEC 10646等价、收字多〔接近2万1千〕、与GB 2312不兼容,适用于现代国际化软件。
9.GB 2312中的汉字分成几级?各级中的汉字按什么挨次摆列?
答:分成两级,此中:常用的一级汉字按拼音字母挨次摆列〔同音字再按笔顺的横、竖、撇、捺、点、折序摆列〕;生僻的二级汉字按部首挨次摆列〔同部首的字按笔画数摆列,同笔画数的字再按笔顺摆列〕。
10.GB 2312中的汉字用几个字节暗示?为什么只有94个区/位?
答:2个〔7位〕字节;为了与ASCII码兼容,保留每个〔7位〕字节中的32个控制符和两个特殊可显字符〔Space/Del〕,所以有128-34=94。
11.给出Big5的含义。
答: Big5内码〔大五码〕是1984年由台湾财团法人资讯工业策进会与宏碁(Acer)、神通(MiTAC)、佳佳、零壹(Zero One)、众 (FIC)等五大软件公司联合推出的一种用于港澳台及海外的繁体汉字编码方案。
12.GB 13000与ISO/IEC 10646的关系是什么?
答:等价〔英文译成了中文〕。
13.给出UCS和BMP的英文原文、中文译文、含义与关系。
答: UCS = Universal [Multiple-Octet Coded] Character Set,通用[多八位编码]字符集; BMP = Basic Multilingual Plane,底子多文种平面;UCS是ISO/IEC 10646的具体字符编码方案〔4字节〕,BMP是UCS中的第00组的第00平面〔2字节〕。
14.中日韩统一汉字〔CJK〕在BMP的哪个区?含有多少个汉字?
答:I区;20 992个。
15.UCS的字符编码有哪些暗示形式?它们各有什么特点?
答:UCS-2—双字节、简单实用〔BMP〕;UCS-4—4字节、复杂通用〔整个UCS〕;UTF-8/16/32—变字节、别离适用于西文/中文/通用。
多媒体技术的特点16.GBK与GB 18030有什么关系?它们与GB 2312和GB 13000又有什么关系?
答:GBK为指导性技术尺度,GB 18030是对应于GBK的国家尺度;GBK/GB 18030收字多〔与GB 13000兼容〕且码位与GB 2312兼容,是从GB 2312到GB 13000的过渡性尺度。
17.Unicode与ISO/IEC 10646有什么关系?比较它们的异同。
答:Unicode与ISO/IEC 10646是由两个组织〔统一码协会和ISO/IEC〕别离制定的国际通用字符编码尺度,早期互不相干,1991年起走向融合,从1993年〔Unicode 1.1/10646-1:1993〕起Unicode与10646保持两者尺度的码表兼容;同——码表兼容;异——10646只是字符集/贵/字体质量好,Unicode还含语义符号和算法/免费/字体质量不太好;所以,Unicode的使用更为广泛些。
18.UTF是什么?它有哪些具体编码方式?这些方式各有什么特点?
答:UTF = Unicode/UCS Transformation Format 统一码/通用字符集转换格式,是一类具体的字符编码方式;UTF-8——每个字符1~6个字节的变长编码,与CPU的字节挨次无关,主要适用于西文ASCII编码;UTF-16——每个字符2或4个字节的变长编码,与CPU的字节挨次有关,无法相容于ASCII编码,主要适用于中文编码;UTF-32—4个字节的通用编码,适用于整个Unicode/ UCS。
19.文字输出方式包罗 哪两大类?
答:图形〔图符〕、声音〔语音〕。
20.字形技术含哪三个方面?
答:字型、字体、字库。
21.有哪三种字型?它们各有什么特点?
答:点阵字——位图、显示快、占空间〔字库大〕、放大后有马赛克效应,已被裁减;矢量字——单线条、字库小、算法简单、难看、只用于笔式绘图仪〔少见〕;轮廓字——用曲线描绘字的轮廓、输出效果好、所见即所得、可无级放大、易实现空心/暗影/填充/变形等各种特效功能,是现代的主流字型。轮廓曲线一般采用二、三次B样条或Bezier曲线。
22.常用的汉字字体是哪几种?它们各用于哪些方面?
答:宋体/正文;仿宋体/正文及摘要等;黑体/标题及工艺美术;楷体/中小学教材的正文及工艺美术等。
23.语音输入与语音输出的核心技术各是什么?
答:语音识别技术、语音合成技术。
24.给出TTS的英文原文和中文译文,并描述其系统的构成。
答:Text-To-Speech,文语转换;文本阐发〔通过对输入文本进行词法阐发、语法阐发,甚至语义阐发,从文本中抽取音素和韵律等发音信息〕+ 语音合成〔使用从文本阐发得到的发音信息去控制合成单元的谱特征(音)和韵律特征(基频、时长和幅度),送入声音合成器(软件或硬件)发生相应的语音输出〕。
第3章 音频
1.音频的英文是什么?它与声音有什么区别?音频一般分为哪三类?
答:audio;音频指人能听到的声音〔20Hz~20kHz〕,不包罗 次声和超声;话音、音乐、其他(环境声、音效声、自然声)。
2.室温下空气中的声速是多少?
答:340 m/s。
3.声音是一种什么样的波?与水波有何区别?一般用哪两个物理量来描述?
答:纵向压力波〔纵波或疏密波〕;水波为横波;振幅和频率。
4.什么叫纯音?什么叫复音?怎样确定复音的音高?
答:具有单一频率的声音;具有多种频率成分的声音;基频。
5.什么叫基音和谐音?它们之间有什么关系?
答:和谐复音中具有基频的声音〔其频率是和谐复音中的最低频,且通常具有最大振幅〕、频率是基频整数倍〔谐频〕的声音〔也叫泛音〕;谐音的频率是基音的整数倍。
6.声音有哪三个要素?它们的含义是什么?
答:调子〔tone〕——人耳对声音上下的感觉,主要与声音的频率有关、响度〔loudness〕——对声音强弱的主不雅感知,一般用无量纲的声级〔soundlevel〕暗示〔单元为dB分贝〕、 音〔timbre〕——人们区别不同发声体的主不雅感觉,每个人和每种乐器都有各自的音。音主要是由复音中不同谐音的分布和组成所决定的,其他影响因素还有声音的时间过程。
7.人类听觉的频率范围是什么?语音的频率范围又是什么?
答: 20Hz~20kHz;300Hz~3000 Hz。
8.人耳有哪些局部构成?它们各有什么功能?
答:人耳分为外耳、中耳和内耳三个局部。外耳由耳廓〔用于区分声源位置〕和耳道〔谐振腔〕构成;鼓膜处在外耳和中耳之间〔用于传导声音〕;中耳包含三根听骨及通向咽腔的耳咽管〔平衡气压、庇护内耳、匹配阻抗〕;内耳那么包罗 耳蜗〔柯蒂器负责听觉〕、前庭和三半规管〔平衡觉感受器〕和听神经等局部。
9.听觉有哪些有用的感知特性?
答:听阈曲线〔不克不及感知弱低音〕、〔频域、时域和中枢〕掩蔽效应。
10.模拟信号与数字信号的区别在哪里?如何将音频信号数字化?
答:模拟信号在时间和幅度上都是持续,数字信号在时间和幅度都用离散的数字暗示;采样+量化。
11.如何确定无损数字化的采样频率? 按Nyquist采样定理语音和音乐之无损数字化的采样频率各是多少?
答:按Nyquist采样定理——采样频率不低于声音信号最高频率的两倍;2*3kHz = 6kHz、2*20kHz = 40kHz。
12.MIDI的英文原文与中文译文各是什么?与波形数据比拟MIDI有哪些优错误谬误?
答: Musical Instrument Digital Interface,乐器数字接口;长处——文件小、容易编纂、常用作布景音乐;错误谬误——不克不及暗示人声。
13.与MIDI相关的尺度还有哪些?
答:GM〔 General MIDI,通用MIDI〕、XMF (eXtensible Music Format,可扩展音乐格式)、MIDI XML。
14.音乐生成方法有哪两种?它们各有什么特点?
答:调频和波表;调频——将数字暗示的简单乐音波形用计算机组合起来,通过数模转换器DAC来生成乐音,简单廉价,有些掉真;波表——把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度和音量,从而生成各种音阶和大小的音符,比调频法所发生乐音更传神,但较贵。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论