大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc

上传人:h**** 文档编号:118757 上传时间:2018-07-08 格式:DOC 页数:16 大小:94.50KB
下载 相关 举报
大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc_第1页
第1页 / 共16页
大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc_第2页
第2页 / 共16页
大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc_第3页
第3页 / 共16页
大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc_第4页
第4页 / 共16页
大学计算机基础2015版蔡绍稷,吉根林习题五-答案.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、 习题五 1、 什么是媒体?什么是多媒体?其主要特点是什么? 答: 1.所谓媒体,是指传播信息的介质,通俗的说就是宣传平台,能为信息的传播提供平台的就可以称为媒体了 . 2.传统的四大媒体分别为 :1、报纸; 2、电视; 3、广播; 4、杂志;此外,还应有户外媒体、网络媒体、新媒体,如手机短信等。 随着科学技术的发展,逐渐衍生除新的媒体,例如: IPTV、电子杂志等,他们在传统媒体的基础上发展起来,但与传统媒体又有着质的区别。 从出现的先后顺序来划分: 1、报纸刊物应为第一媒体; 2、广播应为第二媒体; 3、电视应为第三媒体; 4、互联网则应被称为第四媒体; 5、移动网络应为第五媒体。 但是,

2、就其重要性、适宜性、有效性而言,广播的今天就是电视的明天。电视正逐步沦为第二媒体,而互联网正在从第四媒体逐步上升为第一媒体。虽然电视的广告收入一直有较大幅度的增长,但广告蛋糕正日益被互联网、户外媒体等新媒体以及变革后的平面媒体所瓜分,这已是不争的事实。同时,平面媒体已经涵概了报刊、杂志、画册、信封、挂历、立体广告牌、霓虹灯、空飘、 LED 看板、灯箱、户外电视墙等等广告宣传平台;电波媒体也已经涵概了广播、电视等广告宣传平台。 基于此,就其目前适宜 性来讲,媒体应按其形式划分为平面、电波、网络三大类,即: 1、平面媒体:主要包括印刷类、非印刷类、光电类等。 2、电波媒体:主要包括广播、电视广告(

3、字幕、标版、影视)等。 3、网络媒体:主要包括网络索引、平面、动画、论坛等。 “多媒体”一词译自英文“ Multimedia”,媒体( medium)原有两重含义,一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译作媒质;二是指传递信息的载体,如数字、文字、声音、图形等,中文译作媒介。从字面上看,多媒体就是由单媒体复合而成的啦。 多媒体技术不是各种信息 媒体的简单复合,它是一种把文本 (Text)、图形 (Graphics)、图像 (Images)、动画 (Animation)和声音 (Sound)等形式的信息结合在一起,并通过计算机进行综合处理和控制,能支持完成一系列交互式操

4、作的信息技术。多媒体技术的发展改变了计算机的使用领域,使计算机由办公室、实验室中的专用品变成了信息社会的普通工具,广泛应用于工业生产管理、学校教育、公共信息咨询、商业广告、军事指挥与训练,甚至家庭生活与娱乐等领域。 多媒体技术有以下几个主要特点: ( 1)集成性 能够对信息进行多通道 统一获取、存储、组织与合成。 ( 2)控制性 多媒体技术是以计算机为中心,综合处理和控制多媒体信息,并按人的要求以多种媒体形式表现出来,同时作用于人的多种感官。 ( 3)交互性 交互性是多媒体应用有别于传统信息交流媒体的主要特点之一。传统信息交流媒体只能单向地、被动地传播信息,而多媒体技术则可以实现人对信息的主动

5、选择和控制。 ( 4)非线性 多媒体技术的非线性特点将改变人们传统循序性的读写模式。以往人们读写方式大都采用章、节、页的框架,循序渐进地获取知识,而多媒体技术将借助超 文本链接( Hyper Text Link)的方法,把内容以一种更灵活、更具变化的方式呈现给读者。 ( 5)实时性 当用户给出操作命令时,相应的多媒体信息都能够得到实时控制。 ( 6)信息使用的方便性 用户可以按照自己的需要、兴趣、任务要求、偏爱和认知特点来使用信息,任取图、文、声等信息表现形式。 ( 7)信息结构的动态性 “多媒体是一部永远读不完的书”,用户可以按照自己的目的和认知特征重新组织信息,增加、删除或修改节点,重新建

6、立链。 2、 何为多媒体技术?多媒体系统如何构成? 答:多 媒体技术从不同的角度有着不同的定义。有人定义多媒体计算机是一组硬件和软件设备;结合了各种视觉和听觉媒体,能够产生令人印象深刻的视听效果。在视觉媒体上,包括图形、动画、图像和文字等媒体,在听觉媒体上 ,则包括语言、立体声响和音乐等媒体。用户可以从多媒体计算机同时接触到各种各样的媒体来源。也有人定义多媒体是 “文字、图形、图像以及逻辑分析方法等与视频、音频以及为了知识创建和表达的交互式应用的结合体”。概括起来就是:多媒体技术,即是计算机交互式综合处理多媒体信息 文本、图形、图像和声音,使多种信息建立逻辑连接,集 成为一个系统并具有交互性。

7、简言之,多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术。 一般的多媒体系统主要由如下四个部分的内容组成:多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。 多媒体操作系统: 也称为多媒体核心系统( Multimedia kernel system),具有实时任务调度、多媒体数据转换和同步控制对多媒体设备的驱动和控制,以及图形用户界面管理等。 多媒体硬件系统: 包括计算机硬件、声音 /视频处理器、多种媒体输入 /输出设备及信号转换装置、通信传输设备及 接口装置等。其中,最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片、光盘驱动器等。 媒体处理系统

8、工具:或称为多媒体系统开发工具软件,是多媒体系统重要组成部分。 用户应用软件:根据多媒体系统终端用户要求而定制的应用软件或面向某一领域的用户应用软件系统,它是面向大规模用户的系统产品。 3、 声卡的主要功能有哪些?声卡一定是一块卡吗? 答: 声卡是计算机进行声音处理的适配器。它有三个基本功能:一是音乐合成发音功能;二是混音器( Mixer)功能和数字声音效果处理器( DSP)功能;三是模拟声音信号的输入和输出功能。 声卡处理的声音信息在计算机中以文件的形式存储。声卡工作应有相应的软件支持,包括驱动程序、混频程序( mixer)和 CD 播放程序等。 不一定,通常独立声卡才是一块卡( PCB电路

9、板卡),但也有外置的,就是不需要放到机箱里面的那种。 目前如果对声音要求不是特别高的都用主板集成的,以芯片的形式存在于电脑主板上面。 4、 何为视频卡?有哪几种类型? 答:视频采集卡也叫视频卡,按照其用途可以分为广播级视频采集卡,专业级视频采集卡,民用级视频采集卡。他们的区别主要是采集的图像指标不同,广播级视频采集卡的最高采集分辨率一般为 768X576(均方根值 )PAL 制,或 720X576(CCIR-601 值 )PAL 制 25 帧每秒,或640X480/720X480 NTSC制 30 帧每秒最小压缩比一般在 4: 1 以内。这一类产品的特点是采集的图像分辨率高,视频信噪比高,缺点

10、是视频文件庞大,每分钟数据量至少为 200MB。广播级模拟信号采集卡都带分量输入输出接口,用来连接 BetaCam 摄 /录像机,此类设备是视频采集卡中最高档的,用于电视台制作节目。专业级视频采集卡的级别比广播级视频采集卡的性能稍微低一些,分辨率两者是相同的,但压缩比稍微大一些,其最小压缩比一般 在 6:1 以内,输入输出接口为 AV 复合端子与 S 端子,此类产品适用于广告公司、多媒体公司制作节目及多媒体软件。民用级视频采集卡的动态分辨率一般最大为 384X288, PAL 制 25 帧每秒。另外,有一类视频捕捉卡是比较特殊的,这就是 VCD 制作卡,从用途上来说它是应该算在专业级,而从图像

11、指标上来说只能算民用级产品。 视频采集卡是将模拟摄像机、录像机、 LD 视盘机、电视机输出的视频信号等输出的视频数据或者视频音频的混合数据输入电脑,并转换成电脑可辨别的数字数据,存储在电脑中,成为可编辑处理的视频数据 文件。 按照其用途 可分为广播级视频采集卡,专业级视频采集卡,民用级视频采集卡,它们档次的高低主要是采集图像的质量不同。广播级视频采集卡特点是采集的图象分辨率高 ,视频信噪比高,缺点是视频文件所需硬盘空间大。每分钟数据量至少要消耗 200MB,一般连接 BetaCam摄 /录像机,所以它多用于录制电视台所制作的节目。 专业级视频采集卡的档次比广播级的性能稍微低一些,分辨率两者是相

12、同的,但压缩比稍微大一些,其最小的压缩比一般在 6: 1 以内,输入输出接口为 AV 复合端子与 S 端子,此类产品适用于广告公司和多媒体公司制作节目及多媒体软件应用。 民用级视频采集卡的动态分辨率一般较低,绝大多数不具有视频输出功能。 5、 多媒体软件分为哪几种类型?各有什么功能? 答: 多媒体软件严格地说应该分为两类: 1、编辑。 2、播放。 1、编辑类:业内常用的制作编辑软件有 AE、 PR、 MAX、 PS;还有一些国产的剪辑工具软件;音视频编码格式转换软件等。 2、播放类:常用的播放软件就更多了,暴风影音、迅雷看看、 QQ 影音、 real player、windows media

13、player、 foobar2000 等,有的播放软件还自带格式转换功能。 6、 声音如何数字化?声音数字化主要有几步? 答: 声音信息的数字化过程:模拟音频和数字音频 a) 模拟信号:在一个时间上“连续”是指一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值无穷多个。把在时间和幅度上都是连续的信号称为模拟信号。 b) 对模拟信号进行测量。把时间和幅度都用离散的数字表示的信号称为数字信号。硬件设备便是模拟 /数字转换器( Analog to Digital Converter,即 ADC)。显然,当横坐标的单位越小即两个采样时刻的间隔越小,则越有利于保持原始声音的真实

14、情况,换句话说,采样的频率越大则音质越有保证 ;同理,当纵坐标的单位越小则越有利于音质的提高,即采样的位数越大越好。 数字化就是采样、量化和编码。 每隔相等的一小段时间采样一次,称均匀采样( Uniform sampling) ; 每秒钟需要采集多少个声音样本 采样频率 fs。采样频率一般有 11025HZ( 11KHz,电话音质),22050HZ( 22KHz,广播音质)、 44100Hz( 44KHz, CD 音质)三种。采样周期 T:按一定的时间间隔( T)取值, 1/T 称为采样频率。 把信号的幅度划分是等间隔的,称为线性量化(Quantization),否则称非线性量化 。 量化位数

15、:描述每个采样点值的二进制位数。常见的量化精度有 8 位和 16 位。 声道数:一次采样同时记录的声音波形的个数。 影响声音质量主要因素的因素:采样频率、量化位数、及声音通道数。 存储量 (字节 ) =(采样频率 X 量化位数 X 声道数 )/8(B)一段持续 1 分钟的双声道声音,若采样频率为 44.1kHz,量化精度为 16位,数字化后需要的存贮容量为多少? 44.1 103 16 2 /8 60 (秒) =10.584MBCD 盘只能存储一个小时这样的数字声音。注意: 1、立体声是单声道的两倍,所以在计算文件大小时,不要忘 记乘以声道的系数。 2、采样频率是每秒的采集量。学生自测题: 1

16、、在数字音频信息获取过程中 ,哪种顺序是正确的 A、采样 ,量化 ,压缩 ,存储 B、采样 ,压缩 ,量化 ,存储 C、采样 ,量化 ,存储 ,压缩 D、量化 ,采样 ,压缩 ,存储 2、 5 分钟立体声 32 位采样位数 ,44.1KHZ 采样频率的声音 ,不压缩的数据容量为多少 MB? 5*60*44.1*103*2*32/8/1024/1024=100.9MB 三、声音的多种存储格式:声音文件有多种存储格式,目前最多用的主要有以下几种: 波形音频文件( WAV) MP3 音频文件( MP3) 数字音频文件( MIDI) 光盘数字音频文件( CD-DA) 声音的数字化包括三大步骤:取样、量

17、化、编码 一 取样 对连续信号按一定的时间间隔取样 . 奈奎斯特取样定理认为 ,只要取样频率大于等于信号中所包含的最高频率的两倍 ,则可以根据其取样完全恢复出原始信号 ,这相当于当信号是最高频率时 ,每一周期至少要采取两个点 . 但这只是理论上的定理 ,在实际操作中 ,人们用混叠波形 ,从而使取得的信号更接近原始信号 . 二 量化 取样的离散音频要转化为计算机能够表示的数据范围 ,这个过程称为量化 . 量化的等级取决于量化精度 ,也 就是用多少位二进制数来表示一个音频数据 .一般有 8 位 ,12位或 16 位 .量化精度越高 ,声音的保真度越高 .以 8 位的举例稍微说明一下其中的原理 .若

18、一台计算机能够接收八位二进制数据 ,则相当于能够接受 256 个十进制的数 ,即有 256 个电平数 ,用这些数来代表模拟信号的电平 ,可以 有 256 种 ,但是实际上采样后的某一时刻信号的电平不一定和 256 个电平某一个相等 ,此时只能用最接近的数字代码表示取样信号电平 . 三 编码 对音频信号取样并量化成二进制 ,但实际上就是对音频信号进行编码 ,但用不同的取样频率和不同的量化位数记录声音 ,在单位 时间中 ,所需存贮空间是不一样的 .波形声音的主要参数包括:取样频率 .量化位数 .声道数 .压缩编码方案和数码率等 ,未压缩前 ,波形声音的码率计算公式为:波形声音的码率 =取样频率 *

19、量化位数 *声道数 /8.波形声音的码率一般比较大 ,所以必需对转换后的数据进行压缩 .常见的方案有如下几种: ( 1) 第一代全频带声音编码 脉冲编码调制制( Pulse Code Modulation ,PCM )最简单最基本的编码方法 ,直接赋予取样点一个代码 ,没有进行压缩 ,存贮空间大 ,优点是音质好 . ( 2) 第二代全频带声音压缩编码 MPEG 1 的声音压缩编码是国际上第一个高保真声音数据压缩的国际标准 ,分为三个层次:层 1 主要用于数字盒式录音磁带;层 2 主要应用于数字音频广播 .VCD.DVD 等;层 3 主要应用于 Internet 网上高品质声音的传输和 MP3

20、音乐 . MPEG 2 的声音压缩编码采用与 MPEG 1 相同的声音编译码器 ,但能支持 5.1 声道和 7.1声道的环绕立体声 . 杜比数字 AC 3 是多声道全频带声音编码系统 ,它提供 5 个全频带声道 ,及第 6 个用以表现超低音效果的 .1 声道 .6 个声道的信息在制作和还原的过程中全部实现数字化 ,具有真正的立体声效果 ,主要应用于 家庭影院 .DVD 和数字电视中 . 7、 何为 MIDI 音乐? MIDI 音乐是如何产生的?有什么优点和不足? 答: MIDI 是乐器数字接口 (Musical Instrument Digital Interface)的英文缩写 ,是数字音乐

21、 /电子合成乐器的统一国际标准 .MIDI 规范由美、日几家著名电子乐器厂商于 1983 年共同制定 ,目的是解决各种电子乐器间存在的兼容性问题 .MIDI 规范不仅定义了电脑音乐程序、音乐合成器及其它电子音乐设备交换音乐信号的方式 ,而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备间数据传输的协议 ,可用于为不同乐器创建数字声音 ,能很容易地模拟钢琴、小提琴等传统乐器的声音 .MIDI 本身并不能发出声音 ,它是一个协议 ,只包含用于产生特定声音的指令 ,而这些指令则包括调用何种 MIDI 设备的音色、声音的强弱及持续的时间等 .电脑把这些指令交由声卡去合成相应的声音(如依指令发出

22、钢琴声或小提琴声等) .最初 ,因为不同 MIDI 设备的乐器音色排列方法不一 ,所以会造成同一 MIDI 文件在不同的设备上会出现完全不同的放音效果(比如一个钢琴音色的 MIDI 文件 ,在不同设备上播放时会变成小提琴或者小号的音色) .为避免出现这种混乱情况 ,GM(General MIDI,通用 MIDI)标准被提出并得到了 Windows 操作系统的支持 ,得到了相当广泛的应用 .它规定了前 128 种常用乐器音色的编排方式 ,例如 1 号是钢琴、 66 号是萨克斯管等等 .GM 标准还描述了成为 GM 兼容格式的硬件设备应具有的其它特征 ,如 GM 标准音源同时发音数不少于 24,M

23、IDI 通道为 16,第 10 通道为打击乐声部等等 ,它实际上是对 MIDI 规范的补充 . Roland 公司提出的 GS 标准在兼容 GM标准的基础上 ,对其进行了发展 ,增强了音乐的表现力 它提供比 GM标准数量更多的打击乐器组和更多的特 殊音效 .GS 标准具有广泛的软硬件适应性 ,包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等 .后来 ,Yamaha 公司又提出了基于 GM标准的 XG 标准 .相对于保存真实采样数据的声音文件 ,MIDI 文件显得更加紧凑 ,其文件的大小要比 WAV文件小得多 一分钟的 WAV 文件约要占用 10MB的硬盘空间 ,而一分钟的 MIDI 却只有区区的

24、 3.4KB.现在 ,MIDI已经成为电脑音乐的代名词 .电脑播放 MIDI 文件时 , 有两种方法合成声音 : FM 合成和波表合成 .FM 合成是通过多个频率的声音混合来模拟乐器的声音 ;波表合成是将乐器的声音样本存 储在声卡波形表中 ,播放时从波形表中取出来产生声音 .采用波表合成技术可以产生更逼真的声音 .MIDI 文件有几个变通的格式 ,其中 CMF 文件是随声卡一起使用的音乐文件 ,与 MIDI文件非常相似 ,只是文件头略有差别;另一种 MIDI 文件是 Windows 使用的 RIFF 文件的一种子格式 ,称为 RMID,扩展名为 RMI. MIDI(Musical Instru

25、ment Digital Interface)乐器数字接口 ,是 20 世纪 80 年代初为解决电声乐器之间的通信问题而提出的。 MIDI 是编曲界最广泛的音乐标准格式,可称为“计 算机能理解的乐谱”。它用音符的数字控制信号来记录音乐。一首完整的 MIDI 音乐只有几十 KB大,而能包含数十条音乐轨道。几乎所有的现代音乐都是用 MIDI 加上音色库来制作合成的。MIDI 传输的不是声音信号, 而是音符、控制参数等指令 , 它指示 MIDI 设备要做什么,怎么做, 如演奏哪个音符、多大音量等。它们被统一表示成 MIDI 消息 (MIDI Message) 。传输时采用异步串行通信 , 标准通信波

26、特率为 31.25 ( 1 0.01) KBaud。 MIDI 技术的一大优点就是它送到和存储在电脑里的数据量相当小 ,一个包含有一分钟立体声的数字音频文件需要约 10 兆字节(相当于 7 张软盘的容量)的存储空间。然而,一分钟的 MIDI 音乐文件只有 2KB。这也意味着,在乐器与电脑之间的传输数据是很低的,也就是说即是最低档的电脑也能运行和记录 MIDI 文件。 通过使用 MIDI 序列器可以大大地降低作曲和配器成本,根本用不着庞大的乐队来演奏。音乐编导在家里就可把曲子创作好,配上器,再也用不着大乐队在录音棚里一个声部一个声部的录制了。只需要用录音棚里的电脑或键盘,把存储在键盘里的 MID

27、I 序列器的各个声部的全部信息输入到录音机上即可。 MIDI 程序的设计目标就是要将所要演奏的音乐或音乐曲目,按其进行的节奏、速度、技术措施等要求,转换成 MIDI 控制语言,以便在这些 MIDI 指令的控制之下,各种音源在适当的时间点上,以指定的音色、时值、强度等、演奏出需要的音响。在录音系统中,还要控制记录下这些音响。 MIDI 所适应的范围只是电声乐曲或模拟其他乐器的乐曲。 MIDI 技术的产生与应用,大大降低了乐曲的创作成本,节省了大量乐队演奏员的各项开支,缩短了在录音棚的工作时间,提高了工作效率。一整台电视文艺晚会的作曲、配器、录音,只需要一位音乐编导、一位录音 师即可将器乐作(编)

28、曲、配器、演奏,录音工作全部完成 midi 优点是在把音乐的构造看得一目了然,可以拆分开研究,自由添加减少单个轨道音色乐器等。可以自己制造组合编配音乐。缺点是需要专门的音乐编辑软件,除了电脑外一般的播放器不认。 8、 什么是图像?在空间上和二维平面上图像是如何表示的? 答: 是由扫描仪、摄像机等输入设备捕捉实际的画面产生的数字图像 ,是由像素点阵构成的位图 。 二维图形就是平面图形,无需解释;二维码就是二维条形码,是用某种特定的平面几何图形,按一定规律在一个平面上分布的黑白相间的图形和符号,记录着数据和 信息,在代码编制上巧妙地利用构成计算机内部逻辑基础的“ 0”、“ 1”比特流的概念,使用若

29、干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理。二维空间是指仅由长度和宽度两个要素所组成的平面空间,即在一个平面上延伸扩展的无限空间。 图形与图像的区别如下: 基本概念 图形是指由外部轮廓线条构成的矢量图 .即由计算机绘制的直线、圆、矩形、曲线、图表等;而图像是由扫描仪、摄像机等输入设备捕捉实际的画面产生的数字图像 ,是由像素点阵构成的位图 . 数据描述 图形:用 一组指令集合来描述图形的内容 ,如描述构成该图的各种图元位置维数、形状等 .描述对象可任意缩放不会失真 . 图像:用数字任意描述像素点、强度和颜色 .描述信息文件存储量较大

30、,所描述对象在缩放过程中会损失细节或产生锯齿 . 屏幕显示 图形:使用专门软件将描述图形的指令转换成屏幕上的形状和颜色 . 图像:是将对象以一定的分辨率分辨以后将每个点的信息以数字化方式呈现 ,可直接快速在屏幕上显示 . 适用场合 图形:描述轮廓不很复杂 ,色彩不是很丰富的对象 ,如:几何图形、工程图纸、 CAD、 3D 造型软件等 . 图像:表现含有 大量细节(如明暗变化、场景复杂、轮廓色彩丰富)的对象 ,如:照片、绘图等 ,通过图像软件可进行复杂图像的处理以得到更清晰的图像或产生特殊效果 . 编辑处理 图形:通常用 Draw 程序编辑 ,产生矢量图形 ,可对矢量图形及图元独立进行移动、缩放

31、、旋转和扭曲等变换 .主要参数是描述图元的位置、维数和形状的指令和参数 . 图像:用图像处理软件( Paint、 Brush、 Photoshop 等)对输入的图像进行编辑处理 ,主要是对位图文件及相应的调色板文件进行常规性的加工和编辑 .但不能对某一部分控制变换 .由于位图占用存储空间较大 ,一般要进行数据压缩 . 技术关键 图形:图形的控制与再现 . 图像:对图像进行编辑、压缩、解压缩、色彩一致性再现等 9、 什么是计算机的图像处理?数字图像处理技术包括哪些内容? 答: 图像处理就是将图像转化为一个数字矩阵存放在计算机中,并采用一定的算法对其进行处理。图像处理的基础是数学,最主要任务就是各

32、种算法的设计和实现。目前,图像处理技术已经在很多方面有着广泛的应用。如通讯技术、遥感技术、生物医学、工业生产、计算机科学等等。根据应用领域的不同要求,可以将图像处理技术划分为许多分支,其中比较重要的分支有:图像数 字化:通过采样和量化将模拟图像变成便于计算机处理的数字形式。图像的增强和复原:主要目的是增强图像中的有用信息,削弱干扰和噪声,使图像清晰或将转化为更适合分析的形式。图像编码:在满足一定的保真条件下,对图像进行编码处理,达到压缩图像信息量,简化图像的目的。以便于存储和传输。图像重建:主要是利用采集的数据来重建出图像。图像重建的主要算法有代数法、傅立叶反投影法和使用广泛的卷积反投影法等。

33、模式识别:识别是图像处理的主要目的。如:指纹鉴别、人脸识别等是模式识别的内容。当今的模式识别方法通常有三种:统计识别法 、句法结构模式识别法和模糊识别法。计算机图形学:用计算机将实际上不存在的,只是概念上所表示的物体进行图像处理和显现出来。 10、 图像的数字化过程的基本 步骤是什么? 答:图像数字化过程 要在计算机中处理图像 ,必须先把真实的图像(照片、画报、图书、图纸等)通过数字化转变成计算机能够接受的显示和存储格式 ,然后再用计算机进行分析处理 .图像的数字化过程主要分采样、量化与编码三个步骤 .1采样 采样的实质就是要用多少点来描述一幅图像 ,采样结果质量的高低就是用前面所说的图像分辨

34、率来衡量 .简单来讲 ,对二维空间上连续的图像在水平 和垂直方向上等间距地分割成矩形网状结构 ,所形成的微小方格称为像素点 .一副图像就被采样成有限个像素点构成的集合 .例如:一副 640*480 分辨率的图像 ,表示这幅图像是由 640*480 307200 个像素点组成 . 如图 2-2-15 所示 ,左图是要采样的物体 ,右图是采样后的图像 ,每个小格即为一个像素点 .采样频率是指一秒钟内采样的次数 ,它反映了采样点之间的间隔大小 .采样频率越高 ,得到的图像样本越逼真 ,图像的质量越高 ,但要求的存储量也越大 . 在进行采样时 ,采样点间隔大小的选取很重要 ,它决定了采样后的图像能真实

35、地反映原图像 的程度 .一般来说 ,原图像中的画面越复杂 ,色彩越丰富 ,则采样间隔应越小 .由于二维图像的采样是一维的推广 ,根据信号的采样定理 ,要从取样样本中精确地复原图像 ,可得到图像采样的奈奎斯特( Nyquist)定理:图像采样的频率必须大于或等于源图像最高频率分量的两倍 .2量化 量化是指要使用多大范围的数值来表示图像采样之后的每一个点 .量化的结果是图像能够容纳的颜色总数 ,它反映了采样的质量 . 例如:如果以 4 位存储一个点 ,就表示图像只能有 16 种颜色;若采用 16 位存储一个点 ,则有216 65536 种颜色 .所以 ,量化位数越来越大 ,表示图像可以拥有更多的颜

36、色 ,自然可以产生更为细致的图像效果 .但是 ,也会占用更大的存储空间 .两者的基本问题都是视觉效果和存储空间的取舍 . 假设有一幅黑白灰度的照片 ,因为它在水平于垂直方向上的灰度变化都是连续的 ,都可认为有无数个像素 ,而且任一点上灰度的取值都是从黑到白可以有无限个可能值 .通过沿水平和垂直方向的等间隔采样可将这幅模拟图像分解为近似的有限个像素 ,每个像素的取值代表该像素的灰度(亮度) .对灰度进行量化 ,使其取值变为有限个可能值 . 经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素 ,灰度取值 上表现为有限个离散的可能值的图像称为数字图像 .只要水平和垂直方向采样点数足够多 ,

37、量化比特数足够大 ,数字图像的质量就比原始模拟图像毫不逊色 . 在量化时所确定的离散取值个数称为量化级数 .为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长 ,一般可用 8 位、 16 位、 24 位或更高的量化字长来表示图像的颜色;量化字长越大 ,则越能真实第反映原有的图像的颜色 ,但得到的数字图像的容量也越大 . 例如:图 2-2-16,沿线段 AB(左图)的连续图像灰度值的曲线(右图) ,取白色值最大 ,黑色值最小 . 先采样:沿线段 AB 等间隔进行 采样 ,取样值在灰度值上是连续分布的 ,如图 2-2-17左图; 再量化:连续的灰度值再进行数字化( 8 个级别的灰度级标尺)

38、 ,如图 2-2-17 右图 . 3压缩编码数字化后得到的图像数据量十分巨大 ,必须采用编码技术来压缩其信息量 .在一定意义上讲 ,编码压缩技术是实现图像传输与储存的关键 . 目前已有许多成熟的编码算法应用于图像压缩 .常见的有图像的预测编码、变换编码、分形编码、小波变换图像压缩编码等 . 当需要对所传输或存储的图像信息进行高比率压缩时 ,必须采取复杂的图像编码技术 .但是 ,如果没有一个共同的标准做基础 ,不同系统间 不能兼容 ,除非每一编码方法的各个细节完全相同 ,否则各系统间的连接十分困难 . 为了使图像压缩标准化 ,20 世纪 90 年代后 ,国际电信联盟 (ITU)、国际标准化组织

39、ISO 和国际电工委员会 IEC 今年来已经制定并继续制定一系列静止和活动图像编码的国际标准 ,现已批准的标准主要有 JPEG 标准、 MPEG 标准、 H.261 等 .这些标准和建议是在相应领域工作的各国专家合作研究的成果和经验的总结 .这些国际标准的出现也使图像编码尤其使视频图像编码压缩技术得到了飞速发展 .目前 ,按照这些标准做的硬件、软件产品和专用集成电路已经在市场上大量 涌现(如图像扫描仪、数码相机、数码摄录像机等) ,这对现代图像通信的迅速发展和开拓图像编码新的应用领域发挥了重要作用。 11、 图像数字化的主要设备有哪些? 答: 数字化仪,大量地用于工程中设计图纸的输入,用于电脑

40、辅助设计( CAD)。近年来,它也用于非键盘方式(手写)输入汉字,加用于个人数字助理(简称 PDA)。使用它,无需学习任何汉字输入方法,就能自然、方便地输入汉字。使用它输入汉字时,不会影人的思维,而且,它还有键盘无法比拟的功能:留下手迹签名。它很适用于首长和年长人士输入汉字时使用。 数字化仪的工作原理大致如下:定 位装置在数字板的表面上移动时,通过电磁、静电感应,将数字板上的图形坐标信息一点点地数字化(这就是“数字化仪”一名的来历),并传送到电脑之中,再经过电脑的处理,就能在屏幕上还原为一幅原来的图形。这就完成了图形的数字化和输入过程。当然,作为汉字输入的一种非主流方式,它的输入速度还不够快,

41、正确率也低于键盘输入。许多带有图像的文件都使用模拟图像如 35mm 幻灯片、透射片或反射片。要获得一个数字图像必须将图像中的像素转换成数字信息,以便在计算机上进行处理和加工。将模拟图像转换成数字图像的工作,通常可由扫描仪来完成。扫描 仪测量从图片发出或反射的光,依次记录光点的数值并产生一个彩色或黑白的数字拷贝。这个图像被翻译成一系列的数字后存储在计算机的硬盘上或者其他的电子介质上,如可移动式硬盘,图形CD 或记录磁带等。一旦图像被转换成数字文件,它就能够被电子化地从一台计算机传输到另一台计算机上。 12、 图像的描述信息(属性)主要有哪些?何为真彩色? 答: 图像的三个基本属性描述一幅图像需要

42、使用图像的属性。图像的属性包含分辨率、像素深度、真 /伪彩色、图像的表示法和种类等。本节介绍前面三个特性。 5.4.1 分辨率我们经常遇到的分辨率有两种:显示分辨 率和图像分辨率。 1. 显示分辨率显示分辨率是指显示屏上能够显示出的像素数目。例如,显示分辨率为 640 480 表示显示屏分成 480 行,每行显示640 个像素,整个显示屏就含有 307200 个显像点。屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。除像手提式那样的计算机用液晶显示LCD(liquid crystal display)外,一般都采用 CRT 显示,它类似于彩色电视机中的 CRT。显示屏

43、上的每个彩色像点由代表 R, G, B三种模拟信号的相对强度决定,这些彩色像点就构成一幅彩色图像。计算机 用的 CRT 和家用电视机用的 CRT 之间的主要差别是显像管玻璃面上的孔眼掩模和所涂的荧光物不同。孔眼之间的距离称为点距 (dot pitch)。因此常用点距来衡量一个显示屏的分辨率。电视机用的 CRT 的平均分辨率为 0.76 mm,而标准 SVGA显示器的分辨率为 0.28 mm。孔眼越小,分辨率就越高,这就需要更小更精细的荧光点。这也就是为什么同样尺寸的计算机显示器比电视机的价格贵得多的原因。早期用的计算机显示器的分辨率是 0.41 mm,随着技术的进步,分辨率由 0.41 0.3

44、8 0.35 0.31 0.28 一直到 0.26 mm以下。显示器的价格主要集中体现在分辨率上,因此在购买显示器时应在价格和性能上综合考虑。 2. 图像分辨率图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图,如果组成该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点 (dots per inch, DIP)表示。如果用 300 DIP 来扫描一幅 8 10的彩色图像,就得到一幅 2400 3000 个像素的图像。分辨率越高,像素就越多。图像分辨率 与显示分辨率是两个不同的概念

45、。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为 640 480,那末一幅 320 240 的图像只占显示屏的1/4;相反, 2400 3000 的图像在这个显示屏上就不能显示一个完整的画面。这里顺便说一下,在显示一幅图像时,有可能会出现图像的宽高比 (aspect radio)与显示屏上显示出的图像的宽高比不一致这种现象。这是由于显示设备中定义的宽高比与图像的宽高比不一致造成的。例如一幅 200 200 像素的方形图,有可能在显示设备上显示的 图不再是方形图,而变成了矩形图。这种现象在 20 世纪 80 年代的显示设备上经常遇到。 5.4.

46、2 像素深度像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。例如,一幅彩色图像的每个像素用 R, G, B 三个分量表示,若每个分量用 8 位,那末一个像素共用 24 位表示,就说像素的深度为 24,每个像素可以是 224=16 777 216 种颜色中的一种。在这个意义上,往往把像素深度说成是图像深度。表示一个像素的位数越多,它能表达的 颜色数目就越多,而它的深度就越深。虽然像素深度或图像深度可以很深,但各种 VGA 的颜色深度却受到限制。例如,标准 VGA 支持 4 位 16 种颜色的

47、彩色图像,多媒体应用中推荐至少用 8位 256 种颜色。由于设备的限制,加上人眼分辨率的限制,一般情况下,不一定要追求特别深的像素深度。此外,像素深度越深,所占用的存储空间越大。相反,如果像素深度太浅,那也影响图像的质量,图像看起来让人觉得很粗糙和很不自然。在用二进制数表示彩色图像的像素时,除 R, G, B分量用固定位数表示外,往往还增加 1 位或几位作为属性 (Attribute)位。例 如, RGB5 5 5 表示一个像素时,用 2 个字节共 16 位表示,其中 R, G, B各占 5位,剩下一位作为属性位。在这种情况下,像素深度为 16 位,而图像深度为 15 位。属性位用来指定该像素

48、应具有的性质。例如在 CD-I 系统中,用 RGB5 5 5 表示的像素共 16 位,其最高位 (b15)用作属性位,并把它称为透明 (Transparency)位,记为 T。 T 的含义可以这样来理解:假如显示屏上已经有一幅图存在,当这幅图或者这幅图的一部分要重叠在上面时, T位就用来控制原图是否能看得见。例如定义 T=1,原图完全看不见; T=0,原图能完全 看见。在用 32 位表示一个像素时,若 R, G, B 分别用 8 位表示,剩下的 8 位常称为通道(alphachannel)位,或称为复盖 (overlay)位、中断位、属性位。它的用法可用一个预乘通道(premultiplied

49、 alpha)的例子说明。假如一个像素 (A, R, G, B)的四个分量都用规一化的数值表示, (A, R, G, B)为 (1, 1, 0, 0)时显示红色。当像素为 (0.5,1,0,0)时,预乘的结果就变成 (0.5,0.5,0,0),这表示原来该像素显示的红色的强度为 1,而现在显示的红色的强度降了一半。用这种办法 定义一个像素的属性在实际中很有用。例如在一幅彩色图像上叠加文字说明,而又不想让文字把图复盖掉,就可以用这种办法来定义像素,而该像素显示的颜色又有人把它称为混合色 (keycolor)。在图像产品生产中,也往往把数字电视图像和计算机生产的图像混合在一起,这种技术称为视图混合 (video keying)技术,它也采用通道。 5.4.3 真彩色、伪彩色与直接色搞清真彩色、伪彩色与直接色的含义,对于编写图像显示程序、理解图像文件的存储格式有直接的指导

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 复习参考

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。