ImageVerifierCode 换一换
格式:DOC , 页数:8 ,大小:298KB ,
资源ID:4047973      下载积分:20 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-4047973.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(华师大版第l章信息与信息编码.doc)为本站会员(hw****26)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

华师大版第l章信息与信息编码.doc

1、华师大版(0407)第 1 章 信息与信息编码本章先介绍信息的概念,然后讨论信息的表示和编码。1.1 信息及其特征在我们日常的生活中,信息(information) 到处都是。春暖花开、喜笑颜开、人稠物穰、国泰民安等都蕴涵着一定的信息。在广播、电视和报刊杂志中,信息也是人们常见的词汇。那么,到底什么是信息,它有哪些特征呢?111 信息人们从不同的角度给信息提出了各种定义和说法,但是至今还没有一个公认的、统一的、明确的定义。一般认为,信息是表示事物运动的状态及其变化的方式 。尽管我们生活在信息的海洋中,但是并不是所有信息都是有意义的。信息既是对世界上各种事物的特征和事物运动变化的反映,又是事物之

2、间相互作用和联系的表示。信息能够以不同于原来的形式进行传递,传递后又 能够以原来的形式再现。从认识论的角度看,信息的功用是消除认识的不确定性,信息量是用消除不确定性的多少来衡量的。比如,你有一道几何题做不出来,到图书馆去查了许多书,又请教了老师和同学。如果你会解题了,那么你就获得有关信息;反之你就没有得到有关信息,因为你的不确定性问题没有消除。人类很早就感知到了信息的存在,在生产实践和社会实践中,对信息的重要性逐步加深了认识。为了便于信息的交流,人类发明了语言、文字、纸张、印刷、电报、电话、广播、电视,直至今天的计算机网络。但是,把信息与物质和能源相提并论作为人类社会的三大资源,把信息学作为一

3、门独立的学科来研究,则是 20 世纪中叶后的事情。信息只有与人类的生产实践和社会活动相结合才能发挥作用, “鼠标+水泥”形象地表达了这个意思。现在,我们国家已经提出,要以信息化带动工业化,以工业化促进信息化,实现国民经济和社会跨越式的发展。112 信息的特征信息有哪些特征呢?第一,信息必须依附于某种载体。信息的载体就是承载信息的物体。空气、声音、符号、文字、图像、生物、电磁波以及纸张、胶片、磁带、磁盘、光盘等,甚至人的大脑,都是信息的载体。比如,你从电台听到的气象预报是通过声音、语言和电磁波告诉你的,你从报纸看到的新闻是通过纸张、油墨和文字告诉你的。不存在没有载体的信息。第二,信息是可以共享的

4、。比如,中央电视台每晚播放的新闻,全国可能有好几亿的人都在观看、共享着,而播报人员却不会因为播放这些信息而失去了它们。物质和能源一旦被人占有,其他人就得不到了,而信息则不然。第三,信息是可以处理的。信息可以加工、传输、储存,特别是经过人的分析、综合和提炼等加工,可以增加它的使用价值。比如,一个商场每天卖出许多商品,如果分析一下这个信息,就可以知道哪些商品畅销,哪些商品滞销,哪些柜台营业额高,哪些柜台营业额低。另外,人们还能够利用各种信息技术,可以把信息从一种形态变为另一种形态。例如,打电话时,需要把发话人的信息从声音的形态变成电信号的形态,通过电话线路传送,在受话端再把信息从电信号的形态变回到

5、声音的形态送给受话人。如果不能进行这两种转换,也就没有今天的电话了。第四,信息有时效性。比如,上个月的气象预报对于明天的出行通常是没有用的。所华师大版(0407)以,人们总是要及时掌握最新的、有用的信息。为此,需要有能力识别信息,能够判定什么是过时的信息,什么是虚假的信息。1.2 信息的编码计算机是作为数值计算工具而发明的,现代的计算机的内部是采用二进制(bimry)代码进行运算和储存的。要使用计算杌进行信息处理,就必须把要处理的信息用二进制代码来表示,把问题求解转变为二进制数值的计算问题。当今的计算机已经能够处理文字、声音、图片、动画(animation)和影像等信息,这得归功于信息的数字化

6、,或者说信息的编码。121 记数系统记数系统(number representation system),简称记数制或数制,是用一组统一的符号和规则来表示数的方法。根据基数的不同,有十进制、二进制和十六进制等。在日常生活中,我们大多采用“十进制” ,每位数都用“09”十个符号中的一个来表示,并按照 “逢十进一 的规则进位:当每位数的值达到 10 时,向高位进一,而该位变为 0。其实,生活中还用到其他的进制,如时钟的分秒用的是 60 进制,英制的许多度量单位用的是 12 进制。由于计算机内部工作采用的是二进制,也就是说,数的每一位(bit)只用“O”和“1”两个符号之一来表示,在计算时按照“逢二

7、进一”的规则进位:当某位数的值达到 2 时,向高位进一,而该位变为 0。例如,1 加 1 的结果为 10,读作 “幺零” 。计算机之所以采用二进制,是因为它便于实现。晶体管的导通和截止、电压的高和低、磁表面的磁极性相反的两种状态、光盘薄膜上有“凹坑 和 “陆地”等,这两种截然不同的物理状态都可以用来分别表示二进制数的 1 和 0。顺便提一下,在计算机采用的二进制表示法中,数的正号和负号也是分别用符号 0 和 1 来表示的。下面简要介绍十进制数和二进制数之间的转换方法。1十进制数转换成二进制数对整数部分采用“除 2 取余”法,即把一个十进制的整数部分连续地被 2 除,将依次得到的余数按相反顺序排

8、列,得到的就是相应二进制数的整数部分。对小数部分采用“乘 2 取整”法,即把一个十进制数的小数部分连续地乘以 2,将依次得到的整数按顺序排列,得到的就是相应二进制数的小数部分。例如,把十进制数 3725 转换为二进制数。其整数部分连续地被 2 除得到的余数依次是 1、0、1、0、O、1,而小数部分连续乘以 2 得到的整数依次是 0、1,因此结果是100101.01。华师大版(0407)即(37) 10= (100101)2。即(0.25) 10= (0.01)2。所以,(37.25) 10= (100101.01)2。2二进制数转换成十进制数把二进制数小数点前的第 n 位的值乘以 2n-1,把

9、小数点后的第 m 位的值乘以 2-m,然后把这些结果值相加即可。例如,100101.01 的十进制数是125+024+023+122+021+120+02-1+12-2=37.25。二进制数不便于书写和记忆,人们经常采用十六进制数或八进制数来表示它们,因为它们之间的转换非常方便。例如,用十六进制数表示时,只要从小数点两侧每 4 位二进制数用一个十六进制数字(注意, 1015 分别用 AF 表示)代替即可。例如,上述的 37.25,用十六进制表示时为 25.4。122 文字的编码我们经常碰到的文字是英文和汉字,它们的二进制编码(coding) 有相应的国家标准。英文字母和常用的数学符号与标点符号

10、等字符通常采用 ASCII(American Standard Code for Information Interchange,美国信息交换标准码)编码(见表 121) 。一个字符用七位二进制数表示存放时占八位即一个字节(byre)。ASCII 码共有 128 个码位,前 32 个是控制字符,用于通信、外部设备和文本等方面的控制。例如,回车、换行符就在这个区域。第 33 个是空格符,而第 128 个是 delete 符,这 34 个字符是不可打印的。在表 1-21 中,b7b6b5 表示编码的高三位,b4b3b2b1 表示编码的低四位。例如,字母 H 的七位 ASCII 码为1001000。

11、英文字母按词典顺序进行编码,这给英文词汇的排序和检索带来很大方便;十进制数码高三位编码(011)相同,低四位按二进制编码顺序表示,这给十进制数字转换为二进制带来很大方便(对于其他拉丁语系的文字,ASCII 码有相应的版本)。IBM 公司,除在 PC机中使用 ASCII 码外,在其他计算机中均采用他们的 EBCDIC(扩充的二十进制交换码) 编码。它采用八位二进制数表示,故有 256 个码位。汉字编码的国家标准是信息交换用汉字编码字符集基本集(GB 2312-80),一个汉字的交换码用两个 ASCII 字符表示,采用导入字符和导出字符指示文本中的汉字区域。该标准只使用 ASCII 编码中第 34

12、 至第 127 个可打印字符,一共 94 个。所以,最多可编 94 区94位即8836 个符号。该标准包括 6763 个汉字和 682 个特殊符号。为了避免使用导入字符和导出字符且能与 ASCII 字符相区分,存放时将每个字节的最高位置 1,称为内码( 我国港台地区采用的是 BIG5 编码体系)。近年来,我国又开始使用 GB 13000 新的国家标准。该标准规定了通用多八位编码字符集(UCS) ,它用四个 8 位,分别表征组、面、行、列,可表示 232 个符号。目前启用的华师大版(0407)UCS-2,规定统一用两个 8 位表示一个文字符号。它不是依据语言而是按文字编码的,所以是跨国度、跨地区

13、的。同一个拉丁字母、同一个汉字、同一个符号,不论是哪个国家,都采用相同的 16 位编码。该标准包含 65536 个符号,其中有 20902 个汉字。表 121 ASCII 码表顺便指出,汉字输入法是另一种形式的编码,它们是用键盘字符来表示汉字的方法。123 声音的编码声音是由声波传递的,而声波是由各种频率的正弦波合成的。这是一种模拟信号,反映声音强弱的是波的振幅,反映声音高低的是波的频率。最常用的编码方法是脉冲编码调制(pulse code modulation,PCM),它需要经过采样、量化与编码两个步骤,如图 121所示。当然,这些工作都是由硬件(如声卡) 完成的。华师大版(0407)图

14、1.2.1 声音编码第一步是采样,就是每隔一定的时间 t,采集一个波幅“样品”的值。譬如,对一个振幅在-4V +4V 间的波形,每隔时间 t 取它一个振幅值,以后就用这些值来代表原来的波形。显然,t 越小即采样频率越高,但得到的结果数据就越多。科学家已经证明,采样频率至少应该是原信号的最高频率的两倍,才能使采样所得的数码还原成模拟声音信号时不会产生大的失真。目前,普通的音乐采用 11.025 kHz 的采样频率,而高品质的音乐采用 44.1 kHz的采样频率。第二步是量化与编码。采样得到的值是随机变化的,如振幅在-4V+4V 间的波形,采样值可以是-4V+4V 间的任意值。量化与编码就是用一定

15、位数的二进制数来表示采样的值。现在的计算机通常使用 16 位声卡(采样值用 16 位二进制数表示 ),即将可能得到的采样值划分成 65536 个等级,相当于十进制-3276832767。按上例,-4V +4V 之间的值分为 65536 个等级,每一等级的值分别用相当于十进制-32768 32767 范围内的一个 16 位二进制数表示。所有的采样值都按就近等级取值,好比十进制数的四舍五入。这样,对于一首歌曲的声波,每隔固定的时间 t(采样频率的倒数)采样一次,然后把这些样品值用一定的二进制值表示,这些二进制数按采样时间的先后顺序存放在一起就是该歌曲的数字化表示。当该数字化的歌曲播放时,声卡会将它

16、们还原为原来的声波。另一种音频编码方法称为 MIDI(乐器数字化接口) 。一首 MIDI 乐曲记录的不是音乐本身,而是用数字描述的乐谱,包括有音符、节拍、定时以及所用乐器等。MIDI 标准规定了128 种乐器,一首乐曲中至多可用 16 种乐器。播放时,由声卡根据 “乐谱”产生基波、谐波合成为音乐。利用 MIDI,用户可以通过键盘自己编曲子。类似的一种方法称为 MOD,它的声音是由预先录制好的乐器标准声音样本合成的。这样,用户可以自己定义乐器,也不受 128 种或 16 种乐器的限制。缺点是声音样本制作麻烦,播放时需要花费比较多的CPJ 时间。124 图像的编码一幅彩色图像(image) 可以看

17、成是由许许多多个彩色的点 (像素)组成的,每个点有深浅不同的颜色,如图 122 所示。以分辨率为 800600 的计算机显示屏为例,一屏总共有48 万个小圆点。每个小圆点称为一个像素,每个像素有一种颜色。我们知道,任何一种颜色均可以用红、蓝、绿三种原色调配出来,假如每种原色从浅到深分为 256 个等级,每个颜色的深浅度可用 O255 范围中的一个整数表示。任何一个像素均可用三个字节二进制华师大版(0407)数据来表示。这样,一幅图像需要用 144 万个字节的数据。采用这种方法表示的图像文件是位图(bitmap)图像文件,其扩展名为.bmp 。电视和电影是由连续的图像帧组成,我国采用的 PAL

18、制式的电视匐秒 25 帧,电影每秒 24 帧。以 800600 的分辨率为例,一秒钟的电视需要处理 14425 万字节的数据,其容量大约是 36 M 字节。所以,能够播放视频的计算机需要有处理速度较高的 CPU 和容量较大的存储器。125 信息的压缩显然,一个多媒体文件,例如一幅画、一段音乐或一段影视节目数字化后所生成的信息量比较大。所以,声音、图像和视频的数字化信息一般都要采用压缩(compress)技术。比如,MP3 是音乐信息压缩标准,JPG 是静态图像信息的压缩标准, MPEG 和 RM 是视频信息的压缩标准等这些标准都有很高的压缩比。一般地说,信息都是可以压缩的。之所以可以压缩,是因

19、为有冗余信息存在的缘故。在用高级语言编写的规范格式的程序中,也会出现比较多的冗余数据。例如,程序代码中含有比较多的空格,如果把一串空格用两个字节表示,其中一个字节作为空格的代码,另一个字节表示空格个数,就可以压缩相当的存储容量。又如,高级语言使用的关键字出现的频率比较高,如 BIGEN、 END、THEN、PROCEDURE 等,如果用一个控制字符加一个编码表示它们,也能减少一定的存储量。让我们看一个例子假设有 8 个字节的数据:00000000 00000111 10000000 0000000000000000 00000000 00000000 11111111这是由一串 0 和 1 组

20、成的数据,0 和 1 的重复的次数很多。假定用一个字节表示一串 0或 1,字节的第一位表示是 0 的串还是 1 的串,后七位表示 0 或 l 的个数,因为有七位,可以表示从 0 到 127 之间的任一整数,若 0 或 1 的重复次数超过 127 则再用一个字节。这样,上述数据可用下列字节表示:00001101(13 个 0) 10000100(4 个 1)00100111(39 个 0) 10001000(8 个 1)这里只用了 4 个字节就完整地表示出原来 8 个字节的数据内容,压缩了 50。另一种方法是利用码元的出现频率,对于出现频率高的用较短的编码,对于出现频率低的用较长的编码。例如,在

21、英语的文章中,英文字母出现的频率大不相同:频率最高的三个字母是 E、T 和 A,分别占 13、9和 8;频率最低的是 Z、Q 和 X,分别占O.25、0.25和 0.5。如果用 000、0010 和 OO11 表示 E、T 和 A,用华师大版(0407)1111111、1111110 和 111101 表示 Z、Q 和 X,其他字母类似,则能够压缩不少存储量。这种不定长编码是霍夫曼(Huffman)发明的,故称为霍夫曼编码。上述压缩方法是无损压缩,也就是说,能够完全还原为原来的数据。另一种方法是有损压缩,也就是说,还原的数据没有原来的精确,质量有所损失,但在可接受的限度之内。这种方法主要用于音

22、频和视频数据,它们除了使用类似于上述方法外,还利用了人们感观能力的限制。例如,普通人对于过低的和过高的频率的声音不太能够分辨,如果将这部分略去,则能够大大压缩数据量,又能够使复原后的声音质量保持在可接受的限度之内。同样,对于图形和图像,冗余表现在三个方面。一是空间冗余。如在一幅照片上,许多相邻的像素具有同样的颜色和亮度,例如蓝色的天空和白色的衣服等。二是时序冗余。像一部电影的武打场面,虽然动作眼花缭乱,但实际上(如果不切换场景 )后面一帧图像与前面一帧图像相比,画面上大部分像素都没有变,特别是背景。电影每秒钟要放 24 帧,即使正在打斗中的人,在 124 秒中也不是身体的每个部位都在动的。三是

23、光谱 (spectral)冗余。明亮的像素在所有的颜色中都明亮,不局限于个别颜色。而且,人眼对亮度比对颜色敏感。利用这些冗余特征,多媒体信息可以大幅度地压缩。例如,MPEG-1 的压缩比,理论值是200:1,一般实际实现的是 50:l。VCD 就是采用 MPEG-1 标准来压缩图像信息的。本章练习一、填空题1人类的生存、发展除了与外界有物质的交换、能量的交换外还必须要有 的交换。2信息的功用是消除认识的 ,信息量是用消除 的多少来衡量的。3同样的信息可以由广播、电视或报纸等手段通过声音、图形、图像或文字进行表现与传播,这些声音、图形、图像或文字都是信息的 4信息可以多次重复使用,而不会损耗和消

24、失。这说明信息是可以 的。5同样的信息经过不同的分析、综合和提炼,可以得到不同的内在价值。这说明信息是可以 的。6人们要及时掌握最新的有用的信息,因为信息有 性。7当今的计算机已经能够处理文字、声音、图形、图像等信息,这得归功于信息的 化。8信息的 化是计算机进行信息处理的基础。9数制转换。(1101)2=( )10 (10.11)2= ( )10(13)10= ( )2 (6.25)10=( )2(101010)2=( )8 (1000011)z= ( )16(123)8= ( )10 (123)16= ( )1010ASCII 码包含 和控制字符共有 128 个码位,其中可打印字符 个。1

25、1一个字符的 ASCII 码用 二进制数表示,存放时占一个字节,即 8 位。12字符“5”的 ASCII 码是 0110101,那么“0”的 ASCII 码是 ;“A”的ASCII 码是 1000001,那么“ C”的 ASCII 码是 。13GB2312-80 汉字国标码容纳了 个常用汉字。14最近开始使用的 GB13000 标准规定统一用两个 位表示一个文字符号,同一个拉丁字母、同一个汉字、同一个符号,不论是哪个国家,都采用相同的编码,该标准包华师大版(0407)含有 个符号,其中有、 个汉字。15使用不同的输入法输入同一个汉字,该汉字在计算机内部的表示形式是 的。16对声音的编码常有 和

26、 ,前者是用数字记录声波的波形即音乐本身,后者是用数字描述乐谱。1 7 是将声音变换为数字化信息,又将数字化信息变换为声音的设备。18存储画面为 640480 点阵,黑白两色的位图图像文件至少需要 字节。19画面的分辨率为 800600,其中每一像素用 24 位颜色来显示,在每秒 25 帧的速率下,一分钟视频信号要占用 兆字节空间。20为了在有限的容量中存储更多的信息,为了提高信息的传输效率,一般都要对数字化信息进行 处理。不同的数据都有不同的数据压缩标准, MP3、是 压缩标准,JPG 是 压缩标准,MPEG、RM 是 压缩标准。二、思考题1为什么作为计算工具问世的计算机能成为信息处理的工具?除了计算机本身的特点之外还有什么重要的原因?2 “八进制”数应有几个基本数码?其运算规律是什么?3汉字编码直接用 7 位二进制表示行不行?为什么?4GB 231280 汉字国标码有何利弊?5提高声音和图像数字化精度有哪些途径?受到哪些条件的制约?6怎样从时间和空间的角度用好信息压缩技术?

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。