多媒体视频技术.ppt

上传人:ga****84 文档编号:448683 上传时间:2018-10-08 格式:PPT 页数:97 大小:1.25MB
下载 相关 举报
多媒体视频技术.ppt_第1页
第1页 / 共97页
多媒体视频技术.ppt_第2页
第2页 / 共97页
多媒体视频技术.ppt_第3页
第3页 / 共97页
多媒体视频技术.ppt_第4页
第4页 / 共97页
多媒体视频技术.ppt_第5页
第5页 / 共97页
点击查看更多>>
资源描述

1、八 课程总复习,课程内容回顾,1 多媒体技术概论,媒体多媒体超媒体,英文为Media(Medium),又常被称为媒介;信息需要借助于媒体来传播,所以说媒体是信息的载体.,媒体的分类,根据国际电信联盟(ITU:International Telecomunication Union)下属的国际电报电话咨询委员会(CCITTConsultative Committee International Telegraph and Telephone)的定义,目前,媒体可分为下列五大类:感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体。,感觉媒体(Perception Medium),感觉媒体是指能直接作

2、用于人们的感觉器官,使人能直接产生感觉的一类媒体。感觉媒体包括人类的各种语言、文字、音乐、自然界的其他声音、静止的或活动的图像、图形和动画等信息。,表示媒体(Representation Medium),表示媒体是为了加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体。借助于此种媒体,便能更有效地存储感觉媒体或将感觉媒体从一个地方传送到遥远的另一个地方。常见的可概括为文本、图形、图像、音频、视频、动画、以及各种信息的数字化编码表示,表示媒体的例子,显示媒体(Presentation Medium),显示媒体是指感觉媒体传输中电信号和感觉媒体之间转换所用的媒体。显示媒体又分为输入显示媒体和输

3、出显示媒体。输入显示媒体如键盘、鼠标器、光笔、数字化仪、扫描仪、麦克风、摄像机等.输出显示媒体如显示器、喇叭、打印机、投影仪等。,显示媒体,存储媒体(Storage Medium),存储媒体又称存储介质,指的是用于存储表示媒体(也就是把感觉媒体数字化以后的代码进行存入),以便计算机随时加工处理和调用的物理实体。这类存储媒体有硬盘、软盘、CD-ROM等。,存储媒体,传输媒体(Transmission Medium),作为通信的信息载体,用来将表示媒体从一处传送到另一处的物理实体。这类媒体包括各种导线、电缆、光缆、电磁波等。(广播,电视,网络?),传输媒体,超文本与超媒体,超文本(Hypertex

4、t)和超媒体(HyperMedia)是按人脑的联想思维方式非线性地组织管理信息的一种先进技术。超文本这一术语最早是由美国人纳尔松(T. Nelson)在60年代正式提出来的。,多媒体,多媒体的英文是Multimedia ,其含义就是“多种媒体”。人们所指的多媒体其实是表示媒体,即文本、图形、图像、音频、视频、动画等信息载体中的两个或多个的组合。而这种两个或多个的组合技术往往与计算机相联系。这是由于计算机的数字化及交互式处理能力,极大地推动了多媒体技术的发展,从这个意义上可以看到我们常说的多媒体最终被归结为一种技术。,多媒体技术的特点,多样性集成性(关键特征)交互性(关键特征)实时性数字化,2

5、图形图像处理,颜色三要素,色彩可以用色调、亮度和饱和度来描述。人眼看到的任何一种颜色都是都三个特性的综合效果。因此这三个特性被称为色彩的三要素。三要素中,色调由光波的波长决定,亮度和饱和度与光波的振幅有关。,颜色三要素色调,色调表示光的颜色,决定于光的波长。自然界中的七色光分别对应着不同的色调,而每种色调又分别对应着不同的波长。色调用红、橙、黄、绿、青、蓝、紫来表示,而黑、白、灰无色彩。色调有一个基本顺序:红(Red)、橙(Orange)、黄(Yellow)、绿(Green)、青(Cyan)、蓝(Blue)、紫(Magenta)。在这个次序中,人们混合相邻颜色时,能够得到这两种颜色之间连续变化

6、的色调。,颜色三要素色调(2),按照不同的色调按红、橙、黄、绿、青、蓝、紫的顺序衔接起来,就形成了一个色调连续变化过渡的圆环,称为色环。以色环的中心为极坐标极点,各种色调与极轴的夹角称为色调的色相。例如红色的色相为0度,红、绿、蓝三基色的夹角为120度,黄色(=红+绿)的色相为60度,正好位于红色和绿色之间。,颜色三要素亮度,亮度用来表示某种颜色在人眼视觉上引起的明暗程度,它只与光的强度有关。光的强度越大,物体就越亮;光的强度越小,物体就越暗。在纯正光谱的七色光中,黄色的亮度最高,显得最亮,往下依次是橙色、绿色、红色、蓝色、紫色。,颜色三要素饱和度,饱和度是指彩色光所呈现颜色的深浅或纯洁程度。

7、对于同一色调的彩色光,饱和度越高,颜色就越纯;饱和度越低,颜色就越浅。在彩色光中加入白光,基本色调没有变化,但亮度提高了,饱和度却下降了。因此,在某色调的彩色光中加入别的彩色光,会引起色调的变化;而掺入白光仅仅引起饱和度的变化。,图像的色彩模型,色彩模型是用来精确标定和生成各种颜色的一套规则和定义。不同的应用又有不同的色彩模型,最常用的色彩模型有RGB、CMYK、HSB、YUV以及Lab色彩模型。其中RGB、CMYK是两种专门面向数码设计和出版印刷的色彩模型。一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;一个不发光波的物体称为无源物体,它的颜色由该物

8、体吸收或者反射哪些光波决定,用CMY相减混色模型。,RGB相加混色模型,电视机和计算机显示器使用的阴极射线管(CRT)是一个有源物体。CRT使用3个电子枪分别产生红(Red)、绿(Green)和蓝(Blue)三种波长的光,并以各种不同的相对强度综合起来产生颜色。,RGB相加混色模型,从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述: 颜色R(红色的百分比

9、)G(绿色的百分比)B(蓝色的百分比),RGB相加混色模型,Red(红) + Green(绿)= Yellow(黄)Red (红) +Blue(蓝)= Magenta(品红)Green (绿) + Blue (蓝) = Cyan (青),CMYK相减混色模型,用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。在理论上说,任何一种颜色都可以用三种基本颜料按一定比例混合得到。这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。理论上,当青色 (C)、洋红 (M) 和黄色 (Y) 色素在合成后可以吸收所有光线并产生黑色。但由于所有的打印油墨都

10、存在一些杂质,这三种油墨实际会产生土棕色。因此,在四色打印中除了使用纯青色、洋红和黄色油墨外,还会使用黑色油墨 (K)。(为避免与蓝色混淆,黑色用 K 而非 B 表示。)因此,该模型通常写成CMYK,称为CMYK相减混色模型。,CMYK相减混色模型,在相减混色中,当三基色等量相减时得到黑色; (为什么?)等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);(为什么?)等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B); (为什么?)等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。 (为什么?),CMYK相减混色模型,RGB模型与CMYK模型的区别,

11、第一,RGB色彩模式是发光的,存在于屏幕等显示设备中,不存在于印刷品中;CMYK色彩模式是反光的,需要外界辅助光源才能被感知,它是印刷品唯一的色彩模式。第二,色彩数量上RGB色域的颜色数比CMYK多出许多。但两者各有部分色彩是互相独立(即不可转换)的。 第三,RGB通道灰度图中偏白表示发光程度高;CMYK通道灰度图中偏白表示油墨含量低。反而反之。,RGB模型与CMYK模型的区别(2),特别注意第二条:两者各有部分色彩是互相独立(即不可转换)的。如右图中绿色大圆表示RGB色域,蓝色小圆表示CMYK色域。这一大一小表示RGB的色域范围(即色彩数量)要大于CMYK。而在转换色彩模式后,只有位于混合区

12、的颜色彩可以被保留,位于RGB特有区及CMYK特有区的颜色将丢失。,RGB模型与CMYK模型的选择,虽然理论上RGB与CMYK的互转都会损失一些颜色,不过从CMYK转RGB时损失的颜色较少,在视觉上有时很难看出区别。而从RGB转CMYK颜色将损失较多,视觉大部分都可以明显分辨出来。因此习惯上也有CMYK转RGB时颜色无损的说法,其实这种说法的真正所指是:宁可CMYK转RGB,不可RGB转CMYK。明白了以上道理,我们对如何选择图像的色彩模式就有了一个概念了:如果图像只在电脑上显示,就用RGB模式,这样可以得到较广的色域;如果图像需要打印或者印刷,就必须使用CMYK模式,才可确保印刷品颜色与设计

13、时一致。,图像的种类,按照图像的几何特性,可以将图像分为点阵图和矢量图两大类。按照图像的颜色,可以将图像分为彩色图和灰度图两大类。,矢量图与点阵图(位图),在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是矢量图(vector based image)法,另一种叫点阵图(bit mapped image)法。虽然这两种生成图的方法不同,但在显示器上显示的结果几乎没有什么差别。,矢量图(图形),图形(Graphic)是指从点、线、面到三维空间的黑白或彩色几何图。图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。在图形文件中只记录生成图的算法和图上的

14、某些特征点,因此也称矢量图。,点阵图(位图/图像),图像(Image)是由像素点阵组成的画面。静止的图像是一个矩阵,阵列中的各项数字用来描述构成图像的各个点(称为像素点 pixel )的强度与颜色等信息。这种图像也称为位图( bit-mapped picture )。,矢量图与点阵图的比较,位图文件占据的存储器空间比较大。影响点位图文件大小的因素主要有两个:图像分辨率和像素深度。分辨率越高,就是组成一幅图的像素越多,则图像文件越大;像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。而矢量图文件的大小则主要取决于图的复杂程度。,矢量图与点阵图的比较(2),矢量图与位图相比,显

15、示位图文件比显示矢量图文件要快;矢量图侧重于“绘制”、去创造,而位图偏重于“获取”、去“复制”;矢量图和位图之间可以用软件进行转换,由矢量图转换成点位图采用光栅化(rasterizing)技术,这种转换也相对容易;由点位图转换成矢量图用跟踪(tracing)技术,这种技术在理论上说是容易,但在实际中很难实现,对复杂的彩色图像尤其如此。,图像数据量,图像数据量是指磁盘上存储整幅图像所需的字节数。图像数据量的计算表达式为: 图像数据量=图像分辨率像素深度/8(byte)例如:一幅640480的256级灰度图像, 未压缩的原始数据量=6404808/8(byte)=307200byte=307200

16、/1024KB=300KB。一幅1024768的真彩色图像,未压缩的原始数据量=102476824/3(byte)=2359296byte=2.25M。,图象的压缩,从上面计算的结果可以看出,图像数字化之后的数据量非常大,在因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩。压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价是大量的计算。,图像的压缩,图像数据压缩主要根据下面两个基本事实来实现的。一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也

17、就达到压缩数据的目的。利用前一个事实的压缩技术就是无损压缩技术,利用后一个事实的压缩技术就是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的,图像文件格式,BMP格式GIF格式(网页支持)JPG格式(网页支持)PNG格式(网页支持)PSD格式,BMP格式(相对文件较大),BMP是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选1bit、4bit、8bit及24bit。BMP是最普遍的位图格式之一,也是Windows系统下的标准格式。BMP格式支持RGB。索

18、引颜色、灰度和位图颜色模式,不支持Alpha通道。,GIF格式,GIF是一种压缩的8位图像文件,广泛用于网络传输,最多只有256色。新的 GIF89a格式,能储存成背景透明化的形式(支持 Alpha通道),并且可以将数张图存成一个文件,形成动画效果,还支持位图模式、灰度或索引颜色模式图像。,JPEG格式,JPEG是一种高效率的压缩格式,在存档时能够将人眼无法分辨的资料删除,以节省存储空间。 JPEG格式支持RGB和灰度颜色模式,不支持Alpha通道。JPEG格式通过选择性地去掉数据来压缩文件,是有损压缩。它比GIF图像包含更多颜色方面的信息,优点是色彩比较逼真,文件也较小。在多媒体及网页中用到

19、的照片和图像适合存为JPEG格式。,3 音频处理,几个重要数据,人耳能感受到的声音范围是2020kHz人的语音范围是3003kHz常用的声音采样频率有44.lKHz(达到CD音质),22.05KHz(达到调频广播音质)及11.025KHz(达到电话语音音质)。,声音三要素,声音的三个要素是音调、音强和音色。 人对声音频率的感觉表现为音调的高低,在音乐中称为音高。音调是由频率所决定的。音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮感和穿透力。,为什么要数字化?,由于音频信号是一种连续变化的模拟信号计算机只能处理和记录二进制的数字信号因此,由自然音源而得的音频信号必须经过一定的变化

20、和处理,变成二进制数据后才能送到计算机进行再编辑和存贮。把模拟信号转换成数字信号的过程称为模/数转换(A/D转换) ;反过来,把数字信号转换为模拟信号的过程称为数/模转换(D/A转换)。,声音数字化的过程_脉冲编码调制(PCM),模/数转换主要包括: 采样:在时间轴上对信号数字化; 量化:在幅度轴上对信号数字化; 编码:按一定格式记录采样和量化后的数字数据。脉冲编码调制PCM(Pulse Code Modulation)是一种模数转换的最基本编码方法。CD-DA采用的就是这种编码方式。,数字音频的技术指标,(1) 采样频率:采样频率是指一秒钟内采样的次数。常用的声音采样频率有44.lKHz(达

21、到CD音质),22.05KHz(达到调频广播音质)及11.025KHz(达到电话语音音质)。,(2)量化位数:量化位数是对模拟音频信号的幅度轴进行数字化,它决定了模拟信号数字化以后的动态范围。由于计算机按字节运算,一般的量化位数为8位和16位。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需要的存贮空间也越大。,(3) 声道数:有单声道和双声道之分。双声道又称为立体声,在硬件中要占两条线路,音质、音色好,但立体声数字化后所占空间比单声道多一倍。 (4)编码算法:编码的作用其一是采用一定的格式来记录数字数据,其二是采用一定的算法来压缩数字数据以减少存贮空间和提高传输

22、效率。,声音文件的大小,S=R*D*(r/8)*NR: 采样频率(Hz)D:录音时间(S)r: 量化位数N:声道数,常见的音频文件格式,*.wav文件*.mid文件还有采用压缩技术将声音文件的大小压缩10倍以上的声音文件格式如:*.mp3*.rm *.wma 等,WAVE文件,Microsoft和IBM共同开发,PC标准声音格式没有采用压缩算法,不会失真,处理速度快扩展名wav特点:声音层次丰富,还原性好,表现力强采用足够高的采样频率,音质极佳不足:数据量大,与采样频率、量化位数和声道数成正比,MIDI文件,不是真正的数字化声音,而是一组声音或乐器符号的集合象记录乐谱一样记录下演奏的符号,所以

23、体积是所有音频格式中最小的播放效果与硬件关系很大应用于手机铃声等对音质要求不高且对空间有严格限制的场合扩展名mid音色比较单调,层次感稍差,表现力不够,MIDI与WAV的不同,生成方式不同。WAV声音是采集得到的各种数字声音,是波形声音,包括音乐、语音以及自然界中存在的各种声音;MIDI是专门用于记录乐器声音的,是多媒体计算机系统产生声音(特别是音乐)的一种主要方式,它仅保存乐器演奏序列,播放的时候由声卡模拟相应的乐器发出乐音。,MP3文件,是一种有损压缩,通过记录音频的音高、音色和音量信息压缩比约为11:1一张CD可存储15首普通歌曲,采用mp3格式,则可存储160首CD音质的歌曲扩展名mp

24、3理想播放器是winamp,WMA文件,Window Media Audio的缩写可以保证在只有MP3文件一半大小的前提下,保持相同的音质大多数MP3播放器都支持WMA文件,4 视频处理,什么是视频?,视频:是指连续地随时间变化的一组图像。帧:一幅幅单独的图像帧率:每秒钟连续播放的帧数。典型的为24帧/秒, 25帧/秒, 30帧/秒Flash默认为12帧/秒.常见视频信号有:电影和电视,电视的制式,是指电视显示的标准常见的三种电视制式NTSC制式:30帧/秒,525行,宽高比4:3,隔行扫描,场扫描频率60hz,美国、加拿大等大部分西半球国家,以及日韩,菲律宾和中国的台湾地区PAL制式:25帧

25、/秒,625行,宽高比4:3,隔行扫描,长扫描频率50hz,德国、中国、朝鲜等采用SECAM制式:同PAL制式,不同的是色度信号是频率调制,法国、前苏联以及东欧国家采用HDTV:高清晰度电视,标准尚未统一,帧扫描频率1000行以上,宽高比16:9,逐行扫描,传送频率全部数字化。,视频的数字化,NTSC、PAL和SECAM制式的视频信号都是模拟信号。计算机只能处理和显示数字信号,所以需要数字化处理。数字化过程:扫描采样量化编码图像是离散的视频,视频是连续的图像,视频文件格式,AVI文件Audio Video Interleaved的缩写Microsoft开发的用于Windows环境,现被Wind

26、ows、OS/2采用允许音频和视频交错在一起同步播放支持色和RLE压缩主要应用在多媒体光盘上,用来保存电影、电视等,视频文件格式(续),MOV文件Apple公司开发用于苹果机的视频文件格式播放软件:QuickTimeMPEG文件运动图象压缩算法的国际标准平均压缩比为50:1,最高可达200:1DAT文件是VCD和卡拉OKCD数据文件的扩展名,也是基于MPEG压缩技术的一种文件格式,MPEG视频压缩标准,MPEG: Moving Picture Experts Group, 运动图像专家组MPEG-1:1992年发布应用领域:光盘、数字音频磁带(DAT)、磁带设备等,最典型的应用是VCDMPEG

27、-2:1994年被批准为国际标准主要应用:数字电视、DVD、TV机顶盒,MPEG视频压缩标准(续),MPEG-4:1998年发布,1999年公布第二版多媒体应用标准MPEG-7:正在研究多媒体内容描述接口规范MPEG-21:2000年批准制定标准的计划多媒体框架,将标准集成起来相互支持和相互协调以管理多媒体商务。,什么是流媒体?,流媒体文件格式是支持采用流式传输及播放的媒体格式。流式传输方式是将动画、视音频等多媒体文件经过特殊的压缩方式分成一个个压缩包,由视频服务器向用户计算机连续、实时传送。在采用流式传输方式的系统中,用户不必像非流式播放那样等到整个文件全部下载完毕后才能看到当中的内容,而是

28、只需经过几秒或几十秒的启动延时即可在用户的计算机上利用相应的播放器或其它的硬件、软件对压缩的动画、视音频等流式多媒体文件解压后进行播放和观看,多媒体文件的剩余部分将在后台的服务器内继续下载。,流媒体的优点,与单纯的下载方式相比,这种对多媒体文件边下载边播放的流式传输方式具有以下优点: 启动延时大幅度地缩短,用户不用等待所有内容下载到硬盘上才开始浏览;对系统缓存容量的需求大大降低,流媒体文件格式,到目前为止,Internet上使用较多的流媒体格式主要有:RealNetworks公司的RealMedia(*.rm,*,rmvb)Apple公司的QuickTimeMicrosoft公司的Window

29、sMedia(*.asf,*.wmv)Macromedia的ShockwaveFlash技术 (*.swf),5 动画制作,6 网页制作,网络服务模式,C/S模式:客户/服务器模式B/S模式:浏览器/服务器模式,网站建设的基本步骤,网站选题网站结构的规划网站外观的设计素材准备网页制作(域名申请)服务器配置网站测试网站发布网站维护,网页制作三剑客,Dreamweaver: 网页制作Flash: 动画制作Fireworks: 图像处理,HTML基本知识,HTML: Hyper Text Makup Language, 超文本标记语言HTML文件是文本文件常见网页扩展名为.htm或.html,HTML的基本结构,标题网页内容,常用的HTML标签,超链接,表格,CSS,CSS: Cascade Sytle Sheet, 级联样式表CSS的类别CSS的两种形式:新建样式表文件,仅对该文件两种形式的区别:前者是文件可以保存,可以导入到其他文档使用;后者只对本文档使用应用CSS样式:选中文字,点击样式名称取消CSS样式:选中文字,点“无CSS样式”CSS样式的优点:将内容和形式分离,批量设置,修改CSS样式,应用全部修改,框架,框架的作用_页面布局框架的组织形式,三种布局技术,表格层框架,八 课程总复习,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。