1、第一课 什么是卷积 卷积有什么用 什么是傅利叶变换 什么是拉普拉斯变换 引子很多朋友和我一样,工科电子类专业,学了一堆信号方面的课,什么都没学懂,背了公式考了试,然后毕业了。先说“卷积有什么用“这个问题。( 有人抢答,“卷积“是为了学习“ 信号与系统“这门课的后续章节而存在的。我大吼一声,把他拖出去枪毙!)讲一个故事:张三刚刚应聘到了一个电子产品公司做测试人员,他没有学过“ 信号与系统“这门课程。一天,他拿到了一个产品,开发人员告诉他,产品有一个输入端,有一个输出端,有限的输入信号只会产生有限的输出。然后,经理让张三测试当输入 sin(t)(ty 的问题都可以用 x-f(x)-f-1(x)-y
2、 来得到。1. 到底什么是频率?一个基本的假设: 任何信息都具有频率方面的特性,音频信号的声音高低,光的频谱,电子震荡的周期,等等,我们抽象出一个件谐振动的概念,数学名称就叫做频率。想象在 x-y 平面上有一个原子围绕原点做半径为 1 匀速圆周运动,把 x 轴想象成时间,那么该圆周运动在 y 轴上的投影就是一个 sin(t)的波形。相信中学生都能理解这个。那么,不同的频率模型其实就对应了不同的圆周运动速度。圆周运动的速度越快,sin(t)的波形越窄。频率的缩放有两种模式(a) 老式的收音机都是用磁带作为音乐介质的,当我们快放的时候,我们会感觉歌唱的声音变得怪怪的,调子很高,那是因为“圆周运动“
3、 的速度增倍了,每一个声音分量的 sin(t)输出变成了 sin(nt)。(b) 在 CD/计算机上面快放或满放感觉歌手快唱或者慢唱,不会出现音调变高的现象:因为快放的时候采用了时域采样的方法,丢弃了一些波形,但是承载了信息的输出波形不会有宽窄的变化;满放时相反,时域信号填充拉长就可以了。2. F 变换得到的结果有负数/复数部分,有什么物理意义吗 ?解释: F 变换是个数学工具,不具有直接的物理意义,负数/复数的存在只是为了计算的完整性。3. 信号与系统这们课的基本主旨是什么?对于通信和电子类的学生来说,很多情况下我们的工作是设计或者 OSI 七层模型当中的物理层技术,这种技术的复杂性首先在于
4、你必须确立传输介质的电气特性,通常不同传输介质对于不同频率段的信号有不同的处理能力。以太网线处理基带信号,广域网光线传出高频调制信号,移动通信,2G 和 3G 分别需要有不同的载频特性。那么这些介质(空气,电线,光纤等)对于某种频率的输入是否能够在传输了一定的距离之后得到基本不变的输入呢? 那么我们就要建立介质的频率相应数学模型。同时,知道了介质的频率特性,如何设计在它上面传输的信号才能大到理论上的最大传输速率?-这就是信号与系统这们课带领我们进入的一个世界。当然,信号与系统的应用不止这些,和香农的信息理论挂钩,它还可以用于信息处理(声音,图像),模式识别,智能控制等领域。如果说,计算机专业的
5、课程是数据表达的逻辑模型,那么信号与系统建立的就是更底层的,代表了某种物理意义的数学模型。数据结构的知识能解决逻辑信息的编码和纠错,而信号的知识能帮我们设计出码流的物理载体(如果接受到的信号波形是混乱的,那我依据什么来判断这个是 1 还是 0? 逻辑上的纠错就失去了意义)。在工业控制领域,计算机的应用前提是各种数模转换,那么各种物理现象产生的连续模拟信号(温度,电阻,大小,压力,速度等) 如何被一个特定设备转换为有意义的数字信号,首先我们就要设计一个可用的数学转换模型。4. 如何设计系统?设计物理上的系统函数(连续的或离散的状态),有输入,有输出,而中间的处理过程和具体的物理实现相关,不是这们
6、课关心的重点(电子电路设计?)。信号与系统归根到底就是为了特定的需求来设计一个系统函数。设计出系统函数的前提是把输入和输出都用函数来表示(例如 sin(t)。分析的方法就是把一个复杂的信号分解为若干个简单的信号累加,具体的过程就是一大堆微积分的东西,具体的数学运算不是这门课的中心思想。那么系统有那些种类呢?(a) 按功能分类: 调制解调 (信号抽样和重构),叠加,滤波,功放,相位调整,信号时钟同步,负反馈锁相环,以及若干子系统组成的一个更为复杂的系统-你可以画出系统流程图,是不是很接近编写程序的逻辑流程图? 确实在符号的空间里它们没有区别。还有就是离散状态的数字信号处理(后续课程)。(b) 按
7、系统类别划分,无状态系统,有限状态机,线性系统等。而物理层的连续系统函数,是一种复杂的线性系统。5. 最好的教材?符号系统的核心是集合论,不是微积分,没有集合论构造出来的系统,实现用到的微积分便毫无意义-你甚至不知道运算了半天到底是要作什么。以计算机的观点来学习信号与系统,最好的教材之一就是,作者是 UC Berkeley 的 Edward A.Lee and Pravin Varaiya-先定义再实现,符合人类的思维习惯。国内的教材通篇都是数学推导,就是不肯说这些推导是为了什么目的来做的,用来得到什么,建设什么,防止什么;不去从认识论和需求上讨论,通篇都是看不出目的的方法论,本末倒置了。第三
8、课 抽样定理是干什么的 1. 举个例子,打电话的时候,电话机发出的信号是 PAM 脉冲调幅,在电话线路上传的不是话音,而是话音通过信道编码转换后的脉冲序列,在收端恢复语音波形。那么对于连续的说话人语音信号,如何转化成为一些列脉冲才能保证基本不失真,可以传输呢? 很明显,我们想到的就是取样,每隔 M 毫秒对话音采样一次看看电信号振幅,把振幅转换为脉冲编码,传输出去,在收端按某种规则重新生成语言。那么,问题来了,每 M 毫秒采样一次,M 多小是足够的? 在收端怎么才能恢复语言波形呢?对于第一个问题,我们考虑,语音信号是个时间频率信号(所以对应的 F 变换就表示时间频率)把语音信号分解为若干个不同频
9、率的单音混合体(周期函数的复利叶级数展开,非周期的区间函数,可以看成补齐以后的周期信号展开,效果一样),对于最高频率的信号分量,如果抽样方式能否保证恢复这个分量,那么其他的低频率分量也就能通过抽样的方式使得信息得以保存。如果人的声音高频限制在 3000Hz,那么高频分量我们看成 sin(3000t),这个 sin 函数要通过抽样保存信息,可以看为: 对于一个周期,波峰采样一次,波谷采样一次,也就是采样频率是最高频率分量的 2 倍(奈奎斯特抽样定理),我们就可以通过采样信号无损的表示原始的模拟连续信号。这两个信号一一对应,互相等价。对于第二个问题,在收端,怎么从脉冲序列(梳装波形)恢复模拟的连续
10、信号呢? 首先,我们已经肯定了在频率域上面的脉冲序列已经包含了全部信息,但是原始信息只在某一个频率以下存在,怎么做? 我们让输入脉冲信号 I 通过一个设备 X,输出信号为原始的语音 O,那么 I(*)X=O,这里(*)表示卷积。时域的特性不好分析,那么在频率域 F(I)*F(X)=F(O)相乘关系,这下就很明显了,只要 F(X)是一个理想的,低通滤波器就可以了(在 F 域画出来就是一个方框 ),它在时间域是一个钟型函数 (由于包含时间轴的负数部分,所以实际中不存在),做出这样的一个信号处理设备,我们就可以通过输入的脉冲序列得到几乎理想的原始的语音。在实际应用中,我们的抽样频率通常是奈奎斯特频率
11、再多一点,3k 赫兹的语音信号,抽样标准是 8k 赫兹。2. 再举一个例子,对于数字图像,抽样定理对应于图片的分辨率-抽样密度越大,图片的分辨率越高,也就越清晰。如果我们的抽样频率不够,信息就会发生混叠-网上有一幅图片,近视眼戴眼镜看到的是爱因斯坦,摘掉眼睛看到的是梦露-因为不带眼睛,分辨率不够(抽样频率太低),高频分量失真被混入了低频分量,才造成了一个视觉陷阱。在这里,图像的 F 变化,对应的是空间频率。话说回来了,直接在信道上传原始语音信号不好吗? 模拟信号没有抗干扰能力,没有纠错能力,抽样得到的信号,有了数字特性,传输性能更佳。什么信号不能理想抽样? 时域有跳变,频域无穷宽,例如方波信号
12、。如果用有限带宽的抽样信号表示它,相当于复利叶级数取了部分和,而这个部分和在恢复原始信号的时候,在不可导的点上面会有毛刺,也叫吉布斯现象。3. 为什么傅立叶想出了这么一个级数来? 这个源于西方哲学和科学的基本思想 : 正交分析方法。例如研究一个立体形状,我们使用 x,y,z 三个互相正交的轴 : 任何一个轴在其他轴上面的投影都是 0。这样的话,一个物体的 3 视图就可以完全表达它的形状。同理,信号怎么分解和分析呢? 用互相正交的三角函数分量的无限和:这就是傅立叶的贡献。入门第四课 傅立叶变换的复数 小波 说的广义一点,“ 复数“是一个“ 概念“,不是一种客观存在。什么是“概念 “? 一张纸有几
13、个面? 两个,这里“ 面“是一个概念,一个主观对客观存在的认知,就像“大“和“小“的概念一样,只对人的意识有意义,对客观存在本身没有意义(康德: 纯粹理性的批判)。把纸条的两边转一下相连接,变成“莫比乌斯圈“ ,这个纸条就只剩下一个“面“了。概念是对客观世界的加工,反映到意识中的东西。数的概念是这样被推广的: 什么数 x 使得 x2=-1? 实数轴显然不行,(-1)*(-1)=1。那么如果存在一个抽象空间,它既包括真实世界的实数,也能包括想象出来的 x2=-1,那么我们称这个想象空间为“复数域“。那么实数的运算法则就是复数域的一个特例。为什么 1*(-1)=-1? +-符号在复数域里面代表方向
14、,-1 就是“向后,转!“这样的命令,一个 1 在圆周运动 180 度以后变成了 -1,这里,直线的数轴和圆周旋转,在复数的空间里面被统一了。因此,(-1)*(-1)=1 可以解释为“ 向后转“+“ 向后转“=回到原地。那么复数域如何表示 x2=-1 呢? 很简单,“向左转 “,“向左转“ 两次相当于“向后转“ 。由于单轴的实数域(直线)不包含这样的元素,所以复数域必须由两个正交的数轴表示-平面。很明显,我们可以得到复数域乘法的一个特性,就是结果的绝对值为两个复数绝对值相乘,旋转的角度=两个复数的旋转角度相加。高中时代我们就学习了迪莫弗定理。为什么有这样的乘法性质? 不是因为复数域恰好具有这样
15、的乘法性质(性质决定认识),而是发明复数域的人就是根据这样的需求去弄出了这么一个复数域(认识决定性质),是一种主观唯心主义的研究方法。为了构造 x2=-1,我们必须考虑把乘法看为两个元素构成的集合: 乘积和角度旋转。因为三角函数可以看为圆周运动的一种投影,所以,在复数域,三角函数和乘法运算(指数) 被统一了。我们从实数域的傅立叶级数展开入手,立刻可以得到形式更简单的,复数域的,和实数域一一对应的傅立叶复数级数。因为复数域形式简单,所以研究起来方便-虽然自然界不存在复数,但是由于和实数域的级数一一对应,我们做个反映射就能得到有物理意义的结果。那么傅立叶变换,那个令人难以理解的转换公式是什么含义呢
16、? 我们可以看一下它和复数域傅立叶级数的关系。什么是微积分,就是先微分,再积分,傅立叶级数已经作了无限微分了,对应无数个离散的频率分量冲击信号的和。傅立叶变换要解决非周期信号的分析问题,想象这个非周期信号也是一个周期信号: 只是周期为无穷大,各频率分量无穷小而已(否则积分的结果就是无穷)。那么我们看到傅立叶级数,每个分量常数的求解过程,积分的区间就是从 T 变成了正负无穷大。而由于每个频率分量的常数无穷小,那么让每个分量都去除以 f,就得到有值的数- 所以周期函数的傅立叶变换对应一堆脉冲函数。同理,各个频率分量之间无限的接近,因为 f 很小,级数中的 f,2f ,3f 之间几乎是挨着的,最后挨
17、到了一起,和卷积一样,这个复数频率空间的级数求和最终可以变成一个积分式:傅立叶级数变成了傅立叶变换。注意有个概念的变化:离散的频率,每个频率都有一个“权“ 值,而连续的 F 域,每个频率的加权值都是无穷小(面积=0),只有一个频率范围内的“ 频谱“才对应一定的能量积分。频率点变成了频谱的线。因此傅立叶变换求出来的是一个通常是一个连续函数,是复数频率域上面的可以画出图像的东西? 那个根号 2Pai 又是什么? 它只是为了保证正变换反变换回来以后,信号不变。我们可以让正变换除以 2,让反变换除以 Pi,怎么都行。慢点,怎么有“ 负数“的部分,还是那句话,是数轴的方向对应复数轴的旋转,或者对应三角函
18、数的相位分量,这样说就很好理解了。有什么好处? 我们忽略相位,只研究 “振幅“因素,就能看到实数频率域内的频率特性了。我们从实数(三角函数分解)- 复数(e 和 Pi)-复数变换(F)-复数反变换(F-1)-复数(取幅度分量)- 实数,看起来很复杂,但是这个工具使得,单从实数域无法解决的频率分析问题,变得可以解决了。两者之间的关系是: 傅立叶级数中的频率幅度分量是 a1-an,b1-bn,这些离散的数表示频率特性,每个数都是积分的结果。而傅立叶变换的结果是一个连续函数: 对于 f 域每个取值点 a1-aN(N=无穷),它的值都是原始的时域函数和一个三角函数(表示成了复数)积分的结果- 这个求解
19、和级数的表示形式是一样的。不过是把 N 个离散的积分式子统一为了一个通用的,连续的积分式子。复频域,大家都说画不出来,但是我来画一下!因为不是一个图能够表示清楚的。我用纯中文来说:1. 画一个 x,y 轴组成的平面,以原点为中心画一个圆(r=1)。再画一条竖直线: (直线方程 x=2),把它看成是一块挡板。2. 想象,有一个原子,从(1,0)点出发,沿着这个圆作逆时针匀速圆周运动。想象太阳光从 x 轴的复数方向射向 x 轴的正数方向,那么这个原子运动在挡板(x=2)上面的投影,就是一个简协震动。3. 再修改一下,x=2 对应的不是一个挡板,而是一个打印机的出纸口,那么,原子运动的过程就在白纸上
20、画下了一条连续的 sin(t)曲线!上面 3 条说明了什么呢? 三角函数和圆周运动是一一对应的。如果我想要 sin(t+x),或者 cos(t)这种形式,我只需要让原子的起始位置改变一下就可以了:也就是级坐标的向量,半径不变,相位改变。傅立叶级数的实数展开形式,每一个频率分量都表示为 AnCos(nt)+BnSin(nt),我们可以证明,这个式子可以变成 sqr(An2+Bn2)sin(nt+x)这样的单个三角函数形式,那么:实数值对(An,Bn),就对应了二维平面上面的一个点,相位 x 对应这个点的相位。实数和复数之间的一一对应关系便建立起来了,因此实数频率唯一对应某个复数频率,我们就可以用
21、复数来方便的研究实数的运算:把三角运算变成指数和乘法加法运算。-但是,F 变换仍然是有限制的(输入函数的表示必须满足狄义赫立条件等),为了更广泛的使用“域“变换的思想来表示一种“广义“ 的频率信息,我们就发明出了拉普拉斯变换,它的连续形式对应 F 变换,离散形式就成了 Z 变换。离散信号呢? 离散周期函数的 F 级数,项数有限,离散非周期函数( 看为周期延拓以后仍然是离散周期函数 ),离散 F 级数,仍然项数有限。离散的 F 变换,很容易理解- 连续信号通过一个周期采样滤波器,也就是频率域和一堆脉冲相乘。时域取样对应频域周期延拓。为什么? 反过来容易理解了,时域的周期延拓对应频率域的一堆脉冲。
22、两者的区别:FTf(t)=从负无穷到正无穷对f(t)exp(-jwt)积分 LTf(t)=从零到正无穷对f(t)exp(-st)积分 (由于实际应用,通常只做单边 Laplace 变换,即积分从零开始) 具体地,在 Fourier 积分变换中,所乘因子为 exp(-jwt),此处,-jwt 显然是为一纯虚数;而在 laplace 变换中,所乘因子为 exp(-st),其中 s 为一复数:s=D+jw,jw 是为虚部,相当于 Fourier 变换中的 jwt,而 D 则是实部,作为衰减因子,这样就能将许多无法作 Fourier 变换的函数(比如 exp(at),a0)做域变换。而 Z 变换,简单
23、地说,就是离散信号(也可以叫做序列)的 Laplace 变换,可由抽样信号的 Laplace 变换导出。 ZTf(n)=从 n 为负无穷到正无穷对 f(n)Z(-n)求和。Z 域的物理意义: 由于值被离散了,所以输入输出的过程和花费的物理时间已经没有了必然的关系(t 只对连续信号有意义),所以频域的考察变得及其简单起来,我们把 (1,-1,1,-1,1,-1)这样的基本序列看成是数字频率最高的序列,他的数字频率是 1Hz(数字角频率 2Pi),其他的数字序列频率都是 N 分之 1Hz,频率分解的结果就是 0-2Pi 角频率当中的若干个值的集合,也是一堆离散的数。由于时频都是离散的,所以在做变换
24、的时候,不需要写出冲击函数的因子离散傅立叶变换到快速傅立叶变换- 由于离散傅立叶变换的次数是 O(N2),于是我们考虑把离散序列分解成两两一组进行离散傅立叶变换,变换的计算复杂度就下降到了 O(NlogN),再把计算的结果累加 O(N),这就大大降低了计算复杂度。再说一个高级话题: 小波。在实际的工程应用中,前面所说的这些变换大部分都已经被小波变换代替了。什么是小波?先说什么是波:傅立叶级数里面的分量,sin/cos 函数就是波,sin(t)/cos(t)经过幅度的放缩和频率的收紧,变成了一系列的波的求和,一致收敛于原始函数。注意傅立叶级数求和的收敛性是对于整个数轴而言的,严格的。不过前面我们
25、说了,实际应用 FFT 的时候,我们只需要关注部分信号的傅立叶变换然后求出一个整体和就可以了,那么对于函数的部分分量,我们只需要保证这个用来充当砖块的“波函数“,在某个区间(用窗函数来滤波)内符合那几个可积分和收敛的定义就可以了,因此傅立叶变换的“波“因子,就可以不使用三角函数,而是使用一系列从某些基本函数构造出来的函数族,只要这个基本函数符合那些收敛和正交的条件就可以了。怎么构造这样的基本函数呢?sin(t) 被加了方形窗以后,映射到频域是一堆无穷的散列脉冲,所以不能再用三角函数了。我们要得到频率域收敛性好的函数族,能覆盖频率域的低端部分。说的远一点,如果是取数字信号的小波变换,那么基础小波
26、要保证数字角频率是最大的 2Pi。利用小波进行离频谱分析的方法,不是像傅立叶级数那样求出所有的频率分量,也不是向傅立叶变换那样看频谱特性,而是做某种滤波,看看在某种数字角频率的波峰值大概是多少。可以根据实际需要得到如干个数字序列。我们采用(0,f),(f,2f),(2f,4f)这样的倍频关系来考察函数族的频率特性,那么对应的时间波形就是倍数扩展(且包含调制-所以才有频谱搬移)的一系列函数族。频域是窗函数的基本函数,时域就是钟形函数。当然其他类型的小波,虽然频率域不是窗函数,但是仍然可用:因为小波积分求出来的变换,是一个值,例如(0,f)里包含的总能量值,(f,2f)里面包含的总能量值。所以即使频域的分割不是用长方形而是其他的图形,对于结果来说影响不大。同时,这个频率域的值,它的分辨率密度和时域小波基函数的时间分辨率是冲突的(时域紧频域宽,时域宽频域紧),所以设计的时候受到海森堡测不准原理的制约。Jpeg2000 压缩就是小波:因为时频都是局部的,变换结果是数值点而不是向量,所以,计算复杂度从 FFT 的 O(NlgN)下降到了 O(N),性能非常好。用中文说了这么多,基本的思想已经表达清楚了,为了“ 研究方便“,从实数傅立叶级数展开,到创造了复数域的傅立叶级数展开,再到傅立叶变换,再扩展到拉式变换,再为了时频都离散的情况简化为 Z 变换,全部都用一根主线联系起来了。