1、 主要内容 1.听觉模型 2.M-PEAG1心理声学模型结构 3.仿真结果 4.关于后期工作的想法 5.总结1.听觉模型 1.1 人耳听觉模型(HAS) 1.2 人耳生理系统和临界频段 1.3 安静状态阈值和掩蔽1.听觉模型 人耳对于频率的感知呈对数规律的;会产生出差频; 人耳生理系统和临界频段临界频段=24.7(4.37F+1) 有调成分和无调成分当音调间的频率差大于临界频段时,就是一般的和音;而当频率差小于临界频段时,就成为不谐和音 Bark感知频率的单位,1 个临界频段的宽度为 1Bark。使用 Bark 来标度,需要将物理频率转化为心理声学频率。这样,一个纯音就可以用心理掩蔽曲线来表示
2、。1.听觉模型 安静状态阈值安静状态阈值曲线表示了在给定频率上,人耳能够听到声音的最小声压级。0dB 时的阈值为 1kHz。人耳在 15kHz 的范围内最为敏感,可以听到低于 0dB 参考值几个分贝的信号。一般而言,两个相 能 不 频率的信号,听 来是不一样的。 的,能够听到的 声和 真频率而 。在 低的频率 ,听觉的 敏度会 。1.听觉模型 掩蔽阈值掩蔽阈值是 几 听不到声音的声压级。当 时有 几个音调时,当 音调 掩 低音调时,就会出 掩蔽。 掩蔽的一般 掩蔽的分 : 时掩蔽; 时掩蔽掩蔽的 : 用声调的 ; 用人的2.M-PEAG1心理声学模型结构 2.1 currency1 2.2 声
3、压级“定 2.3 安静状态阈值 2.4 有调和无调 2.5 有调和无调成分的fi 2.6 单fl掩蔽阈值的currency1 2.7 总 掩蔽阈值的currency12.1 currency1512 的FFTcurrency1。FFT是对 PCM信号”后的。”h(i)和率X(k)的currency1分 为2.2 声压级的“定n的声压级的currency1 :2.3 安静状态阈值安静阈值 对阈值,于信号的样频率, 出。对currency1掩蔽阈值频率范围的个样 ,总 率 对阈值,对于 率 96kbit/s,值为12dB,对于 率96kbit/s, 值为0dB。1给出了样 音频信号的安静状态阈值。 2.3 安静状态阈值