基于梯度下降的自适应音频去噪声的研究

发布日期:2020年8月5日
基于梯度下降的自适应音频去噪声的研究 基于梯度下降的自适应音频去噪声的研究

本内容试读结束

下载后可阅读完整内容,立即下载

去噪声技术是对音频信号进行适当处理,以补偿噪声畸变的技术,通常把采用自适应去噪声的处理器称为自适应滤波器。本文方案以最小均方误差为准则来计算得到滤波器系数。本文设计了一种采用梯度下降的自适应算法的自适应调整滤波器,根据标准参考信号和混有噪声信号进行自适应滤波运算,迭代递归过程以混有噪声信号与标准参考信号最小均方误差为目标,仿真结果显示这个滤波器可以很好地降低噪声提高信噪比。

在语音处理及复杂背景环境下音频数据交互系统中,由于各种电子设备功放喇叭噪声、外界干扰、语音回声、背景噪声的客观必然性,导致语音信号被数字采集接收时将不可避免地产生语音背景噪声或干扰,语言采集是系统前端采集部分,如果语音前端采集存在噪声,那么在后面处理阶段比如识别语音时会产生较大的误差。

语音采集过程一般是语言经过麦克后振动产生电信号, 然后由ADC 进行数字采集得到数字语音信号。

目前语音采集系统已经非常普遍地采用了高采样率及位宽的ADC 模数转换器, ADC模数转换器的数字采集频率可以达到48 kHz 以上,采集位宽可达到16 bit 以上。在某些对语音要求比较高的场合里,比如对语音有多样性处理要求的声卡,多样性语音处理声卡系统的语音采集频率可以达到96 kHz,采集位宽达到24 bit。理论上ADC 采样的位宽越高、采样率越高,数字语音信号描述模拟语音信号的量化误差就会越小。

目前市场上语音识别技术应用前景十分广泛,但是这块领域还没有达到图像识别领域的成熟程度, 其中一个主要限制因素就是在各种各样的场合环境下,语音信号的状态有很大差异,有些是语音发音差异的原因,有些是因为背景噪声、回声过大,比如船上、汽车上的背景噪声特别大。在智能音箱的语音激活检测中,在近场条件下信号比较清晰而且噪声小,简单算法就可以做语音激活检测。但在远场条件下,用户不能很近地接触智能音箱的语音采集系统,这时候人说话的语音小,其它噪声大比如水流声、电视语音、开水沸腾声、洗衣机噪声、开关门声、楼梯脚步声等等,做语音激活检测功能就必须采用复杂的处理方式。所以工业界也一直在努力解决这个问题,在这块领域有很多方向,比如谱减法、小波滤波、维纳滤波等。不管是谱减法、维纳滤波还是小波滤波法,在时域上的数学表达都等价于滤波器响应表示,因此通过各种算法处理方式去减少语音噪声,滤波器是其中一种重要的消除噪声的方法,得到降噪高性能的滤波器参数是一个重要的研究方向。普通数字低通滤波器是通过频域整块处理掉带外噪声, 但带内噪声很难被处理,为了特殊地改变滤波器参数从而提高消除噪声干扰的性能,作者利用通用的自适应调整滤波器系数算法,使用仿真工具统计对比无处理的有噪声语音信号和处理滤波后的语音信号, 结果显示自适应动态调整滤波系数的滤波器可以很好地消除干扰噪声。

2. 自适应滤波数学理论 自适应调整参数滤波器的架构由滤波系数乘法器、延时单元和加法器组成。假设滤波器的滤波系数为nw , 当输入为( )w t 时, 输出有:( )()NnSnNy tw x tnT=−=−∑。

自适应滤波器处理结果输出( )y t 为输入( )w t经过21N + 个不同时延单元输出结果的累加和。在stkT=时进行离散采样取值,根据计算累加得到自适应滤波输出结果为:()()nSnssnNy kTw x kTnT=−=−∑,简写为Nknk nnNyw x −=−= ∑。

为降低系统采样时由外界产生的噪声,需要动态调整自适应滤波系数,使得以k 为中心的前后N 个单元在采样时时间stkT=的噪声值趋向于零[1]。以得到极值为目标从而得到动态调整滤波器的系数,得到计算出极值的损失函数的方法有两种方式依据:以最小峰值畸变为准则得到极值和以最小均方误差为准则得到极值。其中,迫零算法为准则得到极值在处理的过程中忽略了加性噪声,会导致滤波器输出降噪性能下降。所以,本文选择得到最小均方误差为准则得到损失函数模型计算出最小均方误差。



相关标签