东莞市盛裕绒艺玩具有限公司

东莞市盛裕绒艺玩具有限公司

恒峰娱乐ag厅下载登录

15372366334
联系方式
全国服务热线: 15372366334

咨询热线:15358987605
联系人:徐华桥
地址:河北省曲阳县恒阳街路西78号

用于保持多通道音频中的语音可听度的方法和设备

来源:恒峰娱乐ag厅下载登录   发布时间:2019-11-26   点击量:14

用于保持多通道音频中的语音可听度的方法和设备

本发明包括一种用于改进多通道音频信号中的语音的可听度的方法和设备。该方法包括:对多通道音频信号的第一特征和第二特征进行比较以产生衰减因子。第一特征对应于多通道音频信号的包含语音音频和非语音音频的第一通道,第二特征对应于多通道音频信号的主要包含非语音音频的第二通道。该方法还包括:根据语音似然值调节衰减因子以产生经调节的衰减因子。该方法还包括:使用经调节的衰减因子对第二通道进行衰减。

Bennett在美国申请公布N0.20070027682中提出了用于管理语音和非语音音频的相对水平的另一种方法实例。

本发明的第二方面基于以下观察:语音信号的功率和遮蔽信号的功率间的比率为语音可懂度的较差的预测因子。因此,根据本发明的该第二方面,通过利用基于心理声学的可懂度预测模型来预测在存在非语音信号的情况下语音信号的可懂度来计算保持预定的可懂度水平所需要的非语音通道中的信号的衰减。

以上描述示出了本发明的多种实施例以及如何实现本发明的各方面的示例。以上示例和实施例不应被认为是仅有的实施例,其被提出用以说明由以下权利要求限定的本发明的灵活性和优点。基于以上公开和以下权利要求,其它设置、实施例、实现方式和等同物对于本领域技术人员来说是明显的,并且可以被采用而不脱离由权利要求限定的本发明的精神和范围。

在根据本发明的一个实施例的用于改进多通道音频信号中的语音的可听度的方法中,第一测量是第一通道中的信号的第一功率,第二测量是第二通道中的信号的第二功率,并且该差异是第一功率和第二功率之间的比率。

依赖于可用的计算资源以及所施加的约束,优化电路(307,308)的形式和复杂性可以有很大变化。根据一个实施例,使用N个自由参数的迭代、多维约束优化。每个参数代表应用于非语音通道的频带之一的增益。诸如以下的N维搜索空间中的最陡梯度法的标准技术可以用于寻找最大值。在另一个实施例中,一种在计算上要求较低的手段将增益-频率函数约束为一小组可能的增益-频率函数(如一组不同的谱梯度或货架(Shelf)滤波器)的成员。利用这种额外约束,优化问题可以简化为少量的一维优化。在又一个实施例中,在很小的一组可能的增益函数中进行穷举搜索。在需要恒定计算负荷和搜索速度的实时应用中,尤其可能需要后一种手段。

背景技术

用于保持多通道音频中的语音可听度的方法和设备

本发明的第三方面基于以下观察:如果允许衰减随不同频率而变化,则(a)能够利用多种衰减模式实现给定的可懂度水平;以及(b)不同的衰减模式能够产生非语音音频的不同水平的响度或显著度。因此,根据本发明的该第三方面,通过以下方式来控制非语音音频对语音音频的遮蔽:找到衰减模式,其在达到预测的语音可懂度的预定水平的约束下使非语音音频的响度或一些其它显著度测量最大化。

以上描述示出了本发明的多种实施例以及如何实现本发明的各方面的示例。以上示例和实施例不应被认为是仅有的实施例,其被提出用以说明由以下权利要求限定的本发明的灵活性和优点。基于以上公开和以下权利要求,其它设置、实施例、实现方式和等同物对于本领域技术人员来说是明显的,并且可以被采用而不脱离由权利要求限定的本发明的精神和范围。

技术领域

具体实施方式

图4A示出了图1的设置还可以应用于L、C和R的一个或更多个子频带。具体来说,信号L、C和R中的每个可以通过滤波器组(441、442和443),产生以η个子频带为一组的三个组:IL1,L2,,LJ、IC1,C2,,CJ和{R1;R2,,Rj。匹配的子频带被传递到图1所示的电路125的η个实例,并且经处理的子信号被重新结合(通过加法电路451和452)。可以针对每个子频带选择独立的阈值θη。一种较好的选择是这样的设置,θη与相应频域中承载的语音信号的平均数量成比例;即,频谱的两端处的频带被赋予比对应于主要语音频率的频带更低的阈值。本发明的实现方式提供了计算复杂性和性能之间的很好的权衡。

本发明的实施例可以作为方法或过程执行。这些方法可以通过作为硬件或软件或其结合的电子电路来实现。用于实现该过程的电路可以是专用电路(仅执行特定任务)或通用电路(其被编程以执行一个或更多个特定任务)。

相关产品

COPYRIGHTS©2017 恒峰娱乐ag厅下载登录 ALL RIGHTS RESERVED 备案号:14