东莞市盛裕绒艺玩具有限公司

东莞市盛裕绒艺玩具有限公司

恒峰娱乐ag厅下载登录

15372366334
联系方式
全国服务热线: 15372366334

咨询热线:15358987605
联系人:徐华桥
地址:河北省曲阳县恒阳街路西78号

用在语音识别中的环境噪声注入方法

来源:恒峰娱乐ag厅下载登录   发布时间:2019-11-26   点击量:334

用在语音识别中的环境噪声注入方法

本发明涉及用在语音识别中的环境噪声注入。公开了一种用在生产车辆中的语音识别的环境噪声注入方法。该方法包括以下步骤:监控包括用户语音在内的音频;接收来自所述用户语音的发音;检索车辆特有环境噪声;和在预处理及解码所述发音之前,将所述车辆特有环境噪声前加给所述发音。

第二通信系统106可以是陆基有线系统,如公共电话交换网(PTSN)、网际协议(IP)网、光网络、光纤网络、电缆网和/或公用电输电线。系统106也可以是类似于系统104的另一个无线通信系统、WAN、WLAN或BWA网络,或者前面提到示例的任意组合,任何一种都可用于或适用于话音和/或数据通信。

用在语音识别中的环境噪声注入方法

VSM110便于实现任何适当的车载功能,如车辆诊断、监控、控制、报告和/或其它功能。例如,VSM110可用来控制发动机运转、监控并部署气囊或其它安全装置和/或经由各种车辆传感器诊断车辆系统。VSMllO广义上代表任何软件、电子器件或机电子系统以及车辆中与远程信息处理单元114交互的相关传感器或其它部件。在特定示例中,如果呼叫中心108向车辆102发送打开车门的信号,则远程信息处理单元114命令机电门锁VSM打开车门。

图3图解说明用于车内语音识别的示范性环境噪声注入方法,该方法将在下文详细描述。

本发明人发现过早发出命令致使ASR参数失调。ASR解码器假定在Ready提示符之后的最初几个声学数据帧仅仅是环境噪声。所以当最初的那几个帧实际包含部分发音时,噪声抑制、信道补偿及语音/无声检测参数的实际值与期望的参数值偏离。这种偏离导致包括解码器重调的加长超时周期,重放Ready提示符出现“请放慢速度(SlowerPlease)“的错误回答。本发明人还发现这种长延时加剧了该问题,使用户讲话更早更大声。

尽管在图1中将远程信息处理单元114描绘为单独的各个模块,但本领域技术人员会认识到它的许多部件可以集成在一起,或与其它车辆系统集成和/或分享。例如,存储器122可以被合并到处理器116中,或位于远程信息处理单元114的外部并为一个或多个其它车辆系统(如车辆中央处理单元)共享。尽管显示的VSM110与远程信息处理单元114分开,但这些VSM110的任何组合可能被集成在远程信息处理单元114内。而且,远程信息处理单元114可包括未显示的附加单元,或可省去所示的一些部件。

在步骤410,如果车辆没有移动,则可以例如从数据库D中检索所记录的车辆空闲环境噪声数据,并输出以在步骤415进行处理。

图4图解说明了选择车辆特有环境噪声的示范性方法400,并结合车辆运动参数和车辆速度参数进行了描述。该方法400只是可用于参考以上方法300描述的图3的步骤330的一个具体示例。因此,可使用包括任何其它适当的车辆特有参数、倾向于影响车内环境噪声的其它示例。例如,可使用车辆供暖、通风和空调(HVAC)参数,如风扇速度、出口类型(挡风玻璃除霜器,仪表板通气孔,底板通气孔)等。在另一个示例中,可使用窗户或可开式车顶开口参数。实际上,可使用任何可了解的车辆设置或条件参数,如转弯指示灯开/关,无线电或GPS开/关,无线电或GPS音量大小,听不见的背景语音,道路类型或道路状况等。可以任何适当方式进行车辆特有环境噪声的数据收集,如使用下文结合示范性图5描述的示范性方法。可将所收集的车辆特有环境噪声存储在数据库D中,如远程信息处理单元114的存储器122中,呼叫中心108的数据库150中或两者中等。

在步骤410,如果车辆没有移动,则可以例如从数据库D中检索所记录的车辆空闲环境噪声数据,并输出以在步骤415进行处理。

—般,车辆乘客出于下述基本目的中的一个或多个目的与自动语音识别系统(ASR)进行声音交互:训练该系统理解车辆乘客的特定话音;存储离散语音,如类似数字或关键字的口头控制字或口头标志(nametag);或出于诸如话音拨号、菜单导航、转录、服务请求等的任何适当目的识别车辆乘客的语音。通常,ASR从人的语音中提取声学数据,将该声学数据与所存储的子字数据进行比较和对照,选择可以与其它所选子字连接的合适子字,并输出所连接的子字或字以用于后续处理,如听写或转录、地址簿拨号、存储到存储器、训练ASR模型或自适应参数等。

处理器116执行存储在存储器122中的一个或多个程序124以实现各种功能,如系统监控、数据处理和使远程信息处理单元114与VSM110、车辆乘客和远程位置之间进行通信。例如,处理器116可执行一个或多个控制程序及处理程序和/或数据以能够单独或与呼叫中心108结合实现环境噪声注入方法。在另一个示例中,处理器116控制、生成并接受在远程信息处理单元114和呼叫中心108之间、远程信息处理单元114和连接到各VSM110的车辆通信总线112之间传输的信号。在一种模式中,这些信号用来激活VSM110的编程模式和工作模式。

相关产品

COPYRIGHTS©2017 恒峰娱乐ag厅下载登录 ALL RIGHTS RESERVED 备案号:334