logo好方法网

语音唤醒方法、装置、计算机设备和存储介质


技术摘要:
本申请涉及一种语音唤醒方法、装置、计算机设备和存储介质。所述方法包括:在待机状态下检测触发信号,并记录第一时间;当触发信号符合预设条件时,将待机状态转换为监听状态,在监听状态下采集语音监听信号;将语音监听信号输入到语音类别检测模型中,得到检测结果,  全部
背景技术:
随着语音识别技术的发展,可以使用关键词语音来对待唤醒设备进行唤醒。通常 在待唤醒设备中,会关闭高功耗的麦克风(MIC),模数转换器(ADC),以及算法处理器(MCU或 者DSP)等来实现待唤醒设备低功耗待机的目的。然而,在这种情况下在进行待唤醒设备初 次唤醒时,由于存在前置感应器,前置感应器在触发时会存在一定的延迟,并且在前置感应 器触发后,开启麦克风(MIC),模数转换器(ADC),以及算法处理器(MCU或者DSP)等时也会存 在一定的延迟,从而出现语音信号丢失的现象,致使待唤醒设备在待机状态下的唤醒成功 率降低。
技术实现要素:
基于此,有必要针对上述技术问题,提供一种能够提高唤醒成功率的语音唤醒方 法、装置、计算机设备和存储介质。 一种语音唤醒方法,所述方法包括: 在待机状态下检测触发信号,并记录第一时间; 当触发信号符合预设条件时,将待机状态转换为监听状态,在监听状态下采集语 音监听信号; 将语音监听信号输入到语音类别检测模型中检测,得到检测结果,并记录第二时 间; 当检测结果为缺陷唤醒词类别时,根据第一时间和第二时间确定目标时间段,当 目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运行状态。 在其中一个实施例中,在当检测结果为缺陷唤醒词类别时,根据第一时间和第二 时间确定目标时间段之后,还包括: 当目标时间段未在预设时间段内时,保持监听状态。 在其中一个实施例中,检测结果还包括唤醒词类别,在将语音信号输入到语音类 别检测模型中检测,得到检测结果,并记录第二时间之后,还包括: 当检测结果为唤醒词类别时,根据唤醒词类别将监听状态转换为运行状态。 在其中一个实施例中,检测结果还包括非唤醒词类别,在将语音信号输入到语音 类别检测模型中检测,得到检测结果,并记录第二时间之后,还包括: 当检测结果为非唤醒词类别时,保持监听状态。 在其中一个实施例中,在保持所述监听状态之后,还包括: 当在监听状态下预设监听时间内未检测到触发信号时,将监听状态转换为待机状 态。 4 CN 111599352 A 说 明 书 2/11 页 在其中一个实施例中,语音类别检测模型的生成步骤,包括: 获取训练语料,训练语料包括唤醒词语料、非唤醒词语料、缺陷唤醒词语料和缺陷 非唤醒词语料; 将训练语料输入到神经网络模型中进行训练,当训练完成时,得到语音类别检测 模型,其中,所述唤醒词语料对应唤醒词类别标签、所述缺陷唤醒词语料对应缺陷唤醒词类 别标签、所述非唤醒词语料对应非唤醒词类别标签和所述缺陷非唤醒词语料对应所述非唤 醒词类别标签。 在其中一个实施例中,获取训练语料,包括: 获取唤醒词语料和非唤醒词语料,将唤醒词语料和非唤醒词语料播放,并进行录 音;根据录音结果得到缺陷唤醒词语料和缺陷非唤醒词语料。 一种语音唤醒装置,所述装置包括: 信号检测模块,用于在待机状态下检测触发信号,并记录第一时间; 语音采集模块,当触发信号符合预设条件时,将待机状态转换为监听状态,在监听 状态下采集语音监听信号; 语音检测模块,用于将语音监听信号输入到语音类别检测模型中检测,得到检测 结果,并记录第二时间; 唤醒模块,用于当检测结果为缺陷唤醒词类别时,根据第一时间和第二时间确定 目标时间段,当目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运 行状态。 在其中一个实施例中,唤醒模块还用于当目标时间段未在预设时间段内时,保持 监听状态。 在其中一个实施例中,唤醒模块还用于当检测结果为唤醒词类别时,根据唤醒词 类别将监听状态转换为运行状态。 在其中一个实施例中,唤醒模块还用于当检测结果为非唤醒词类别时,保持监听 状态。 在其中一个实施例中,信号检测模块,还用于当在监听状态下预设监听时间内未 检测到触发信号时,将监听状态转换为待机状态。 在其中一个实施例中,所述装置还包括: 训练模块,用于获取训练语料,训练语料包括唤醒词语料、非唤醒词语料、缺陷唤 醒词语料和缺陷非唤醒词语料;将训练语料输入到神经网络模型中进行训练,当训练完成 时,得到语音类别检测模型,其中,唤醒词语料对应唤醒词类别标签、缺陷唤醒词语料对应 缺陷唤醒词类别标签、非唤醒词语料对应非唤醒词类别标签和缺陷非唤醒词语料对应所述 非唤醒词类别标签。 在其中一个实施例中,所述装置还包括: 缺陷语料获取模块,用于获取唤醒词语料和非唤醒词语料,将所述唤醒词语料和 非唤醒词语料播放,并进行录音;根据录音结果得到缺陷唤醒词语料和缺陷非唤醒词语料。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理 器执行所述计算机程序时实现以下步骤: 在待机状态下检测触发信号,并记录第一时间; 5 CN 111599352 A 说 明 书 3/11 页 当触发信号符合预设条件时,将待机状态转换为监听状态,在监听状态下采集语 音监听信号; 将语音监听信号输入到语音类别检测模型中检测,得到检测结果,并记录第二时 间; 当检测结果为缺陷唤醒词类别时,根据第一时间和第二时间确定目标时间段,当 目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运行状态。 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执 行时实现以下步骤: 在待机状态下检测触发信号,并记录第一时间; 当触发信号符合预设条件时,将待机状态转换为监听状态,在监听状态下采集语 音监听信号; 将语音监听信号输入到语音类别检测模型中检测,得到检测结果,并记录第二时 间; 当检测结果为缺陷唤醒词类别时,根据第一时间和第二时间确定目标时间段,当 目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运行状态。 上述语音唤醒方法、装置、计算机设备和存储介质,通过在待机状态下检测触发信 号,并记录第一时间;当触发信号符合预设条件时,将待机状态转换为监听状态,在监听状 态下采集语音监听信号;将语音监听信号输入到语音类别检测模型中检测,得到检测结果, 并记录第二时间;当检测结果为缺陷唤醒词类别时,根据第一时间和第二时间确定目标时 间段,当目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运行状态。 通过语音类别检测模型检测语音监听信号并记录目标时间段,当检测结果为缺陷唤醒词类 别,且目标时间段在预设时间段内时,根据缺陷唤醒词类别将监听状态转换为运行状态,从 而在初次唤醒时,如果发生语音信号丢失,使用缺陷唤醒词也能对待唤醒设备进行唤醒,从 而能够提高唤醒成功率。 附图说明 图1为一个实施例中语音唤醒方法的应用环境图; 图2为一个实施例中语音唤醒方法的流程示意图; 图3为另一个实施例中语音唤醒方法的流程示意图; 图4为一个实施例中训练语音类别检测模型的流程示意图; 图5为一个实施例中获取训练语料的流程示意图; 图6为一个具体实施例中训练语音类别检测模型的示意图; 图7为一个具体实施例中状态转换的示意图; 图8为一个实施例中语音唤醒装置的结构框图; 图9为一个实施例中计算机设备的内部结构图。
分享到:
收藏