
技术摘要:
本发明公开了一种语音查询方法、装置、计算机设备及存储介质,所述方法包括:接收包含场景标识符的场景查询指令,获取源语音数据;输入训练完成的深度学习拼音识别模型,根据提取出的语音拼音特征输出拼音序列数据;从与场景标识符匹配的拼音词典中查找出与拼音序列数 全部
背景技术:
目前,在互联网技术领域,由于业务场景千变万化而且不断新增业务场景,数据库 中存储越来越多的数据,针对不同的业务场景中的专业用语就越来越多,因此通过语音识 别出专业用语进行准确的查询越来越成为迫切需求。现有技术中,主要通过大量的训练词 语样本进行训练深度神经网络完成的语音识别系统实现语音识别,由于训练词语样本中出 现的评率极低或者无,因此对于特殊的业务场景而产生的专业用语,语音识别系统往往会 转换为同音词,但是却不是正确的专业用语,例如用户说的是“置业顾问”,语音识别系统转 换为“职业顾问”等,造成通过语音查询获得的结果并非是用户真正想要的结果,导致识别 准确率低,用户的体验满意度低。
技术实现要素:
本发明提供一种语音查询方法、装置、计算机设备及存储介质,实现了针对不同的 业务场景,能够快速地、准确地、自动地识别出用户的语音数据中的专业用语,从而获得用 户需要的查询结果,提升了识别准确率,提高了用户的体验满意度。 一种语音查询方法,包括: 接收包含场景标识符的场景查询指令,获取源语音数据; 将所述源语音数据输入训练完成的深度学习拼音识别模型,所述深度学习拼音识 别模型提取出所述源语音数据中的语音拼音特征,获取所述深度学习拼音识别模型根据所 述语音拼音特征输出的拼音序列数据;其中,所述拼音序列数据包括拼音数据及其对应的 音调数据; 从与所述场景标识符匹配的拼音词典中查找出与所述拼音序列数据中包含的拼 音串匹配的关键词拼音串,将所述拼音序列数据中的所有所述拼音串替换成与其匹配的所 述关键词拼音串对应的关键词,将替换后的所述拼音序列数据记录为拼音转换数据;其中, 所述拼音转换数据包括拼音数据及其对应的音调数据和所述关键词; 将所述拼音转换数据输入语言识别模型,所述语言识别模型提取出所述拼音转换 数据中所有所述拼音数据及其对应的音调数据的词义特征,所述语言识别模型根据所述词 义特征预测出所有所述拼音数据及其对应的音调数据在所述拼音转换数据中的预测汉字, 将所有所述预测汉字替代与其对应的所述拼音数据及其对应的音调数据,将替代后的所述 拼音转换数据记录为最终语音数据; 将所述最终语音数据输入SQL语句转换模型,所述SQL语句转换模型将所述最终语 音数据转换成SQL查询语句,通过执行所述SQL查询语句获取查询结果并进行展示。 一种语音查询装置,包括: 5 CN 111611349 A 说 明 书 2/12 页 接收模块,用于接收包含场景标识符的场景查询指令,获取源语音数据; 提取模块,用于将所述源语音数据输入训练完成的深度学习拼音识别模型,所述 深度学习拼音识别模型提取出所述源语音数据中的语音拼音特征,获取所述深度学习拼音 识别模型根据所述语音拼音特征输出的拼音序列数据;其中,所述拼音序列数据包括拼音 数据及其对应的音调数据; 查询模块,用于从与所述场景标识符匹配的拼音词典中查找出与所述拼音序列数 据中包含的拼音串匹配的关键词拼音串,将所述拼音序列数据中的所有所述拼音串替换成 与其匹配的所述关键词拼音串对应的关键词,将替换后的所述拼音序列数据记录为拼音转 换数据;其中,所述拼音转换数据包括拼音数据及其对应的音调数据和所述关键词; 识别模块,用于将所述拼音转换数据输入语言识别模型,所述语言识别模型提取 出所述拼音转换数据中所有所述拼音数据及其对应的音调数据的词义特征,所述语言识别 模型根据所述词义特征预测出所有所述拼音数据及其对应的音调数据在所述拼音转换数 据中的预测汉字,将所有所述预测汉字替代与其对应的所述拼音数据及其对应的音调数 据,将替代后的所述拼音转换数据记录为最终语音数据; 显示模块,用于将所述最终语音数据输入SQL语句转换模型,所述SQL语句转换模 型将所述最终语音数据转换成SQL查询语句,通过执行所述SQL查询语句获取查询结果并进 行展示。 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理 器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音查询方法的步 骤。 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计 算机程序被处理器执行时实现上述语音查询方法的步骤。 本发明提供的语音查询方法、装置、计算机设备及存储介质,通过接收包含场景标 识符的场景查询指令,获取源语音数据;将所述源语音数据输入训练完成的深度学习拼音 识别模型,获取所述深度学习拼音识别模型根据提取的语音拼音特征输出的拼音序列数 据;从与所述场景标识符匹配的拼音词典中查找出与所述拼音序列数据中包含的拼音串匹 配的关键词拼音串,将所述拼音序列数据中的所有所述拼音串替换成与其匹配的所述关键 词拼音串对应的关键词,得到拼音转换数据;将所述拼音转换数据输入语言识别模型,所述 语言识别模型根据提取的词义特征预测出所有预测汉字,将所有所述预测汉字进行替代, 得到最终语音数据;将所述最终语音数据输入SQL语句转换模型,转换成SQL查询语句,通过 执行所述SQL查询语句获取查询结果并进行展示,如此,本发明实现了针对不同的业务场 景,能够快速地、准确地、自动地识别出用户的语音数据中的专业用语(特殊词语),从而获 得用户需要的查询结果,避免了识别出错误的词语导致查询结果不正确,进而提升了识别 准确率,提高了用户的体验满意度。 附图说明 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图 6 CN 111611349 A 说 明 书 3/12 页 获得其他的附图。 图1是本发明一实施例中语音查询方法的应用环境示意图; 图2是本发明一实施例中语音查询方法的流程图; 图3是本发明一实施例中语音查询方法的步骤S20的流程图; 图4是本发明一实施例中语音查询方法的步骤S203的流程图; 图5是本发明另一实施例中语音查询方法的步骤S20的流程图; 图6是本发明一实施例中语音查询方法的步骤S30的流程图; 图7是本发明另一实施例中语音查询方法的步骤S30的流程图; 图8是本发明一实施例中语音查询方法的步骤S50的流程图; 图9是本发明一实施例中语音查询装置的原理框图; 图10是本发明一实施例中计算机设备的示意图。