logo好方法网

一种基于知识图谱的语音问答系统及其应用方法


技术摘要:
本发明公开了一种基于知识图谱的语音问答系统及其应用方法,终端应用模块用于声音录制以及获取数据的展示;语音识别模块负责实时监测并接收终端应用模块发送的音频信息,利用语音识别引擎进行模数转换,生成文本句式信息;语义理解模块实时接收来自语音识别模块生成的  全部
背景技术:
通过多年作战指挥信息系统的建设,在数据信息中心收集、存储了各类部队、人 物、车辆、工程、装备、物资等信息,已经初步地体现了数据信息汇聚的作用。但现有的作战 数据汇聚和检索手段,未能满足现有系统的实际需求,数据之间的关联性、数据检索能力的 准确性较弱,面向相关理论、方法和研究相对薄弱的情况下,急需开展基于现有作战数据的 知识图谱语音检索研究工作。 知识图谱是一种知识表示技术,可以描述客观世界的概念、实体、事件及其之间的 关系。实质上,知识图谱是一种可对任何事物以及他们之间关系进行细化描述的语义关系 网络。知识图谱又可以看做是一张庞大的图,图中的节点表示实体或概念,而图中的边则由 属性或关系构成。目前,知识图谱在各领域中也得到了广泛的应用。同时,随着我军各领域 军事数据信息的日益扩大,知识图谱的构建已是势在必行。 语音识别技术是一种实现人机交互中的技术,它的功能就是让计算机完成将信息 从“声音”到“文字”的转换,通过将人的语音直接转换为相应的文本或命令。从系统构成上 来说,语音识别系统是建立在一定硬件平台和操作系统基础上的应用软件系统。从系统结 构上来说,语音识别系统一般主要由预处理、特征提取、声学模型、识别解码、语言模型、识 别结果处理等模块构成。对比传统的手动文本输入和手动命令点击,语音识别可更加有效、 快速的完成文本输入和指令操作,因此语音识别技术的研究工作也是势在必行。 语义可以看作是数据所对应的现实世界中的事物所代表的概念的含义,以及这些 含义之间的关系,是数据在某个领域上的解释和逻辑表示。语义理解,也就是所谓的知道了 一个词或一个句子的意思。它包含了两层含义:一是能够实现不同符号之间的变换;二是能 够进行推理。语义理解实际涉及的范围很广,内容很多,大致包括文本分类、要素抽取、语义 理解、智能客服和机器翻译等领域。对比传统的检索方式,用户需自行分析总结关键词,而 语义理解用户只需给出口语化的问答句式,大大简化了用户的思考,节省了时间,而且通过 语音识别输入更加自然,达到人与计算机“交流”的目的,因此语义理解技术的研究工作同 样势在必行。
技术实现要素:
发明目的:本发明的一个目的是提供一种基于知识图谱的、支持语音输入的高效 率、高灵活性的语音问答系统。 本发明的另一个目的是提供一种基于知识图谱的语音问答系统的应用方法。 技术方案:本发明所述的基于知识图谱的语音问答系统,包括终端应用模块、语音 识别模块、语义理解模块和数据检索模块,其中,终端应用模块用于声音录制以及获取数据 5 CN 111597308 A 说 明 书 2/7 页 的展示;语音识别模块负责实时监测并接收终端应用模块发送的音频信息,利用语音识别 引擎进行模数转换,生成文本句式信息;语义理解模块实时接收来自语音识别模块生成的 文本句式信息,利用语义理解引擎将关键词信息提取出来;数据检索模块负责接收语义理 解模块生成的关键词信息,通过对知识图谱数据库的访问获取用户实际期望得到的信息, 最后返回终端应用模块显示在界面上。 优选的,语音识别模块包括语音识别客户端和语音识别服务端,语音识别客户端 主要负责收录用户的提问语音并录制成pcm格式的音频文件发送至语音识别服务端;语音 识别服务端执行语音识别的主要功能,先进行预处理和特征提取,通过抗混叠滤波将频谱 上的杂音与目标区段区分开来,提取有用信息并完成模拟信号向数字信号的转换,然后送 往解码器根据事先训练好的声学模型和语言模型进行模式匹配,最后将用户语音内容作为 识别结果返回语音识别客户端。 优选的,语义理解模块主要提供语义理解服务端,该语义理解服务端提供http访 问接口,指挥系统通过http协议以语音识别模块得到的文本信息为参数访问语义理解服务 端,语义理解服务端将文本信息与提前训练好的模板句式进行匹配,找到似然度最高的模 板句式,得到该句式预先设定的关键词及其类型信息并以字符串的形式返回指挥系统。 优选的,关键词对应知识图谱数据库中数据表的名称字段、属性名称或关系名称, 类型对应数据表名、属性或关系,通过对表的查询得到用户想要检索的信息。 本发明所述的语音问答系统的应用方法,包括以下步骤: (1)配置知识图谱数据库中表的结构信息,通过知识图谱数据库中表的字段关联 构建本体模型,并利用这些模型之间的关联字段构建数据关系模型,将数据关系模型存入 知识图谱数据库中; (2)用户通过录音设备将想要检索的内容以口语的方式录入,生成音频文件发送 至语音识别服务端,语音识别服务端将音频文件解析成文本信息返回给语音识别客户端; 该步骤将音频录制生成音频文件,通过信号预处理、语音特征提取、训练与识别等模块对音 频文件进行处理并解码,最终转换成文本信息,具有较高的精度和实时性。 (3)构建问答句式模型,以便语义理解模块匹配挑选出对应的关键词信息; 该步骤结合语义特征的关键词及其类型,将其分类并重组形成语义模板句式,使 得运用范围更广、信息获取更灵活,提升整体问答检索的准确性和普适性。 (4)语音识别客户端将文本信息作为参数访问语义理解服务提供的http端口,语 义理解服务将该文本信息提取关键词返回给语音识别客户端; 该步骤通过语料采集和语义建模生成文本语料库,并针对语料库进行语料训练和 测试生成特征模板,用于分析给定的文本句式将其中的关键词通过匹配特征模板提取出 来,并标注关键词的类型。 (5)数据检索模块通过该关键词信息到知识图谱数据库中查询该关系或属性信息 并通过终端应用模块展示给用户。 该步骤通过语义功能获取的关键词及其类型,匹配相应的数据关系模型,并到数 据库中搜索相应的属性或关系内容,信息特征提取后即可在页面显示。 进一步的,步骤(1)中数据关系模型的构建方法为: (11)根据数据源进行本体模型构建,每张数据表都能作为一个本体; 6 CN 111597308 A 说 明 书 3/7 页 (12)进行本体模型关系构建,两张数据表之间若存在关联字段,便进行本体模型 关系构建; (13)进行实体关系构建,将数据表中的每一条数据作为一个实体,每条数据的每 个字段作为该实体的属性,两个实体间若存在关联属性的值相等或经过特定公式计算后相 等,则进行实体关系构建; (14)将生成的数据存入图数据库并建立索引,完成数据关系模型构建。 进一步的,步骤(2)中语音识别实现方法为: (21)语音识别客户端接收到操作者在指挥系统录制的音频后生成pcm格式的音频 文件发送至语音识别服务端; (22)语音识别服务端接收到音频文件后,对语音信号进行预处理,首先进行端点 检测,识别出语音的起始和结束位置;然后对语音高频部分添加权重,以增加语音分辨率; 最后对语音信号进行加窗处理,强调语音波形,削弱其他波形,以提高语音质量,达到预处 理效果; (23)特征提取,对语音信号进行滤波,将输出的信号能量作为信号的基本特征; (24)特征提取后进行解码,根据训练好的声学模型和语言模型进行匹配,输出似 然度最高的词序作为识别结果;其中声学模型主要负责将音频信号与基本的声学单元进行 匹配,将音频信号转换成声学单元的序列集合;语言模型主要负责记录不同字词之间的组 合概率关系,将声学单元的组合输出成更接近自然文本的句子;最后由解码器进行打分并 筛选出可能的识别结果; (25)服务端将识别结果生成文本信息返回给指挥系统。 进一步的,步骤(3)中问答句式的构建方法为: (31)将不同类型的数据分别写入以该类型命名的文档中; (32)根据文法设计的格式将问答句式的结构按要求填写完整; (33)使用文法编译工具将步骤(31)中的文档编译成文法资源文件; (34)如果对问答句式有增加、删除或修改操作,则直接对步骤(31)中的文档进行 修改,生成并替换文法资源文件。 进一步的,步骤(4)中语义理解的实现方法为: (41)指挥系统接收到语音识别模块返回的文本数据信息后,将文本数据以参数的 形式通过http协议访问发送至语义理解服务端; (42)语义理解服务端接收到文本数据后,对其进行预处理,去掉干扰的字符并抽 取其中的有用信息,然后将这些信息映射成特征序列; (43)将文本特征序列与提前训练好的特征模板进行匹配,得到该文本数据的特征 向量信息,将特征向量导入提前训练好的语义模型中,便得到一组与该文本数据匹配的模 型句式; (44)通过语义pk对不同模型句式进行打分并降序排列,选出匹配度和可靠性最高 的句式模板作为提取语义信息的依据; (45)将语义信息转换为最终的关键词及其类型返回给指挥系统。 进一步的,步骤(5)中关键词检索分析方法为: (51)指挥系统接收到语义理解服务端返回的关键词及其类型信息后,首先区分实 7 CN 111597308 A 说 明 书 4/7 页 体关键词和关联关键词; (52)根据实体关键词的类型,找到对应的数据表并查出该实体对应的信息; (53)根据关联关键词的类型,找到该实体对应的属性或关系并查出该属性或关系 对应的完整内容; (54)将步骤(53)得到的内容作为检索结果在指挥系统终端界面展示。 本发明通过知识图谱构建数据关系模型将各数据之间建立联系,利用语音识别和 语义分析能力,快速方便的检索到对应的内容,为指挥信息系统的数据检索能力提供技术 保障。 有益效果:与现有技术相比,本发明具有以下优点: (1)利用高效索引提高了检索效率,节省了存储空间。 (2)语音识别功能能够解放用户的双手,提供更有效的交互方式。 (3)语义理解功能能够将复杂的问答句式迅速提取出关键信息,提高检索效率。 (4)问答句式的可构建功能能够增加问答检索的准确性和普适性。 (5)关键词检索功能能够更有针对性的获得用户预期的检索结果。 附图说明 图1是本发明系统架构图; 图2是数据关系模型构建示意图; 图3是语音识别模块示意图; 图4是问答句式构建示意图; 图5是语义理解模块示意图; 图6是关键词检索分析示意图。
分享到:
收藏