logo好方法网

一种语音数据分析方法及系统


技术摘要:
本申请提供了一种语音数据分析方法及系统,所述方法包括:获取用户的语音学习信息及语音信息;根据语音学习信息提取语音信息中的重点词,并提取重点词中的音素数据;根据预设声学模型对音素数据进行一一评分,得到重点词中每个音素数据的音素得分,根据重点词中每个音  全部
背景技术:
随着科学技术的发展,基于互联网的语言学习应用在中小学的语言学习阶段也得 到了快速的发展,越来越多的学生采用互联网的学习模式进行语言学习。而在语言发音学 习的过程中,多数情况下是对学生的词句发音进行整体评价,并根据评价结果输出星级反 馈等,这种评价体系无法使学生明确认知自身发音的具体问题,尤其是针对语音学习内容 设定的重点词的发音具体问题。
技术实现要素:
本申请提供了一种语音数据分析方法及系统,用以解决现有方法中无法明确得知 语音学习中重点词错音具体位置的问题。 为了实现上述目的,本申请提供了以下技术方案: 一种语音数据分析方法,包括以下步骤: 获取用户输入的语音学习信息及语音信息,并根据所述语音学习信息提取所述语 音信息中的重点词; 提取所述重点词中的音素数据,根据预设声学模型对所述音素数据进行一一评 分,得到所述重点词中每个所述音素数据的音素得分; 根据所述重点词中每个所述音素数据的音素得分计算得到所述重点词的重点词 发音得分; 判断所述重点词中是否存在所述音素得分小于预设音素发音值的错音音素数据, 若存在,则将所述错音音素数据和所述错音音素数据对应的重点词进行不同标签显示;或 者 判断所述重点词发音得分是否小于所述预设单词发音值,若是,则判断重点词中 每个所述音素数据的所述音素是否小于预设音素发音值,将小于所述预设音素发音值的音 素数据作为所述错音音素数据,并将所述错音音素数据和所述错音音素数据对应的重点词 进行不同标签显示。 进一步的,所述语音学习信息提取所述语音信息中的重点词的步骤包括: 由所述语音学习信息中提取当前所学内容标签,将所述当前所学内容标签匹配重 点词数据库,得到当前所学内容对应的所述重点词,所述当前所学内容为所述语音信息对 应的学习内容; 其中,重点词数据库存储有当前所学内容标签对应的重点词,重点词由小学、初中 或高中不同学习时段课标要求预先设定和/或对历史学习信息中的易错单词进行预先标注 而形成。 进一步的,所述根据所述重点词中每个音素数据的音素得分得到所述重点词的重 4 CN 111583908 A 说 明 书 2/8 页 点词发音得分的步骤,包括:根据所述重点词中每个音素数据的音素得分,计算所述重点词 中所有音素数据的音素得分的平均值,将该计算结果作为所述重点词的重点词发音得分。 进一步的,签显示包括颜色标签显示、下划线标签显示或线框标签显示; 所述将所述错音音素数据及所述错音音素数据对应的重点词进行不同标签显示 包括; 根据所述错音音素数据的音素得分为所述错音音素数据打不同的颜色标签; 对所述错音音素数据对应的重点词进行下划线标签显示或线框标签显示。 在其中一个实施例中,上述方法还包括:根据所述重点词得分以及所述用户输入 的语句发音的时间长度特征、流利度特征、完整度特征、音量特征、韵律特征中任意一种以 上特征的组合计算所述重点词所在的语句信息的语句得分。 本申请还提供一种语音数据分析系统,包括: 获取模块,用于获取用户输入的语音学习信息及语音信息,并根据语音学习信息 提取所述语音信息中的重点词; 音素评分模块,用于提取所述重点词中的音素数据,根据预设声学模型对所述音 素数据进行一一评分,得到所述重点词中每个音素数据的音素得分; 重点词评分模块,用于根据所述重点词中每个音素数据的音素得分计算得到所述 重点词的重点词发音得分; 判断显示模块,用于判断所述重点词中是否存在所述音素得分小于预设音素发音 值的错音音素数据,若存在,则将所述错音音素数据和所述错音音素数据对应的重点词进 行不同标签显示;或者判断所述重点词发音得分是否小于所述预设发单词音值,若是,则判 断重点词中每个所述音素数据的所述音素是否小于预设音素发音值,将小于所述预设音素 发音值的音素数据作为所述错音音素数据,并将所述错音音素数据和所述错音音素数据对 应的重点词进行不同标签显示 进一步的,所述获取模块包括提取匹配单元:用于由所述语音学习信息中提取当 前所学内容标签,将所述当前所学内容标签匹配重点词数据库,得到当前所学内容对应的 所述重点词,所述当前所学内容为所述语音信息对应的学习内容; 其中,重点词数据库存储有当前所学内容标签对应的重点词,重点词由小学、初中 或高中不同学习时段课标要求预先设定和/或对历史学习信息中的易错单词进行预先标注 而形成。 进一步的,标签显示包括颜色标签显示、下划线标签显示或线框标签显示;所述判 断显示模块包括: 音素标签单元,用于根据所述错音音素数据的音素得分为所述错音音素数据打不 同的颜色标签; 重点词显示单元,用于对所述错音音素数据对应的重点词进行下划线标签显示或 线框标签显示。 本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指 令,当其在计算机上运行时,使得计算机执行上述实施例提供的语音数据分析方法和系统。 本申请还提供了一种电子设备,包括:处理器、存储器,存储器用于存储程序,处理 器用于运行程序,其中,程序运行时执行上述实施例提供的语音数据分析方法和系统。 5 CN 111583908 A 说 明 书 3/8 页 本发明所提供的语音数据分析方法及系统,提取用户当前学习内容的重点词,根 据预设声学模型对重点词的音素数据进行评分,得到重点词中每一音素数据的音素得分, 并根据重点词中的每一音素得分得到该重点词的发音得分,然后对重点词的发音得分和音 素得分与预设单词发音值和预设音素发音值进行比较,得到相应的错音音素数据及其对应 的重点词,并将错音音素数据及其对应的重点词分别以不同的标签进行显示,提示用户发 音错误的具体位置,可以有针对性地帮助用户发现自身发音的具体问题,从而有针对性地 进行改正,同时对当前学习内容中的重点词进行发音评分,使得学习过程中具有侧重点,且 减少了预设声学模型的计算量及计算过程。 附图说明 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本申请一具体实施例的语音数据分析方法的流程示意图; 图2为本申请一具体实施例的语音数据分析系统的结构示意图; 图3为本申请实施例公开的电子设备的结构示意图。
分享到:
收藏