logo好方法网

一种基于多语种的情感分类方法及系统


技术摘要:
本申请实施例提供一种基于多语种的情感分类方法及系统,该方法包括:提取多语种待分类文本的各待分类特征词;根据提取得到的各待分类特征词,查找预先建立的多语种情感分类模型,获得所述各待分类特征词在不同情感类别下的贝叶斯概率系数;将获得的最大的贝叶斯概率系  全部
背景技术:
随着网络的不断发展,来自不同国家不同地区的人们活跃在社交网络平台上,比 如微博、论坛等,通过社交网络平台来表达对某些事情的看法。涉及的语种类型已经不仅限 于中文、英文这样常见的语种,一些其他国家的非常见语言也出现在互联网上。目前,为了 全面获取各国人士表达的言论或看法,挖掘人们的情感倾向性,关注不同语种群体人们的 情绪变化逐渐引起了研究人员的注意。 然而现有技术中,常用的情感分类技术主要包括:基于情感词典识别文本情感的 方法,是针对某种单一语种来实现情感分类,不能考虑多种语种的语言特征,无法实现对多 种语种的精确情感识别。因此亟需一个合理、系统的方法来识别多种语种文本的情绪变化。
技术实现要素:
本申请提供一种基于多语种的情感分类方法及系统,该基于多语种的情感分类方 法用于解决现有的情感分类方案难以有效地应用于多种语种文本的问题。 第一方面,本申请提供一种基于多语种的情感分类方法,包括:提取多语种待分类 文本的各待分类特征词;根据所述多语种待分类文本的各待分类特征词,查找预先建立的 多语种情感分类模型,获得所述多语种待分类文本的各待分类特征词在不同情感类别下的 贝叶斯概率系数;其中,所述多语种情感分类模型包括不同特征词在不同情感类别下的贝 叶斯概率系数;将获得的最大的贝叶斯概率系数对应的情感类别作为所述多语种待分类文 本的情感分类结果。 第二方面,本申请提供一种基于多语种的情感分类系统,包括: 第一提取模块,用于提取多语种待分类文本的各待分类特征词; 概率系数获取模块,用于根据所述多语种待分类文本的各待分类特征词,查找预 先建立的多语种情感分类模型,获得所述多语种待分类文本的各待分类特征词在不同情感 类别下的贝叶斯概率系数;其中,所述多语种情感分类模型包括不同特征词在不同情感类 别下的贝叶斯概率系数; 分类执行模块,用于将获得的最大的贝叶斯概率系数对应的情感类别作为所述多 语种待分类文本的情感分类结果。 第三方面,本申请实施例提供一种基于多语种的情感分类系统,包括:至少一个处 理器和存储器; 所述存储器存储计算机执行指令; 所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个 处理器执行如上第一方面以及第一方面各种可能的设计所述的方法。 5 CN 111597329 A 说 明 书 2/11 页 第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介 质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以 及第一方面各种可能的设计所述的方法。 本发明提供一种基于多语种的情感分类方法及系统,该方法通过预先建立的包括 各特征词在不同情感类别下的贝叶斯概率系数的多语种情感分类模型,结合多语种待分类 文本中的待分类特征词获取所述多语种待分类文本的情感分类结果,克服了现有技术中难 于实现多语种文本情感识别的缺陷,能够实现对多语种文本的情感检测,以便通过该方法 快速了解不同语种人群对同一事件的看法,进而掌握不同语种人群的情绪变化并采取相应 措施。 附图说明 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根 据这些附图获得其他的附图。 图1是本申请实施例一提供的基于多语种的情感分类方法的流程示意图; 图2是本申请实施例二提供的基于多语种的情感分类方法的流程示意图; 图3是本申请实施例三提供的基于多语种的情感分类系统的结构示意图; 图4是本申请实施例四提供的基于多语种的情感分类系统的结构示意图; 图5是本申请实施例五提供的基于多语种的情感分类系统的硬件结构示意图。
分享到:
收藏