
技术摘要:
提供一种不会降低学习完毕的学习器的推论精度,能对学习完毕的学习器的推论结果的合理性进行适当评估的方法。本发明的一方面的评估装置包括:数据获取部,获取对利用数据集进行了有教学学习的学习完毕的第一学习器输入的输入数据,数据集包含训练数据、及表示对训练数 全部
背景技术:
近年来,在图像识别、语音识别、语言分析等各种领域,正利用机器学习。所谓机器 学习,是指通过计算机(computer)来找出潜藏在所给予的数据(训练数据)中的模式 (pattern)的方法,通过实施机器学习所得到的学习完毕的学习器能够获得对未知的输入 数据进行规定推论的能力。推论的结果被利用于所述图像识别、语音识别、语言分析等。 但是,难以预估在机器学习后会给予的输入数据的所有种类来准备训练数据。例 如,在图像识别领域中利用机器学习的情况下,难以预估成为图像识别对象的所有事件来 准备图像数据。在给予了与在机器学习时所准备的训练数据大相径庭的种类的输入数据 时,学习完毕的学习器对输入数据的推论的合理性有可能受损,即,有可能进行错误的推 论。 因此,专利文献1中提出了一种方法:利用对输入数据进行规定推论的问题解决用 神经网络(neural network)以外的另一神经网络,对所述问题解决用神经网络的输出的可 靠性进行评估。具体而言,利用与问题解决用神经网络的学习时所利用的学习数据不同的 未学习数据,来实施未学习事例判别用神经网络的机器学习。由此,未学习事例判别用神经 网络能够获得判别输入数据是否类似于未学习数据的能力。 所述方法中,通过像这样构建的未学习事例判别用神经网络,对问题解决用神经 网络的输出的可靠性进行评估。即,在进行推论时,将对问题解决用神经网络输入的输入数 据也输入到所述未学习事例判别用神经网络。并且,基于从未学习事例判别用神经网络得 到的输出,判别所述输入数据是否类似于未学习数据。由此,判定输入数据是否是与问题解 决用神经网络的学习时所利用的学习数据大相径庭的种类,对输入所述输入数据时从问题 解决用神经网络获得的输出(即,推论结果)的可靠性进行评估。 现有技术文献 专利文献 专利文献1:日本专利特开平05-225163号公报
技术实现要素:
发明所要解决的问题 本申请发明人等针对所述专利文献1中提出的方法,发现了下述问题。即,在机器 学习中,基本而言,学习时利用的训练数据的数量越多,则越能提高学习完毕的学习器的推 论精度。但是,专利文献1所提出的方法中,将为了机器学习所准备的训练数据分为问题解 决用神经网络的学习所利用的学习数据、与未学习事例判别用神经网络的学习所利用的未 学习数据。即,无法将所准备的所有训练数据利用于问题解决用神经网络的学习,因此学习 完毕的问题解决用神经网络的推论精度有可能降低。 4 CN 111602137 A 说 明 书 2/36 页 而且,如上所述,难以预估成为推论对象的所有事件来准备训练数据。因此,原本 就难以预估对问题解决用神经网络输入的所有种类的输入数据,来准备利用于未学习事例 判别用神经网络的学习的未学习数据。即,无法消除有可能会给予与在机器学习时所准备 的训练数据大相径庭的种类的输入数据这一根本性原因。因此,在专利文献1所提出的方法 中,难以构建能够对问题解决用神经网络的推论结果的可靠性进行适当评估的未学习事例 判别用神经网络。 本发明是在一方面有鉴于此种实际情况而完成,其目的在于提供一种方法,不会 降低学习完毕的学习器的推论精度,而能够对所述学习完毕的学习器的推论结果的合理性 进行适当评估。 解决问题的技术手段 为了解决所述问题,本发明采用以下的构成。 即,本发明的一方面的评估装置包括:数据获取部,获取对利用数据集进行了有教 学学习的学习完毕的第一学习器输入的输入数据,所述数据集包含训练数据、及表示对所 述训练数据的推论结果的正解的正解数据的对;以及合理性评估部,基于通过对利用所述 训练数据进行了无教学学习的学习完毕的第二学习器输入所述输入数据而从所述第二学 习器获得的输出,来评估在将所述输入数据输入至所述第一学习器时,能否从所述第一学 习器获得合理的输出作为对所述输入数据的推论结果。 所述构成的评估装置中,准备两个学习完毕的学习器。首先,学习完毕的第一学习 器是通过利用包含训练数据与正解数据的对的数据集来实施有教学学习而构建。训练数据 是作为推论对象的数据,正解数据是表示对训练数据的推论结果的正解的数据。有教学学 习是如下所述的机器学习方法,即,使学习器进行学习,以使其在输入训练数据时,输出与 正解数据对应的输出值。因此,学习完毕的第一学习器被构建为,具有通过所述有教学学习 来进行规定推论的能力。 另一方面,学习完毕的第二学习器是通过利用第一学习器的机器学习时所利用的 训练数据来实施无教学学习而构建。无教学学习不同于有教学学习,是不使用正解数据而 导出训练数据的结构、法则、倾向、分类等统计性特征的机器学习方法,且是如下所述的机 器学习方法,即,使学习器进行学习,以使其在输入训练数据时,输出与训练数据的统计性 特征的识别结果对应的输出值。学习完毕的第二学习器被构建为,具有通过所述无教学学 习来识别对象数据是否类似于训练数据的能力。 并且,所述构成的评估装置中,使用学习完毕的第二学习器,来评估学习完毕的第 一学习器的推论结果的合理性。即,所述构成的评估装置获取对学习完毕的第一学习器输 入的输入数据,将所获取的输入数据输入至学习完毕的第二学习器。如上所述,学习完毕的 第二学习器获得了通过无教学学习来识别输入数据是否类似于训练数据的能力。因此,所 述构成的评估装置能够基于通过将输入数据输入至第二学习器而从所述第二学习器获得 的输出,来识别输入数据是否类似于第一学习器的机器学习时所利用的训练数据。利用此 能力,所述构成的评估装置评估在将输入数据输入至第一学习器时,能否从所述第一学习 器获得合理的输出作为对所述输入数据的推论结果。 因此,根据所述构成,第一学习器及第二学习器的学习两者能够共同利用为了机 器学习所准备的训练数据,因此也可不分为第一学习器的学习所利用的数据与第二学习器 5 CN 111602137 A 说 明 书 3/36 页 的学习所利用的数据。因此,能够防止第一学习器的机器学习所利用的训练数据的数量过 少的情况。而且,根据所述构成,通过活用无教学学习的特性,能够消除有可能会给予与在 机器学习时所准备的训练数据大相径庭的种类的输入数据这一根本性原因。即,学习完毕 的第二学习器构成为,能够基于从第一学习器的学习时所利用的训练数据中导出的统计性 特征,来评估所给予的输入数据是否是与所述训练数据大相径庭的种类。因此,也可不为了 第二学习器的学习而预估对第一学习器输入的所有种类的输入数据来准备训练数据。因 而,根据所述构成,不会降低学习完毕的第一学习器的推论精度,而能够对所述学习完毕的 第一学习器的推论结果的合理性进行适当评估。 另外,“训练数据”也可被称作“学习数据”。“正解数据”也可被称作“标签(label)” 或“教学数据”。“数据集”也可被称作“训练数据集”或“学习数据集”。“学习完毕的学习器” 也可被称作“识别器”或“分类器”。 而且,“学习器”只要包含能够通过机器学习来获得对规定模式进行识别的能力的 学习模型即可。第一学习器只要包含能够利用于有教学学习的学习模型即可,例如可包含 神经网络、线性回归模型、支持向量机(support vector machine)等。另一方面,第二学习 器只要包含能够利用于无教学学习的学习模型即可,例如可包含自编码器(自动编码器)、 算出马氏距离(Mahalanobis distance)的运算模型、一类支持向量机(1-class SVM)等。 进而,第一学习器的推论种类可根据实施方式来适当选择。例如,第一学习器的推 论种类也可为图像识别、语音识别、语言分析等。根据所述推论的种类,训练数据、正解数据 及输入数据的种类可适当选择。例如,训练数据及输入数据可为图像数据、语音数据、文本 数据、数值数据等,也可为它们的组合。而且,例如,正解数据可为表示对图像数据的图像识 别的结果的数据、表示对语音数据的语音识别的结果的数据、表示对文本数据的语言分析 的结果的数据、表示对数值数据的规定的判定结果的数据等。 所述一方面的评估装置中,所述合理性评估部也可通过对从所述第二学习器获得 的输出与规定的阈值进行比较,从而判定在将所述输入数据输入至所述第一学习器时,能 否从所述第一学习器获得合理的输出作为对所述输入数据的推论结果。根据所述构成,能 够适当评估第一学习器对输入数据的推论结果的合理性。 所述一方面的评估装置中,所述合理性评估部也可输出一评估值来作为所述评估 的结果,所述评估值表示在将所述输入数据输入至所述第一学习器时,能从所述第一学习 器获得合理的输出作为对所述输入数据的推论结果的程度。根据所述构成,能够基于所输 出的评估值,来适当评估第一学习器对输入数据的推论结果的合理性。 所述一方面的评估装置也可还包括:警告部,当所述合理性评估部评估为,在将所 述输入数据输入至所述第一学习器时,从所述第一学习器得不到合理的输出作为对所述输 入数据的推论结果时,进行与通过将所述输入数据输入至所述第一学习器,从而作为对所 述输入数据的推论结果而从所述第一学习器获得的输出相关的警告。根据所述构成,能够 对用户等警告第一学习器对输入数据的推论结果的合理性低。 所述一方面的评估装置也可还包括:推论部,将所述输入数据输入至所述第一学 习器,获得来自所述第一学习器的输出,由此来对所述输入数据进行规定的推论。根据所述 构成,能够提供一种评估装置,其能对输入数据进行规定的推论,并且能评估所述推论的结 果的合理性。 6 CN 111602137 A 说 明 书 4/36 页 所述一方面的评估装置也可还包括:动作执行部,当所述合理性评估部评估为,在 将所述输入数据输入至所述第一学习器时,能从所述第一学习器获得合理的输出作为对所 述输入数据的推论结果时,基于所述推论结果来执行规定动作,且当所述合理性评估部评 估为,在将所述输入数据输入至所述第一学习器时,从所述第一学习器得不到合理的输出 作为所述输入数据的推论结果时,停止基于所述推论结果的、所述规定动作的执行。所述构 成中,当评估为第一学习器对输入数据的推论结果为合理时,基于所述推论结果来执行规 定动作,与此相对,当评估为所述推论结果不合理时,停止基于所述推论结果的、规定动作 的执行。由此,根据所述构成,能够提高基于第一学习器的推论结果的动作控制的可靠性。 另外,“停止规定动作的执行”也可包含不维持规定动作的执行的所有实施方式。即,“停止 规定动作的执行”除了完全停止规定动作以外,例如也可包含变更速度、加速度、力等规定 动作的属性。 所述一方面的评估装置中,所述输入数据也可包含能映照出坐在车辆的驾驶座上 的驾驶员的图像数据,通过将所述输入数据输入至所述第一学习器而从所述第一学习器获 得的输出也可包含表示所述驾驶员的状态的信息。根据所述构成,能够提供一种评估装置, 其对基于包含图像数据的输入数据来判定驾驶员的状态的推论的合理性进行评估。 所述一方面的评估装置也可还包括:数据发送部,当所述合理性评估部评估为,在 将所述输入数据输入至所述第一学习器时,从所述第一学习器得不到合理的输出作为对所 述输入数据的推论结果时,将所述输入数据发送到规定的存储场所。当评估为第一学习器 的推论结果的合理性低时,可预料所给予的输入数据是与第一学习器的机器学习时所利用 的训练数据大相径庭的种类。根据所述构成,能够将此种输入数据收集到规定的存储场所。 由此,能够利用所收集的输入数据来作为新的训练数据,从而能扩大可通过第一学习器来 推论的对象范围。 所述一方面的评估装置中,所述第一学习器可包含对所述输入数据进行编码的第 一编码器,所述第二学习器可包含对所述输入数据进行编码的第二编码器、及对所述第二 编码器的输出进行解码的解码器。各编码器及解码器例如可通过神经网络来构建。作为包 括编码器及解码器的第二学习器,可使用自编码器。解码器被构建为,对第二编码器的输出 进行解码,即,对输入至第二编码器的输入数据进行复原。因此,从解码器获得的输出越类 似于输入至第二编码器的输入数据,则能够识别为所述输入数据越类似于训练数据。相反 地,从解码器获得的输出越不类似于输入至第二编码器的输入数据,则能够识别为所述输 入数据越不类似于训练数据。因此,根据所述构成,能够适当评估第一学习器的推论结果的 合理性。 所述一方面的评估装置中,所述第一编码器与所述第二编码器可为同一编码器。 根据所述构成,通过在第一学习器与第二学习器之间共享编码器,能够抑制第一学习器及 第二学习器的总计算成本,且能够提高第二学习器的运算速度。 所述一方面的评估装置中,所述第一编码器构建为,当输入所述训练数据时,输出 与跟所输入的所述训练数据成对的所述正解数据对应的值,所述第二编码器与所述第一编 码器为同一编码器或者是所述第一编码器的拷贝,所述解码器可构建为,当输入所述第一 编码器的输出时,输出与要获得所输入的输出而输入至所述第一编码器的所述训练数据对 应的值。根据所述构成,通过在第一学习器与第二学习器之间共享编码器,从而能够抑制第 7 CN 111602137 A 说 明 书 5/36 页 一学习器及第二学习器的总计算成本,且能够提高第二学习器的运算速度。 另外,也可通过在所述各实施方式的评估装置中组合所述动作执行部来构建动作 控制装置。例如,本发明的一方面的动作控制装置包括:数据获取部,获取对利用数据集进 行了有教学学习的学习完毕的第一学习器输入的输入数据,所述数据集包含训练数据、及 表示对所述训练数据的推论结果的正解的正解数据的对;合理性评估部,基于通过对利用 所述训练数据进行了无教学学习的学习完毕的第二学习器输入所述输入数据而从所述第 二学习器获得的输出,来评估在将所述输入数据输入至所述第一学习器时,能否从所述第 一学习器获得合理的输出作为对所述输入数据的推论结果;以及动作执行部,当所述合理 性评估部评估为,在将所述输入数据输入至所述第一学习器时,能从所述第一学习器获得 合理的输出作为对所述输入数据的推论结果时,基于通过对所述第一学习器输入所述输入 数据并获得来自所述第一学习器的输出而对所述输入数据进行的规定的推论的结果,来对 规定动作的执行进行控制,且当所述合理性评估部评估为,在将所述输入数据输入至所述 第一学习器时,从所述第一学习器得不到合理的输出作为所述输入数据的推论结果时,进 行控制,以停止基于所述推论结果的、所述规定动作的执行。另外,执行规定动作的装置既 可为动作控制装置自身,也可为与动作控制装置不同的其他装置。在由其他装置执行规定 动作时,动作控制装置通过将其指令发送至其他装置来控制规定动作的执行。 而且,作为所述各实施方式的评估装置或动作控制装置的其他方案,也可为实现 以上的各构成的信息处理方法,也可为程序,还可为存储有此种程序的、计算机或其他装 置、机械等可读取的存储介质。此处,所谓计算机等可读取的存储介质,是指通过电、磁、光 学、机械或化学作用来保存程序等信息的介质。 例如,本发明的一方面的评估方法是一种信息处理方法,由计算机执行下述步骤: 获取对利用数据集进行了有教学学习的学习完毕的第一学习器输入的输入数据,所述数据 集包含训练数据、及表示对所述训练数据的推论结果的正解的正解数据的对;以及基于通 过对利用所述训练数据进行了无教学学习的学习完毕的第二学习器输入所述输入数据而 从所述第二学习器获得的输出,来评估在将所述输入数据输入至所述第一学习器时,能否 从所述第一学习器获得合理的输出作为对所述输入数据的推论结果。 而且,例如,本发明的一方面的评估程序用于使计算机执行下述步骤:获取对利用 数据集进行了有教学学习的学习完毕的第一学习器输入的输入数据,所述数据集包含训练 数据、及表示对所述训练数据的推论结果的正解的正解数据的对;以及基于通过对利用所 述训练数据进行了无教学学习的学习完毕的第二学习器输入所述输入数据而从所述第二 学习器获得的输出,来评估在将所述输入数据输入至所述第一学习器时,能否从所述第一 学习器获得合理的输出作为对所述输入数据的推论结果。 发明的效果 根据本发明,不会降低学习完毕的学习器的推论精度,而能够对所述学习完毕的 学习器的推论结果的合理性进行适当评估。 附图说明 图1示意性地例示本发明的基本构成的一例。 图2示意性地例示适用本发明的场景的一例。 8 CN 111602137 A 说 明 书 6/36 页 图3示意性地例示实施方式的汽车驾驶支持装置的硬件构成的一例。 图4示意性地例示实施方式的学习装置的硬件构成的一例。 图5示意性地例示实施方式的汽车驾驶支持装置的软件构成的一例。 图6A示意性地例示实施方式的注视状态信息的一例。 图6B示意性地例示实施方式的顺应性信息的一例。 图7A示意性地例示实施方式的神经网络的构成的一例。 图7B示意性地例示实施方式的自编码器的解码器的构成的一例。 图8示意性地例示实施方式的学习装置的软件构成的一例。 图9A示意性地例示通过实施方式的学习装置进行的神经网络的机器学习过程的 一例。 图9B示意性地例示通过实施方式的学习装置进行的自编码器的解码器的机器学 习过程的一例。 图10A例示实施方式的自动驾驶支持装置的处理流程的一例。 图10B例示实施方式的自动驾驶支持装置的处理流程的一例。 图11例示实施方式的学习装置的处理流程的一例。 图12示意性地例示适用本发明的其他场景的一例。 图13示意性地例示另一实施方式的诊断装置的软件构成的一例。 图14示意性地例示另一实施方式的学习装置的软件构成的一例。 图15示意性地例示适用本发明的其他场景的一例。 图16示意性地例示另一实施方式的预测装置的软件构成的一例。 图17示意性地例示另一实施方式的学习装置的软件构成的一例。 图18例示另一实施方式的自动驾驶支持装置的处理流程的一例。