
技术摘要:
本发明公开了一种基于报告单的数据编码模型生成方法,包括:初始化预先构建的初始训练模型中的网络参数;初始训练模型包括编码器和解码器,网络参数包括编码器参数和解码器参数;根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代;计算预设损失函数的损失值 全部
背景技术:
目前对应医疗检测报告单的结果分析主要针对某类报告单中的检测项目进行结 果值的分析,检测的结果值跟统计的参考值进行对比,得到最终的报告单结果。报告单的大 部分结果值经过大量试验和病人治疗期间的临床表现得到佐证,但检测报告单的结果值仍 然还有很大的研究和挖掘的空间。在某特定的时间点上,同时通过多种检测方法对受检者 进行检测,不仅可以提供检测结果的准确性,而且可以更加全面的了解生物体目前的状态, 为临床治疗提供更加详细的病人身体数据。但随着检测项目和累计的报告单的数量的增 多,带来的挑战也越来越大。主要原因是人的生物状态信息通过检测结果被投射到了一个 高维的数据空间中,通过传统的统计学方法分析检测项目之间和临床表现之间的相关性变 的越来越难,对于检测项目的特征工程效率低下,导致整个检测项目数据分析的过程漫长 且昂贵,因此,亟待一个数据编码模型能够对检测项目数据进行编码,以提取检测报告的数 据特征。
技术实现要素:
本发明实施例的目的是提供一种基于报告单的数据编码模型生成方法、系统、设 备和存储介质,生成的数据编码模型能够学习到非线性的特征表示,有利于后续任务算法 的效果的提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。 为实现上述目的,本发明实施例提供了一种基于报告单的数据编码模型生成方 法,包括: 初始化预先构建的初始训练模型中的网络参数;其中,所述初始训练模型包括编 码器和解码器,所述网络参数包括编码器参数和解码器参数; 根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代; 计算预设损失函数的损失值; 通过反向传播算法将所述损失值用于修正所述网络参数; 根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代; 对所述初始训练模型进行拆分,以在所述初始训练模型拆分出所述编码器作为数 据编码模型。 与现有技术相比,本发明实施例公开的基于报告单的数据编码模型生成方法,首 先,初始化预先构建的初始训练模型中的网络参数;然后,根据第一预设循环次数使得所述 初始训练模型进入一次循坏迭代,利用所述初始训练模型计算预设损失函数的损失值,通 过反向传播算法将所述损失值用于修正所述网络参数,根据第二预设循环次数使得所述初 始训练模型进入二次循坏迭代;最后,对所述初始训练模型进行拆分,在所述初始训练模型 4 CN 111599431 A 说 明 书 2/11 页 拆分出所述编码器作为数据编码模型。本发明实施例所述的基于报告单的数据编码模型生 成方法生成的数据编码模型能够学习到非线性的特征表示,有利于后续任务算法的效果的 提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。 作为上述方案的改进,所述编码器用于输入预先对报告单中的数据进行编码后的 结果清单数据,以输出所述结果清单数据的均值和方差;其中,所述报告单中的数据包括检 测项目的名义变量和检测结果数据,所述名义变量包括所述检测项目的单位、所采用的试 剂名称、在检测过程中所用到的检测设备名称中的至少一种。 作为上述方案的改进,所述计算预设损失函数的损失值,具体包括: 在预设的标准正态分布中采样一组随机数; 将所述均值和所述方差分别与所述随机数相加,得到潜变量; 将所述潜变量输入到所述解码器中,通过预设损失函数计算损失值。 作为上述方案的改进,所述解码器用于输入所述潜变量,以输出再生成的结果清 单数据。 作为上述方案的改进,所述方法还包括: 使用随机梯度下降算法对所述初始训练模型进行网络参数调整。 为实现上述目的,本发明实施例还提供了一种基于报告单的数据编码模型生成系 统,包括: 网络参数初始化模块,用于初始化预先构建的初始训练模型中的网络参数;其中, 所述初始训练模型包括编码器和解码器,所述网络参数包括编码器参数和解码器参数; 一次循坏迭代模块,用于根据第一预设循环次数使得所述初始训练模型进入一次 循坏迭代; 损失值计算模块,用于计算预设损失函数的损失值; 网络参数修正模块,用于通过反向传播算法将所述损失值用于修正所述网络参 数; 二次循坏迭代模块,用于根据第二预设循环次数使得所述初始训练模型进入二次 循坏迭代; 数据编码模型生成模块,用于对所述初始训练模型进行拆分,以在所述初始训练 模型拆分出所述编码器作为数据编码模型。 与现有技术相比,本发明实施例公开的基于报告单的数据编码模型生成系统,首 先,网络参数初始化模块初始化预先构建的初始训练模型中的网络参数;然后,一次循坏迭 代模块根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代,损失值计算模块 计算预设损失函数的损失值,网络参数修正模块通过反向传播算法将所述损失值用于修正 所述网络参数,二次循坏迭代模块根据第二预设循环次数使得所述初始训练模型进入二次 循坏迭代;最后,数据编码模型生成模块对所述初始训练模型进行拆分,在所述初始训练模 型拆分出所述编码器作为数据编码模型。本发明实施例所述的基于报告单的数据编码模型 生成系统生成的数据编码模型能够学习到非线性的特征表示,有利于后续报告单任务算法 的效果的提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。 作为上述方案的改进,所述编码器用于输入预先对中的数据进行编码后的结果清 单数据,以输出所述结果清单数据的均值和方差;其中,所述报告单中的数据包括检测项目 5 CN 111599431 A 说 明 书 3/11 页 的名义变量和检测结果数据,所述名义变量包括所述检测项目的单位、所采用的试剂名称、 在检测过程中所用到的检测设备名称中的至少一种。 作为上述方案的改进,所述损失值计算模块,具体用于: 在预设的标准正态分布中采样一组随机数; 将所述均值和所述方差分别与所述随机数相加,得到潜变量; 将所述潜变量输入到所述解码器中,通过预设损失函数计算损失值。 为实现上述目的,本发明实施例还提供一种基于报告单的数据编码模型生成设 备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机 程序,所述处理器执行所述计算机程序时实现如上述任一实施例所述的基于报告单的数据 编码模型生成方法 为实现上述目的,本发明实施例还提供一种计算机可读存储介质,所述计算机可 读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读 存储介质所在设备执行如上述任一实施例所述的基于报告单的数据编码模型生成方法。 附图说明 图1是本发明实施例提供的一种基于报告单的数据编码模型生成方法的流程图; 图2是本发明实施例提供变分自编码器的主体框架示意图; 图3是本发明实施例提供的初始训练模型的结构框图; 图4是本发明实施例提供的一种基于报告单的数据编码模型生成系统的结构框 图; 图5是本发明实施例提供的一种基于报告单的数据编码模型生成设备的结构框 图。