logo好方法网

一种基于饮食习惯预测糖尿病的模型构建方法和系统


技术摘要:
本发明涉及一种基于饮食习惯预测糖尿病的模型构建方法,包括如下步骤:获取包括样本多日餐食的食材信息的第一样本集;抽取所述第一样本集中的若干个数据,将该数据作为特征组成第二样本集;将所述第二样本集划分为训练集、验证集,将所述训练集作为决策树模型器的输入;  全部
背景技术:
目前,糖尿病诊断标准由世界卫生组织统一制定,与人群、年龄、性别无关系,以血 糖(空腹血糖、任意时间血糖或葡萄糖耐量实验)作为唯一的诊断标准。研究表明,血糖数值 偏高是诊断糖尿病的重要标准,但是绝对不是唯一标准。糖尿病不仅仅是血糖偏高的问题, 还有一个血糖去向的问题,其实在代谢的过程中,血糖变成了脂肪。因此希望所有的糖尿病 患者必须严格控制血糖和血脂,并积极采取科学的方法治疗,避免危害的发生。 随着人们生活水平的不断提高和生活方式的改变,糖尿病患病率呈上升趋势。糖 尿病是以血葡萄糖水平慢性增高为特征的代谢疾病群。人体的餐后血糖反应(PGR)受到多 种因素的影响,对于单一食物,其餐后血糖反应与食物成分、血糖指数(GI)和血糖负荷(GL) 值之间显著相关;但对于混合膳食,食物成分与餐后血糖之间无显著相关性,而与GL和GI值 之间存在一定的联系。其次,食物中的蛋白质和脂肪对血糖也有一定的影响。它们对血糖影 响的大小依次为:GL>蛋白质>脂肪。
技术实现要素:
本发明针对现有技术中存在的技术问题,提供一种基于饮食习惯预测糖尿病的模 型构建方法。 本发明解决上述技术问题的技术方案如下:一种基于饮食习惯预测糖尿病的模型 构建方法,包括如下步骤:获取包括样本多日餐食的食材信息的第一样本集;抽取所述第一 样本集中的若干个数据,将该数据作为特征组成第二样本集;将所述第二样本集划分为训 练集、验证集,将所述训练集作为决策树模型器的输入;训练所述决策树模型,直至特征的 信息增益低于阈值,得到决策树模型。 在发明的一些实施例中,所述第一样本集还包括样本人群的年龄、性别、体重、身 高、糖尿病既往史、过敏史。 在发明的一些实施例中,根据所述第一样本集中的每个样本的年龄、性别、多日餐 食的食材信息计算出营养素摄入量情况,将所述营养素摄入情况作为第二数据集的特征。 在发明的一些实施例中,所述营养素包括蛋白质、脂肪、葡萄糖。 在发明的一些实施例中,所述第二样本集的特征包括年龄、血糖负荷、脂肪、蛋白 质、肥胖、糖尿病遗传史。 在发明的一些实施例中,将血糖负荷作为所述决策树模型的根节点。 本发明另一方面提供了一种基于饮食习惯预测糖尿病的的系统,包括获取模块、 匹配模块、计算模块、决策树模型,所述获取模块用于获取用户的年龄、性别、体重、身高、糖 尿病既往史、过敏史、多日餐食的食材信息;所述匹配模块用于根据用户的性别和年龄对营 3 CN 111599477 A 说 明 书 2/6 页 养素每日摄入量及营养素含量检索;所述计算模块用于对匹配模块检索到的营养素含量进 行加权计算,并与每日摄入量进行比对,得出营养素摄入量特征;所述决策树模型根据营养 素摄入量特征预测用户患糖尿病的概率。 在发明的一些实施例中,所述决策树模型包括上述基于饮食习惯预测痛风的模型 构建方法所构建的模型。 在发明的一些实施例中,所述营养素为葡萄糖、脂肪、蛋白质。 在发明的一些实施例中,所述决策树模型通过随机森林树进行优化。 本发明的有益效果是:针对糖尿病的主要诱因进行分析,实时监控和评估用户的 饮食行为,耗费资源较少,运用食材中的营养素含量累计加权及决策树(ID3)算法,让用户 可以快速方便的了解自身营养素的摄入情况及预测糖尿病风险指数,加快疾病推测速度, 提高了用户体验。 通过记录或获取多日饮食行为数据,分析出每日血糖负荷(GL)、蛋白质、脂肪摄入 情况,并进行统计,分析出人体需要量与供给量是否建立平衡关系。如果这种平衡关系失 调,就会增加患糖尿病的风险。利用一定时间段内血糖负荷(GL)、蛋白质、脂肪的摄入情况 对糖尿病进行风险指数评估。 附图说明 图1为本发明的一些实施例中基于饮食习惯预测糖尿病的模型构建方法图基本流 程图; 图2为本发明一些实施例中基于饮食习惯预测糖尿病的系统结构原理图; 图3为本发明的一些实施例中第二样本集中的部分样本示例; 图4为本发明的一些实施例中的决策树模型; 图5a和图5b为参考的按每种食物100克计的常见食物成分表。
分享到:
收藏