logo好方法网

一种基于NIR光谱的忧遁草种源地分类模型的构建方法及应用


技术摘要:
本发明涉及中药材鉴别技术领域,具体公开了一种基于NIR光谱的忧遁草种源地分类模型的构建方法及应用。所述的基于NIR光谱的忧遁草种源地分类模型的构建方法,其特征在于,包含如下步骤:采集不同种源地的忧遁草样品的近红外光谱;对近红外光谱数据进行预处理;将预处理  全部
背景技术:
忧遁草(Clinacanthus  nutans),别名鳄嘴花、沙巴蛇草等,在分类上属于爵床科 (Acanthaceae)鳄嘴花属植物,主要产于中国南部至西南部地区以及马来西亚、印度尼西 亚、泰国等国家。作为传统药物,忧遁草在治疗皮疹、昆虫和蛇咬伤、单纯疱疹病毒引起的病 变、糖尿病和痛风等疾病中广泛使用。 不同种源地忧遁草成分会有较大的差异,因此对忧遁草的种源地进行准确判断对 其相关的中药和保健食品选材、产品质量标准的建立具有重要的科学意义和应用价值。目 前有关忧遁草种源地的鉴别主要是基于检测忧遁草成分的高效液相色谱法(HPLC)及气相 色谱-质谱联用(GC-MS)法等,但这些方法由于设备昂贵、操作过程繁琐、需要化学试剂等限 制了其普及推广。因此,建立一种快速、简单且绿色的忧遁草的源地鉴别方法具有重要意义 及应用价值。近红外光谱(NIR)主要反映了X-H官能团(例如C-H,O-H和N-H)的倍频、合频的 振动吸收,不仅能提供丰富的定性和定量信息,而且具有快速、简单、无需化学试剂等特点, 这种快速,简单的技术现已在农业、食品、医药等领域获得应用。对比文件1(Zhang  Ning , Zhang  Dequan,Li  Shurong,Li  Qingpeng.Preliminary  study  on  origin  traceability  of  mutton  by  near  infrared  reflectance  spectroscopy  coupled  with  SIMCA  method.T  ransactions  of  the  Chinese  Society  of  Agricultural  Engineering,2008, 24:309-315.)利用NIR光谱结合化学计量学方法对中国山东、河北、宁夏和内蒙古四个省份 的羊肉进行产地溯源,结果表明四种模型定标的识别率准确率均高于90%,说明NIR技术是 追溯羊肉原产地的一种可行方法。对比文件2(C.Herrero  Latorre ,R .M . Crecente , S.García  Martín,J.Barciela  García .A  fast  chemometric  procedure  based  on  NIR  data  for  authentication  of  honey  with  protected  geographical  indication.Food  Chemistry,2013,141:3559-3565.)基于NIR光谱结合模式识别技术对不同来源的蜂蜜样品 进行鉴别,开发了一种单一而快速的食品认证系统来区分真正的PGI-加利西亚蜂蜜样品与 其他来源的商用蜂蜜样品。 忧遁草中含有不同X-H官能团,在NIR区域具有显著吸收,但利用NIR光谱结合化学 计量学方法对忧遁草进行产地溯源的研究鲜有报道。因此,基于NIR光谱结合化学计量学方 法,建立一个分类准确率高的忧遁草种源地分类模型;采用该模型用来进行忧遁草种源地 分类鉴别,对于实现无损、快速、简单且绿色地鉴别忧遁草的源地具有重要的意义。
技术实现要素:
为了克服现有技术中缺乏利用NIR光谱对忧遁草进行产地溯源的研究,本发明提 3 CN 111595802 A 说 明 书 2/6 页 供了一种基于NIR光谱的忧遁草种源地分类模型的构建方法。应用该方法构建得到的忧遁 草种源地分类模型可以实现快速、简单且绿色的鉴别忧遁草的源地。 本发明的技术方案如下: 一种基于NIR光谱的忧遁草种源地分类模型的构建方法,其包含如下步骤: 采集不同种源地的忧遁草样品的近红外光谱(NIR); 对近红外光谱(NIR)数据进行预处理; 将预处理后的红外光谱(NIR)数据采用SVM算法进行建模分析得忧遁草种源地分 类模型。 本发明首次提供了一种基于NIR光谱的忧遁草种源地分类模型的构建方法,应用 该方法构建得到的忧遁草种源地分类模型可以实现快速、简单且绿色的鉴别忧遁草的源 地。 优选地,近红外光谱(NIR)的范围为400~2500nm。 优选地,所述不同种源地的忧遁草样品是指马来西亚、海南和广西三个种源地的 忧遁草样品。 优选地,对近红外光谱(NIR)数据进行预处理是指对近红外光谱(NIR)数据进行一 阶导数预处理。 近红外光谱数据的预处理是提高预测精度和准确率的重要因素,获取的光谱中除 了含有待测样品的原始信息外,还包含各种外在的干扰信息,这些噪声信息会导致测得的 数值和真实值之间存在一定差异。为尽可能消除误差,必须运用各种数据处理方法来减弱 各种干扰因素的影响,为下一步的数据处理奠定基础。然而近红外光谱数据的预处理方法 具有多种,如可以采用多元散射校正(MSC)、标准正态变量变换(SNV)、一阶导数、二阶导数 等方法对光谱数据进行预处理。发明人经大量的研究表明,本发明忧遁草近红外光谱数据 采用一阶导数进行预处理后得到的忧遁草种源地分类模型具有最佳的训练集准确率和预 测集准确率。 优选地,SVM算法中的核函数选用高斯核函数(RBF)。 SVM算法的核函数影响着训练准确率以及预测准确率,研究表明核函数参数选择 高斯核函数(RBF)所建立的模型具有良好的学习能力,以及具有较好的训练准确率以及预 测准确率。 进一步优选地,进一步对高斯核函数(RBF)的参数进行优化。 更优选地,进一步对高斯核函数(RBF)的惩罚参数c和核函数参数g进行优化。 进一步研究表明,对高斯核函数(RBF)的惩罚参数c和核函数参数g进行优化可以 进一步提高训练准确率以及预测准确率。 优选地,采用PSO寻优算法对对高斯核函数(RBF)的参数进行优化。 进一步优选地,惩罚参数c=0.8343和核函数参数g=57.8741。 同样地,高斯核函数(RBF)参数优化的方法具有多种;比如有网格搜索法(Grid  Search ,GS)、遗传算法(Genetic  Algorithm ,GA)和粒子群优化算法(Particle  Swarm  Optimization,PSO)。研究表明,当采用PSO法对高斯核函数(RBF)的惩罚参数c和核函数参 数g进行优化,当对应的惩罚参数c=0.8343,核函数参数g=57.8741时,训练集准确率可达 96.36%(60/61),预测集准确率可达95.00%(19/20)。 4 CN 111595802 A 说 明 书 3/6 页 本发明还提供一种上述基于NIR光谱的忧遁草种源地分类模型的构建方法构建得 到的忧遁草种源地分类模型在忧遁草种源地分类鉴别中的应用。应用该方法构建得到的忧 遁草种源地分类模型可以实现无损、快速、简单且绿色的鉴别忧遁草的源地。 有益效果:本发明首次提供了一种基于NIR光谱的忧遁草种源地分类模型的构建 方法。在本发明实施例中,本发明将81个分别来自马来西亚、中国海南、中国广西三个地方 的忧遁草样品划分训练集和预测集;以训练集为对象,采用本发明所述的构建方法构建了 基于NIR光谱的忧遁草种源地分类模型;并以预测集检验该模型;结果显示该模型具有较高 的训练准确率以及预测准确率;这说明该构建方法能够准确的构建了忧遁草种源地分类模 型,实现了很好的分类效果;采用该忧遁草种源地分类模型可以准确的进行忧遁草种源地 分类。 附图说明 图1为忧遁草的NIR光谱图。 图2为忧遁草样品的预处理光谱图;其中图2(a)为采用MSC预处理光谱图,2(b)为 采用SNV预处理光谱图,2(c)为采用一阶导数预处理光谱图,2(d)为采用二阶导数预处理光 谱图。 图3为参数寻优过程及交互验证结果图;其中图3(a)为GS寻优结果的三维显示图, 3(b)为GS参数寻优结果的等高线图,3(c)为GA寻优结果图,3(d)为PSO的寻优结果图。
分享到:
收藏