
技术摘要:
本发明公开了一种基于K均值和支持向量机的护林员巡护情况的综合分析方法,包括:(1)采集护林员巡护情况数据并进行标准化处理,获得处理后的数据集;(2)对数据集进行K均值聚类,根据最优聚类簇数K划分评价等级,依据聚类结果和评价等级对护林员巡护情况数据进行等级评价 全部
背景技术:
在农林业数字化、信息化高速发展的时代,基层护林员的评价分析方法却十分缺 乏,而已有的评价体系不结合实际数据,评价不客观、不科学、不准确,进而护林员管理者无 法根据正确数据规划公平的工资分配方案、制定合理的激励措施、做出正确的决策,最终导 致护林员毫无工作激情、工作效果较差,难以达到巡查、护林的目标,使得森林管护工作丢 失了一层重要屏障。 传统的人员绩效评价方法主要有360度多源反馈法、模糊层次分析法、平衡记分卡 法等。文章Destephano C C ,Crawford K A ,Jashi M ,et al .Providing 360-Degree Multisource Feedback to Nurse Educators in the Country of Georgia:A Formative Evaluation of Acceptability[J] .The Journal of Continuing Education in Nursing,2014,45(6):1-7.运用360度多源反馈法综合自我、视频、学习者、同伴和项目协调 员五个来源的反馈对格鲁吉亚护士教育者教育效果进行评价,该方法需收集各来源的评价 反馈并进行整合,费时费力,且每个来源的反馈存在一定的主观性。文章Chen J F,Hsieh H N,Do Q H.Evaluating teaching performance based on fuzzy AHP and comprehensive evaluation approach[J].Applied Soft Computing Journal,2015,28(C):100-108.采用 模糊层次分析法通过6个主要指标以及其下的14个子指标对员工绩效进行评价,该方法评 价指标过多且模型与计算较复杂,且存在一定的主观性。 根据两种主要的人员绩效评价方法的特点可以发现较适合于事业单位、企业工厂 等环境下的员工绩效评价,但并不适合护林员巡护评价。因为护林员的工作性质特殊,难以 产生、收集多维评价指标;护林员文化水平有限,过多的指标、复杂的计算和模型难以令其 理解和接受。
技术实现要素:
本发明的目的是提供一种基于K均值和支持向量机的护林员巡护情况的综合分析 方法。该综合分析方法获得的分析结果客观、准确,为护林员管理者提供有效决策依据,进 而提高护林员的巡护效果。 为实现上述发明目的,本发明提供以下技术方案: 一种基于K均值和支持向量机的护林员巡护情况的综合分析方法,包括以下步骤: (1)采集护林员巡护情况数据,对所述护林员巡护情况数据进行标准化处理,获得 处理后的数据集; (2)对所述数据集中的护林员巡护情况数据进行K均值聚类,根据最优聚类簇数K 划分评价等级,依据聚类结果和评价等级对护林员巡护情况数据进行等级评价,并将该评 3 CN 111553580 A 说 明 书 2/6 页 价等级作为护林员巡护情况数据的数据标签,构建训练数据集; (3)利用训练数据集优化用于预测护林员巡护情况数据的评价等级的支持向量机 的模型参数,获得最优支持向量机模型; (4)将待评价护林员巡护情况数据输入至最优支持向量机模型,经预测获得待评 价护林员巡护情况数据的评价等级结果。 其中,所述护林员巡护情况数据包括护林员序号、里程数、考勤率、耗时数、上报事 件数。其中上报事件数为上报火情、病虫害、砍伐等事件的总计。由于里程数和考勤率是最 直接、最直观反应巡护情况的指标,所以作为主要评价指标,对应层级I的评价指标;耗时数 和上报事件数作为细分评价指标,对应层级II的评价指标。 在一个实施方式中,选择里程数、考勤率作为层级I的等级评价数据,即以里程数、 考勤率作为护林员巡护情况数据,采用上述步骤(1)~步骤(4)进行层级I的等级评价。 在另外一个实施方式中,选择耗时数和/或上报事件数作为层级II的等级评价数 据,即针对层级I的某一评价等级对应的耗时数和/或上报事件数作为护林员巡护情况数 据,采用上述步骤(1)~步骤(2)进行层级II的等级评价。 在另外一个实施方式中,在获得评价等级结果的基础上,以月份为单位,分析统计 护林员巡护评价等级的分布以及变化情况。 在另外一个实施方式中,在获得评价等级结果的基础上,以护林员为单位,分析统 计单个护林员每个月/年巡护评价等级的分布以及变化情况。 优选地,对所述护林员巡护情况数据进行零均值标准化处理,获得处理后的数据 集。 优选地,在对护林员巡护情况数据进行K均值聚类时,采用聚类评价指标S_Dbw确 定使S_Dbw值最小的聚类簇数K作为最优聚类簇数K。 优选地,在优化支持向量机的模型参数时,采用10折交叉验证法评估支持向量机 并确定支持向量机的最优模型参数。 与现有技术相比,本发明具有的有益效果为: 本发明提供的基于K均值和支持向量机相结合的护林员巡护情况的综合分析方 法。先使用Kmeans得到基准月护林员巡护情况的评价等级,再使用SVM得到其他月份护林员 巡护情况评价等级,最后对得到的结果进行综合分析。该方法不仅可以通过Kmeans和SVM两 种算法得到客观、准确、科学的护林员巡护情况评价等级,还可以在此基础之上直接分析整 体或单个护林员的巡护情况,为护林员管理者提供决策支持,另外模型构造简单、效率高、 自动化且伴随大量可视化结果,易于护林员理解与接受。以期最终可以提升护林员的积极 性和工作质量,构建一层坚固的森林保护屏障。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根 据这些附图获得其他附图。 图1是于K均值和支持向量机相结合的护林员巡护情况的综合分析方法的流程图; 4 CN 111553580 A 说 明 书 3/6 页 图2是评价等级划定法的步骤示意图; 图3a和图3b是评价等级划定法前后的2019年10月护林员巡护情况聚类结果; 图4是护林员巡护情况评价等级预测结果,其中,4a~4d分别为4个月份的护林员 巡护情况评价等级预测结果; 图5是二次聚类划定细分评价等级的步骤示意图; 图6是以耗时数为特征对2019年10月护林员巡护情况数据的二次聚类结果,其中, 6a为2019年10月护林员巡护情况数据的聚类结果(里程数-耗时数),6b为2019年10月一般 评价等级护林员巡护数据二次聚类结果; 图7是2018年11月-2019年10月护林员总体巡护情况比较图,其中,7a~7e分别为 差等级、较差等级、一般等级、较好等级以及好等级五个等级的2018年11月-2019年10月护 林员总体巡护情况比较图; 图8是2018年1月-2019年10月a78号、a175、a227号、a346号护林员巡护情况评价等 级。