logo好方法网

数据标注方法、设备及装置


技术摘要:
本公开涉及一种数据标注方法、设备及装置。所述方法包括:基于通用深度特征模型,获取所述待标注数据的通用特征以及预分类结果;根据所述预分类结果和特殊深度特征模型,提取所述待标注数据的特殊特征;对所述通用特征和所述特殊特征进行融合计算,获取融合特征信息;  全部
背景技术:
现在数据标注基本是通过人工标注的方式进行,例如智能驾驶数据标注一般为人 工标注,而智能驾驶每车每天产生的数据很大,导致所述智能驾驶数据标注的人工成本非 常高。并且人工标注方式误差率也比较高,目前有些数据标注公司会外聘兼职人员进行数 据标注,使得数据标注的误差率更高,为了控制误差率在一定范围,需要额外的审核人员进 行审核,进一步提高了数据标注的人工成本。 现在虽然有开源的图像识别数据库,例如ImageNet,可以免去人工标注过程,但是 存在诸多缺点,例如标注框太大、标注方式少、准确率不高等,难以满足智能驾驶领域对图 像识别的准确化和精细化的要求。 综上,面对数据的骤增,如何有效降低人工数据标注工作量,并提高数据标注的精 确度,是当前需要突破的一个重大课题。
技术实现要素:
有鉴于此,本公开提出了一种数据标注方法、设备及装置。 根据本公开的一方面,提供了一种数据标注方法,所述方法包括: 基于通用深度特征模型,获取所述待标注数据的通用特征以及预分类结果; 根据所述预分类结果和特殊深度特征模型,提取所述待标注数据的特殊特征; 对所述通用特征和所述特殊特征进行融合计算,获取融合特征信息; 根据所述融合特征信息以及所述特殊深度特征模型,获取分类标注预测结果; 根据所述分类标注预测结果,为所述待标注数据进行标注。 根据本公开的另一方面,提供了一种数据标注设备,所述数据标注设备包括: 通用特征及预分类结果获取模块,用于基于通用深度特征模型,获取所述待标注 数据的通用特征以及预分类结果; 特殊特征提取模块,用于根据所述预分类结果和特殊深度特征模型,提取所述待 标注数据的特殊特征; 特征融合模块,用于对所述通用特征和所述特殊特征进行融合计算,获取融合特 征信息; 分类标注预测结果获取模块,用于根据所述融合特征信息以及所述特殊深度特征 模型,获取分类标注预测结果; 数据标注模块,用于根据所述分类标注预测结果,为所述待标注数据进行标注。 根据本公开的另一方面,提供了一种数据标注装置,包括:处理器;用于存储处理 器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。 根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有 4 CN 111598120 A 说 明 书 2/11 页 计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。 通过基于通用深度特征模型,提取所述待标注数据的通用特征,以及基于特殊深 度特征模型提取所述待标注数据的特殊特征,利用本公开一实施例的数据标注方法、设备 及装置,可以实现数据标注的自动化,并且能够避免人工标注的高错误率,从而在保证数据 标注质量的前提下,极大降低了数据标注成本,并极大提高了数据标注效率。 并且,利用所述特殊深度特征模型提取特殊特征以用于数据标注,由于所述特殊 特征针对更加精细类别的特征,使得标注能够更加精细化,基于这样精细化标注的数据进 行数据识别,也可以实现数据识别的精细化。例如在智能驾驶领域,基于这样精细化标注的 智能驾驶环境感知数据,在识别时,可以对交通参与实体的识别更加精细化,有效助力智能 驾驶进行决策,降低交通事故发生概率。 根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得 清楚。 附图说明 包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的 示例性实施例、特征和方面,并且用于解释本公开的原理。 图1示出根据本公开一实施例的数据标注方法的流程图。 图2示出根据本公开一实施例的数据标注方法的流程示意图。 图3示出根据本公开一实施例的根据所述预分类结果和特殊深度特征模型,提取 所述待标注数据的特殊特征的方法流程图。 图4示出根据本公开一实施例的数据标注方法的流程图。 图5示出根据本公开一实施例的数据标注方法的流程图。 图6示出根据本公开一实施例的根据所述通用样本数据集和谱聚类算法,获取特 殊样本数据集的方法流程图。 图7示出根据本公开一实施例的对所述通用样本数据集进行预分类,获取样本分 类预测结果的方法流程图。 图8示出根据本公开一实施例的根据所述样本分类预测结果、所述通用样本数据 集以及所述谱聚类算法,获取特殊样本数据集的方法流程图。 图9示出根据本公开一实施例的数据标注设备的结构框图。 图10示出根据一示例性实施例示出的一种数据标注装置1900的框图。
分享到:
收藏