
技术摘要:
本发明提供了一种视频采集方法。获取用户的检索词,确定所述检索词的同义词集合;根据所述同义词集合构建检索视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合;根据所述同义词集合在所述视频集合中对应内容出现的特征,通过预设的特征 全部
背景技术:
目前,短视频行业兴盛,因为短视频的制作需要大量素材。然而,各个公司还是通 过普通的视频下载和花费资金购买来完成视频数据的检索和收集,这使得成本大量增加。 而且在视频的获取上效率极低很难获取到自己的意向视频。
技术实现要素:
本发明提供一种视频采集方法。用以解决视频采集困难的的情况。 一种视频采集方法,其特征在于,包括: 获取用户的检索词,确定所述检索词的同义词集合; 根据所述同义词集合构建视频的约束模型,根据所述约束模型检索并获取与所述 同义词集合对应的检索视频集合; 获取所述同义词集合中同义词在所述检索视频集合中对应内容的特征,并通过预 设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。 作为本发明的一种实施例:所述获取用户的检索词,确定所述检索词的同义词集 合,包括: 获取检索词; 根据词典获取所述检索词的第一同义词集合A={a1,a2……ax}; 根据网页标签获取所述检索词的第二同义词集合B={b1,b2……by}; 根据文本关系获取所述检索词的第三同义词集合C={c1,c2……cz}; 对所述第一同义词集合A、第二同义词集合B和第三同义词集合C进行相同项分析, 得到相同项集合S(A,B,C): 其中,所述ax表示所述第一同义词集合A中的第x项;所述by表示所述第二同义词集 合B中的第y项;所述cz表示所述第一同义词集合C中的第z项;所述x=1,2,3……x;所述y= 1,2,3……y;所述z=1,2,3,……z; 根据所述相同项集合S(A,B,C),确定所述同义词集合。 作为本发明的一种实施例:所述根据所述同义词集合构建视频的约束模型,包括: 步骤1:通过所述同义词集合与所述检索词的距离D: D=(G-si)P-1(G-si); 其中,所述G表示所述检索词;所述P-1为所述同义词集合的协方差矩阵,所述si表 示所述同义词集合的第i个同义词; 步骤2:构建所述同义词集合的线性回归方程; 5 CN 111597386 A 说 明 书 2/9 页 其中,所述ξ为所述同义词集合内积;所述 表示所述同义词集合的均值; 步骤3:根据所述距离D合线性回归方程确定所述视频的约束模型F: 其中,所述kj表示检索视频集合的第j个视频;所述 表示检索视频集合的均值;所 述β表示所述检索视频集合的误差系数。 作为本发明的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合 对应的检索视频集合,包括: 根据所述同义词集合在任意视频检索网站获取第一检索视频集合; 确定所述第一检索视频集合的均值; 根据所述均值,将所述检索视频集合中检索的视频的参数导入所述约束模型,得 到约束值; 获取所述约束值中的正值和与所述正值对应的视频,确定所述检索视频合集。 作为本发明的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合 对应的检索视频集合,还包括: 根据所述同义词集合在任意视频检索网站检索视频; 获取所述检索视频的链接地址; 根据所述链接地址,确定所述链接地址对应的视频网页; 当所述链接地址没有对应的视频网页时,删除所述链接地址; 对所述视频网页中的视频进行触发,响应对所述视频网页触发行为,当所述视频 网页的触发行为具有响应时,获取所述视频网页的视频,构成所述检索视频集合; 当所述视频网页的触发行为没有有响应时,判断所述视频网页为无效网页。 作为本发明的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合 对应的检索视频集合,还包括: 获取所述检索视频的网络传输协议; 根据所述网络传输协议判断所述检索视频的获取方式; 根据所述检索视频的获取方式,获取对应的视频加载工具; 根据所述加载工具,获取所述检索视频集合。 作为本发明的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合 对应的检索视频集合,还包括: 获取检索视频对应的视频网页; 判断所述视频网页异常弹窗的次数; 根据所述异常弹窗的次数,判断所述视频网页是否异常网页; 当所述视频网页为异常网页时,删除所述视频网页; 当所述视频网页为正常网页时,获取所述视频网页的视频,构成检索视频集合。 作为本发明的一种实施例:所述获取所述同义词集合的同义词在所述视频集合中 6 CN 111597386 A 说 明 书 3/9 页 对应内容出现的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到 目标视频集合,包括: 在所述检索视频集合确定后,获取所述同义词集合中每个同义词的语意; 根据所述同义词集合中每个同义词的语意,判断与同义词对应的视频的特征; 根据所述同义词集合对应视频的特征与模板视频参数对比,确定最终的目标视频 集合。 作为本发明的一种实施例:所述预设特征参数通过以下步骤确定: 步骤S1:获取检索视频集合E={e1,e2……eg};所述g表示第g个视频;所述g=1,2, 3……g; 步骤S2:根据所述检索视频集合E,确定所述检索视频集合的特征矩阵R: 其中,所述rgl表示第g个视频的第l个特征; 步骤S3:根据所述检索视频集合的特征矩阵R,计算所述检索视频集合的差值系数 η: 其中,所述em为模板视频的特征参数,所述N为检索视频集合的个数; 步骤S4:根据所述差值系数η和模板视频确定所述目标视频的阀值ε=emη: 当所述检索视频集合中的视频的特征参数大于等于所述目标视频的阀值时,确定 所述检索所述检索视频集合中的视频为目标视频; 当所述检索视频集合中的视频eg的特征参数小于所述目标视频的阀值时,删除所 述检索视频集合中的视频eg。 作为本发明的一种实施例:所述步骤S2中,确定所述检索视频集合的特征矩阵,包 括以下步骤: 步骤S10:根据所检索视频集合中视频对应的同义词,获取同义词语义; 步骤S11:根据所述同义词语义,在所述检索视频集合的视频中进行语义标记; 步骤S12:根据所述语义标记,提取所述语义标记的帧图像,并获取所述帧图像的 特征; 步骤S13:根据所述帧图像的特征,构建所述检索视频集合的特征矩阵。 本发明的有益效果在于:本发明公开了一种视频的采集方法,主要用于用户采集 大量同类视频;通过对视频的同义词集合进行提取能够最大限度的获取与检索词相关的视 频。通过同义词构建约束模型,可以对视频进一步筛选,把只与检索词相关的视频进行提取 出来。在视频提取时,还可以通过网页异常判断、视频链接地址的有效性判断和获取方式进 行判断,使得获取的视频集合中可以删除无效网页的视频和放置木马病毒。而获取方式的 7 CN 111597386 A 说 明 书 4/9 页 判断可以让视频采集人员根据现有的视频下载工具或者加载工具把无法获取的视频删除 掉。最终得到的视频集合又通过检索词的语意出现的特征,删除检索词的语意出现特征出 现不高的视频,得到精确的目标视频合集,从而在短视频制作、视频定向采集等领域能够进 行精确的视频获取,防止短视频制作和视频采集需要耗费大量人力,物力和财力。 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书以及附图中所特别指出的结构来实现和获得。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实 施例一起用于解释本发明,并不构成对本发明的限制。在附图中: 图1为本发明实施例中一种视频采集方法的方法流程图;