
技术摘要:
本发明解决张量的降维问题。局部线性嵌入是流形学习的重要算法,它根据高维局部数据之间线性关系保持不变的原则进行数据降维,在降维过程中保持数据的几何信息。故本发明为解决一些张量降维方法未考虑数据的非线性结构的问题,提出基于局部线性嵌入对张量进行降维的算 全部
背景技术:
随着大数据时代的到来,张量频繁出现在各个领域,由于直接对张量进行处理会 带来诸多不便,通常会对其进行降维处理,以提高学习效率。 数据降维是流形学习的重要应用领域。从数学来说,所谓流形就是与欧式空间局 部同胚的拓扑空间。因此,局部性质保持是大多数流形学习算法的重要特征。局部线性嵌入 (LLE)是流形学习的经典算法,降维过程中用于保持张量的几何结构。基于局部线性嵌入对 张量进行降维,通过K最近邻准则将原始张量划分为若干个局部,局部的数据在降维过程中 保持线性关系。 由于张量与矩阵的模式积可以改变张量维度的大小,我们构建了基于模式积的张 量数据降维算法,它根据降维张量与一系列矩阵的模式积逼近高维张量的原则进行数据降 维。 结合以上两方面的考虑,本发明提出一种基于局部线性嵌入和模式积的张量降维 算法,该算法既保持了数据的局部性质,又考虑了数据的全局信息,有利于保持数据降维过 程中的重要特征。
技术实现要素:
本发明研究高维的多维数据的降维问题。由于数据降维算法的构建需要利用数据 之间的联系,因此,数据降维算法的构建都是基于数据集,而不是基于单个数据。所以与大 多数应用不同,本发明采用一个张量表示一个多维数据集。在这个表示中,张量的前面各维 表示多维数据的各个维度,而最后一维则表示数据集所包含的数据的个数。 考虑数据可能存在的非线性结构,而高维数据通常位于外围空间的低维流形中, 所以利用这些几何信息非常有助于张量数据的降维。数据降维是流形学习的重要应用领 域,局部性质保持是大多数流形学习算法的重要特征。LLE被誉为流形学习的第一个算法。 本发明针对张量数据的特点,构建了基于局部线性嵌入的张量数据降维算法。这是一个LLE 算法的张量版本。 考虑到张量与一个矩阵的模式积可以改变张量某个维度的大小,我们可以寻找一 个低维张量和一系列矩阵,使得这个低维张量与这些矩阵的模式积尽量逼近给定的高维张 量。这个低维张量就是高维张量的降维结果。进一步,我们提出基于模式积的张量数据降维 问题的迭代解法,相比全局或模式PCA解法,迭代解法得到的结果虽然不是问题的最优数学 解,但却是兼顾张量数据各个维度的差异和联系的最优近似解。 基于局部线性嵌入的张量降维算法是一个局部性质保持的算法,而基于模式积的 3 CN 111582322 A 说 明 书 2/7 页 张量降维算法则是一个全局性质保持的算法。本发明融合这二种算法,提出基于局部线性 嵌入和模式积的张量数据降维算法。 本发明的特点及其意义: (1)将流形学习的LLE算法运用到张量的降维中,通过保持局部线性关系实现降 维,有效保持了张量的几何结构; (2)张量与一个矩阵的模式积可以改变张量某个维度的大小,基于模式积的张量 数据降维算法,旨在寻找一个低维张量和一系列矩阵,使得这个低维张量与这些矩阵的模 式积尽量逼近给定的高维张量。同时兼顾张量数据各个维度的差异和联系,提出基于模式 积的张量数据降维问题的迭代解法。 附图说明 图1:一种基于局部线性嵌入和模式积的张量降维算法流程图。