多线性主成分分析
目录
多线性主成分分析
在统计学中,多线性主成分分析(MPCA)是主成分分析(PCA)的多线性扩展。MPCA用于分析n路阵列,即数字的立方体或超立方体,也被非正式地称为数据张量。N路数组可以被分解、分析,或通过以下方式建模线性张量模型,如CANDECOMP/Parafac,或多线性张量模型,如多线性主成分分析(MPCA),或多线性独立成分分析(MICA)等。MPCA的起源可以追溯到Tucker分解和PeterKroonenberg的M模式PCA/3模式PCA工作。2000年,DeLathauwer等人在他们的SIAM论文《多线性奇异值分解》(HOSVD)和《论高阶张量的最佳等级-1和等级-(R1,R2,…,RN)逼近》中,用清晰简洁的数字计算术语重述了Tucker和Kroonenberg的工作。大约在2001年,Vasilescu将数据分析、识别和综合问题重新规划为多线张量问题,其依据是大多数观察到的数据是数据形成的几个因果因素的组成结果,很适合多模式数据张量分析。在以下作品中,通过分析人类运动关节角度、面部图像或纹理的数据形成的因果因素,展示了张量框架的力量。人类运动签名(CVPR2001,ICPR2002),人脸识别–TensorFaces,(ECCV2002,CVPR2003等)和计算机图形–TensorTextures(Siggraph2004)。历史上,MPCA被称为M-模式PCA,这个术语是由PeterKroonenberg在1980年创造的。
![多线性主成分分析](http://map.s-jl.com/wp-content/uploads/sites/14/2024/09/20240928000749-66f748d528233.png)
2005年,Vasilescu和Terzopoulos引入了多线性PCA术语,以更好地区分线性和多线性张量分解,以及更好地区分计算与每个数据张量模式(轴)相关的二阶统计数据的工作和随后计算与每个张量模式/轴相关的高阶统计数据的多线性独立成分分析的工作。多线性PCA可用于计算数据形成的因果因素,或作为数据张量的信号处理工具,这些数据张量的单个观测值已被矢量化,或其观测值被视为矩阵并连接成一个数据张量。MPCA计算一组与数据张量的每个模式相关的正态矩阵,这类似于由矩阵SVD计算的矩阵的正态行和列空间。这种转换的目的是为了捕捉尽可能高的方差,说明与每个数据张量模式(轴)相关的数据中尽可能多的变异性。
多线性主成分分析的算法
MPCA解决方案遵循交替最小平方(ALS)方法。与PCA一样,MPCA在居中的数据上工作。中心化对于张量来说要复杂一些,而且它取决于问题。特征选择MPCA特征。有监督的MPCA特征选择用于物体识别,而无监督的MPCA特征选择则用于可视化任务。
多线性主成分分析的扩展
MPCA的各种扩展已经被开发出来。非相关MPCA(UMPCA)相反,非相关MPCA(UMPCA)产生非相关的多线性特征。提升+MPCA非负MPCA(NMPCA)鲁棒MPCA(RMPCA)多张量因子化,也能自动找到成分的数量(MTF)