PCA
思路:通过分析找到数据特征的主要成分,使用这些主要成分来代替原始数据;将
主成分分析要求“降维后的结果要保持原始数据的原有结构”(要求方差结构不变)
方差:样本数据的波动程度,数值上等于各个数据与样本均值之差的平方和之平均数
协方差:衡量两个变量之间的相关度
为正:正相关,为负:负相关,为0:不相关
皮尔逊相关系数:
推导:
保持方差:向投影后方差最大的方向投影
假设有
优化方法:Lagrange乘子法
步骤:
- 对于每个样本数据
进行中心化处理: - 计算原始样本数据的协方差矩阵:
- 对协方差矩阵
进行特征值分解,对所得特征根进行排序: - 取前
个最大特征根所对应的特征向量 组成映射矩阵
应用:特征人脸法