载荷矩阵:
基于相关系数计算
a、对
进行Z分数标准化得到
,再求协方差
b、对
进行特征值分解,得到递减的特征值序列
以及对应的特征向量
。并依据累计贡献率选出前
个特征值。
其中最大特征根的特征向量对应第一主成分的系数向量;第二大特征根对应的特征向量是第二大主成分的系数向量
c、载荷矩阵:
定义:princomp (x:array,ep:Real,isStand:bool,resid:array):array;
说明:主成分分析,isStand为0时从中心化协方差出发进行主成分分析,为1时从相关系数出发,进行主成分分析
参数:
x:样本数据,二维数字数组
ep:累计方差贡献度阈值,实数,缺省时默认为0.85
isStand:是否标准化,布尔类型,缺省时为真
resid:残差,变参输出,二维数字数组
返回结果:
ret["特征值",0]:协方差矩阵的特征值信息
ret["特征向量",0]:特征值对应的特征向量
ret['累计贡献率',0]:累计贡献率
ret["主成分",0]:主成分
ret["主成分载荷",0]:主成分载荷
例:企业经济效益主成分分析(参见平台下的Demo_Princomp函数)
某市为了全面分析机械类各企业的经济效益,选择了8个不同的利润指标,14家企业关于这8个指标的统计数据如表所示.
企业 | 净产值利润率% | 固定资产利润率% | 总产值利润% | 销售收入利润率% | 产品成本利润率% | 物耗利润率% | 人均利润率千元/人 | 流动资金利润率% |
1 | 40.4 | 24.7 | 7.2 | 6.1 | 8.3 | 8.7 | 2.44 | 20.0 |
2 | 25.0 | 12.7 | 11.2 | 11.0 | 12.9 | 20.2 | 3.542 | 9.1 |
3 | 13.2 | 3.3 | 3.9 | 4.3 | 4.4 | 5.5 | 0.578 | 3.6 |
4 | 22.3 | 6.7 | 5.6 | 3.7 | 6.0 | 7.4 | 0.176 | 7.3 |
5 | 34.3 | 11.8 | 7.1 | 7.1 | 8.0 | 8.9 | 1.726 | 27.5 |
6 | 35.6 | 12.5 | 16.4 | 16.7 | 22.8 | 29.3 | 3.017 | 26.6 |
7 | 22.0 | 7.8 | 9.9 | 10.2 | 12.6 | 17.6 | 0.847 | 10.6 |
8 | 48.4 | 13.4 | 10.9 | 9.9 | 10.9 | 13.9 | 1.772 | 17.8 |
9 | 40.6 | 19.1 | 19.8 | 19.0 | 29.7 | 39.6 | 2.449 | 35.8 |
10 | 24.8 | 8.0 | 9.8 | 8.9 | 11.9 | 16.2 | 0.789 | 13.7 |
11 | 12.5 | 9.7 | 4.2 | 4.2 | 4.6 | 6.5 | 0.874 | 3.9 |
12 | 1.8 | 0.6 | 0.7 | 0.7 | 0.8 | 1.1 | 0.056 | 1.0 |
13 | 32.3 | 13.9 | 9.4 | 8.3 | 9.8 | 13.3 | 2.126 | 17.1 |
14 | 38.5 | 9.1 | 11.3 | 9.5 | 12.2 | 16.4 | 1.327 | 11.6 |
return princomp (X,0.85,1,resid);
返回结果:
特征值:
特征向量:
累计贡献率:
]主成分:
主成分载荷:
由主成分载荷矩阵,我们基本可以得出第一主成分是综合指标,第二主成分是固定资产获利指标,第三主成分是人均获利。