因子分析法(因子分析是解决什么问题的)
因子分析有两个核心问题:一是如何构造因子变量;二是如何命名和解释因子变量。
所以因子分析的基本步骤和解决方法都是围绕这两个核心问题。
㈠因素分析通常有以下四个基本步骤:
(1)确认待分析的原始变量是否适合因子分析。
⑵构造函数变量。
⑶采用旋转法,使因子变量更易解释。
⑷计算因子变量得分。
㈡因素分析的计算过程:
(1)对原始数据进行标准化,消除变量之间在数量级和维度上的差异。
⑵求标准化数据的相关矩阵;
⑶求相关矩阵的特征值和特征向量;
⑷计算方差贡献率和累计方差贡献率;
⑸决定因素:
设F1,F2,…,Fp为p因子,当前m个因子所包含的数据信息总量(即它们的累计贡献率)不小于80%时,可以用前m个因子来反映原评价指标;
[6]因子旋转:
如果得到的m个因子无法确定或者它们的实际意义不明显,那么需要对这些因子进行轮换,以获得更明显的实际意义。
⑺使用原始指数的线性组合来计算每个因子的得分:
因子得分通过回归估计、巴特利特估计或汤姆逊估计计算。
(8)综合得分
以各因素的方差贡献率为权重,由各因素的线性组合得到综合评价指标函数。
f =(w1 f1+w2 F2+…+WMFm)/(w1+w2+…+WM)
这里的Wi是旋转前后因素的方差贡献率。
(9)评分排名:使用综合评分可以得到评分排名。
在使用多元统计分析技术处理数据和建立宏观或微观系统模型时,有必要研究以下问题:
简化系统结构,讨论系统内核。
主成分分析、因子分析、对应分析等方法可以在众多因素中找出每个变量的最佳子集,从子集包含的信息中描述多元的系统结果以及每个因素对系统的影响。
“以树看林”,抓住主要矛盾,抓住主要矛盾的主要方面,摒弃次要因素,从而简化系统结构,理解系统核心。
预测控制预测模型的构建。
在自然和社会科学领域的科学研究和生产中,应用多元统计分析技术的主要目的是探索多元系统运动的客观规律及其与外部环境的关系,并进行预测和预报,以实现系统的最优控制。
在多元分析中,有两种类型的预测控制模型。
一种是预测模型,通常采用多元线性回归或逐步回归分析、判别分析、双筛选逐步回归分析等建模技术。
另一种是描述性模型,通常采用聚类分析的建模技术。
进行数值分类,构建分类模式。
在多变量系统的分析中,经常需要对具有相似系统性质的事物或现象进行分类。
以便找出它们之间的关系和内在规律性。
以往很多研究都是基于单因素的定性处理,使得处理结果不能反映系统的整体特征。
聚类分析和判别分析技术通常用于数值分类和分类模式构建。
如何选择合适的方法解决实际问题,需要综合考虑。
一个问题可以用多种统计方法来分析。
比如建立预测模型,可以先根据相关的生物学和生态学原理确定理论模型和实验设计;根据测试结果,收集测试数据;数据的初步细化;然后运用统计分析方法(如相关分析、逐步回归分析、主成分分析等。)研究各变量之间的相关性,选择最佳的变量子集;在此基础上,构建了预测模型。最后,对模型进行诊断和优化,并应用于生产实践。