数学建模多元统计分析

发布时间：2019-01-21

实验报告
一、实验名称
多元统计分析作业题。
二、实验目的
（一）了解并掌握主成分分析与因子分析的基本原理和简单解法。
（二）学会使用matlab编写程序进行因子分析，求得特征值、特征向量、载荷矩阵等值。（三）学会使用排序、元胞数组、图像表示最后的结果，使结果更加直观。
三、实验内容与要求

四、实验原理与步骤
（一）第一题：
1、实验原理：因子分析简介：
(1 1.1 基本因子分析模型
设p维总体x=(x1,x2,....,xp'的均值为u=(u1,u2,....,u3'，因子分析的一般模型为 x1=u1+a11f1+a12f2+........+a1mfm+ε1 x2=u2+a21f1+a22f2+........+a2mfm+ε2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp 其中，f1,f2,.....,fm为m个公共因子；εi是变量xi(i=1,2,.....,p所独有的特殊因子，他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m为变量xi的公共因子fi上的载荷，它反映了公共因子对变量的重要程度，对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε

其中A=(aijpxm 称为因子载荷矩阵；f=(f1,f2,....,fm'为公共因子向量；ε=(ε1,ε2,.....εp称为特殊因子向量
(2 1.2 共性方差与特殊方差
xi的方差var(xi由两部分组成，一个是公共因子对xi方差的贡献，称为共性方差；一个是特殊因子对xi方差的贡献，称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。 (3 1.3 因子旋转
因子分析的主要目的是对公共因子给出符合实际意义的合理解释，解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时，并且绝对值大的元素较少时，则该公共因子就易于解释，反之，公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转（例如正交旋转），使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化，这样就使得因子的解释变得容易。
因子旋转方法有正交旋转和斜交旋转两种，这里只介绍一种普遍使用的正交旋转法：最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值（或平方值）尽可能地向两极分化，即少数元素的绝对值（或平方值）取尽可能大的值，而其他元素尽量接近于0. (4 1.4 因子得分
在对公共因子做出合理解释后，有时还需要求出各观测所对应的各个公共因子的得分，就比如我们知道某个女孩是一个美女，可能很多人更关心该给她的脸蛋、身材等各打多少分，常用的求因子得分的方法有加权最小二乘法和回归法。注意：因子载荷矩阵和得分矩阵的区别：
因子载荷矩阵是各个原始变量的因子表达式的系数，表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系，在某一公因子上得分高，表明该指标与该公因子之间关系越密切。简单说，通过因子载荷矩阵可以得到原始指标变量的线性组合，如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1，a11、a12、a13分别为与变量X1在同一行的因子载荷，F1、F2、F3分别为提取的公因子；通过因子得分矩阵可以得到公因子的线性组合，如F1=a11*X1+a21*X2+a31*X3，字母代表的意义同上。 (5 1.5 因子分析中的Heywood（海伍德）现象
如果x的各个分量都已经标准化了，则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0，并且小于1。但在实际进行参数估计的时候，共性方差

的估计可能会等于或超过1，如果等于1，就称之为海伍德现象，如果超过1，称之为超海伍德线性。超海伍德现象意味着某些特殊因子的方差为负，表明肯定存在问题。造成这种现象的可能原因包括：共性方差本身估计的问题；太多的共性因子，出现了过拟合；太少的共性因子，造成拟合不足；数据太少，不能提供稳定的估计；因子模型不适合这些数据。
当出现海伍德现象或超海伍德现象时，应对估计结果保持谨慎态度。可以尝试增加数据量，或改变公共因子数目，让公共因子数目在一个允许的范围内变动，观察估计结果是否有改观；还可以尝试用其他多元统计方法进行分析，比如主成分析。

2、实验步骤：
(1将原始数据标准化处理; (2建立相关系数矩阵并计算其特征值和特征向量; 将题目所给的相关系数矩阵输入并设为PHO，利用 [x,y]=eig(PHO求得PHO的特征值和特征向量。
(3 选择特征值大于等于1的特征值个数为公共因子数,或者根据特征值累计贡献率大于80%来确定公共因子。
从y表（特征值表）中我们可以看出大于等于1的特征值个数为4，所以公共因子数也为4。 (4 求得正交或斜交因子载荷矩阵; ① 通过上一步，我们得到了因子载荷矩阵lambda。
② 因子分析，公共因子数为4，设置特殊方差的下限为0，使用 factoran函数进行因子旋转。
③ 设置表头与变量名，计算贡献率与累计贡献率。将lambda、Contribut、 CumCont放在一起，转为元胞数组，并显示最后的结果。 (5 计算公因子得分和综合得分。
计算因子得分方法是：用每个共因子的方差贡献率做权数，对每个因子进行加权，然后加总得到每个项目的总因子得分按总得分的多少进行排序，以反映不同免死方面对结果的影响。

根据第3步我们可以得到因子1~4的贡献率分别为： [29.1129] [ 27.3303] [ 10.7644] [ 7.2713]，即为它们的权重。再由不同面试方面所对应的因子数我们可以得到公因子得分和综合得分。

（二）第二题：
1、实验原理：
主成分分析是由皮尔逊在1901年首先对非随机变量引入的，后来由霍特林在1933年推广到随机向量的情形。主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量的多元统计方法，这些主成分能够反映原始变量的大部分信息，且新主成分之间相关性低、重叠少。
主成分分析在很多领域都有广泛的应用，一般来说，当研究的问题涉及多个变量，并且变量间相关性明显，即包含的信息有所重叠时，可以考虑用主成分分析的方法，这样更容易抓住事物的主要矛盾，使问题简化。
具体做法是：
①对原始数据进行标准化处理用x1,x2,,xm表示主成分分析指标的m个变量，评价对象有n个，aij表示第i个评价对象对应于第j个指标的取值。将每个指标值aij转化为标准化指标aij，即

aijaijjsj,(i1,2,,n;j1,2,,m
1n1n式中：jaij，sj(aijj2 ni1n1i1 相应地，标准化指标变量为
xj②计算相关系数矩阵R
xjjsj,(

数学建模多元统计分析

推荐内容

相关推荐

春饼记鲜

何晓群多元统计分析(数据)

常用英语口语8000句：恋爱结婚：表白 -(韦博分享)

英语写作范文：年轻人是否应该遵守传统

语言活动反思：笑哈哈

语言活动反思：笑哈哈

语言活动反思：笑哈哈

语言活动反思：笑哈哈

语言活动反思：笑哈哈

语言活动反思：笑哈哈