主成分分析法在学生成绩评价中的应用

更新时间:2023-07-17 06:37:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数学建模中主成分分析法的应用

第24卷第1期2009年1月

乐山师范学院学报

JournalofLeshanTeachersCollege

Vol.24,No.1Jan.2009

主成分分析法在学生成绩评价中的应用

马燕

(伊犁师范学院生命资源环境系,新疆奎屯833200)

摘要:本文运用主成分分析法,分析了伊犁师范学院奎屯校区06汉旅游管理班06-07学年的考试成绩,并根据综合得分给出了科学的排名,对学生在学科中的优势与劣势进行了说明,客观地反映了学生在学科成绩方面的特征。

关键词:主成分分析法;综合排名;学生成绩中图分类号:TP3

文献标识码:A

文章编号:1009-8666(2009)01-0131-03

通常情况下,学校在评价学生成绩时,主要采

用的是多门课程总平均分排名的方法。这种方法对于学生的成绩评价过于笼统,看不出学生在各学科间的优势与劣势。为了解决传统评价方法中的缺陷,本文认为可以使用主成分分析法来对学生成绩进行科学的评价和学科间具体的优势、劣势的度量。通过设定公共因子可以解决传统方法中课程门数过多的弊端,其能清晰地揭示影响学生成绩的主要原因,对促进学生能力不断发展具有重要意义[1]。

设有个n个样本,每个样本有m个数据,记x11…x1m

(x1,x2,…,xm)为x=………=

xn1…xnm

(1)对x的列进行标准化变换

xxj=(xij(i=1,2,…,n;j=1,2,…,m)j/σj,

*

m

mmmmmmmmm

mmmmmmmmmm

其中j=1

σ=1Σx,

2j

n

ij

(xijj2,得标准化矩

i=1

m

mmmmmmmmm

x11…x1m

阵x*,仍记为x=………

一、主成分分析法

(一)主成分分析法和评价模型

主成分因子分析是将多个指标化为少数指标且能保持最大原始数据的相关性的一种方法。在(i=1,2,主成分分析中较为重要的方差贡献βi=…,k),表示第i个公因子在消除i-1个公因子影响后,使方差贡献取到的最大值。用它主要衡量第

i个公因子的重要程度。因此我们可以以βi为权重,建立相应的评价模型:F=β1F1+β2F2+…+βkFk,其中F1,F2,…,Fk为相应的用来综合描述原始指标的个k个公因子,计算综合得分并排序[2]。

(二)主成分分析法的分析步骤[1]

xn1…xnm

(2)用计算机计算指标变量的相关系数矩阵

r11…r1mn

R=………=x’x,其中rij=Σxijxik=nni=1

rm1…rmm

mmmmmmmmmm

mmmmmmmmmm

mmmmmmmmmm

1x’

xk,j,k=1,2,…,m.j

(3)用相关系数矩阵进行主成分分析,计算R的特征值λi和特征向量ai,i=1,2,…,n

(4)确定主成分个数,称λk/(Σλk)为第k个

i=1p

称(Σλ)(Σλ)主成分的信息贡献率,记为βk,i/i

i=1

i=1

kp

收稿日期:2008-01-03

作者简介:马燕(1976-),女,山东莒南人,伊犁师范学院生命资源环境系讲师,硕士,主要从事旅游专业的教学。

数学建模中主成分分析法的应用

为前k个主成分的累计信息贡献率。

(5)求因子载荷ai=姨iai,计算因子载荷矩阵,再计算各因子得分Fi=aix,i=1,2,…,k.(6)按因子得分Fi及贡献率的大小,计算综

再根据综合得分进合得分F=β1F1+β2F2+…+βkFk,行排序。

)。的特征值,确定主成分个数(表2

表2方差分解主成分提取分析表

Component

Total

12345678910111213

6.0141.6241.3601.0340.8700.5980.4640.3250.3000.2100.1085.114E-024.250E-02

InitialEigenvalues46.26212.49010.4627.9566.6954.5973.5712.4992.3061.6130.8290.3930.327

46.26258.75269.21477.17083.86588.46292.03294.53296.83898.45199.28099.673100.000

ExtractionSumsofSquaredLoadings6.0141.6241.3601.034

46.26212.49010.4627.956

46.26258.75269.21477.170

%ofVarianceCumulative%Total%ofVarianceCumulative%

二、实例分析

以伊犁师范学院(生命与资源环境系06汉旅

游管理班)在2006-2007学年的考试课成绩为例,运用主成分分析法对学生综合能力进行评价。班上共有23名同学,将这23名同学作为总体,把2006-2007学年的13科考试课:大学英语1、道德法律、高等数学、旅游心理学、导游基础、旅游学概论、体育、导游业务、旅游美学与交际礼仪、大学英语2、自然地理、西域民俗风情、大学语文作为变量,分别用x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13来表示,用xij表示第i个同学在第j门课上的得分,则x=(xij)23×l3,这样就得到了一个23×13的原始数据矩阵。见表1。

表1原始数据矩阵

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10X11X12X13

ExtractionMethod:PrincipalComponentAnalysis.

从表2可以看出,前4个公共因子的累积贡献率达到77.17%,即前4个公共因子可以反映原指标77.17%的信息量。因此,上述13项指标可以综合成公共因子F1,F2,F3和F4并可得到初始因子截荷矩阵(表3)。

表3初始因子截荷矩证

Component

1

X1X2X3X4X5X6X7X8X9X10X11X12X13

0.7050.3150.8000.9080.9250.666-0.4570.8600.4920.7850.7600.518-2.986E-02

2-0.2990.747-0.230-0.140-0.180-0.281-0.443-1.571E-020.280-0.1380.1510.6120.319

30.225-0.107-0.1410.108-7.937E-02-0.1550.4950.111-0.3440.3117.900E-030.2710.831

40.3930.1900.135-6.683E-03-0.158-0.3708.919E-02-0.1030.5960.270-0.343-0.3086.774E-02

183.382.064.583.184.085.090.070.378.366.077.678.084.0274.489.052.961.970.077.081.967.979.356.762.974.084.6379.094.070.682.079.086.585.975.278.666.574.678.086.1475.591.061.683.577.073.086.073.572.771.373.689.083.9581.290.069.794.392.087.576.086.188.270.578.885.085.0653.888.043.961.871.085.084.866.069.939.872.077.083.0781.584.060.481.778.079.079.270.072.873.066.778.080.0885.290.061.591.587.089.083.288.284.582.575.578.083.0983.295.080.485.088.090.081.876.581.268.275.574.080.11089.397.087.589.788.088.582.083.188.089.582.085.085.31177.386.074.594.485.090.081.285.387.573.175.583.081.01284.190.063.779.384.083.684.176.282.171.274.077.083.21354.887.042.164.162.069.090.663.174.258.761.578.085.01480.785.062.785.885.090.085.081.670.671.465.682.086.11582.095.068.292.289.093.580.484.969.877.382.689.085.01677.378.068.487.085.091.590.078.462.469.876.278.083.11770.396.053.976.781.091.087.868.577.465.174.678.082.01856.187.065.060.077.085.084.169.773.458.171.475.083.11984.193.070.486.582.088.087.472.187.964.368.878.083.12071.385.071.589.689.085.478.073.280.966.877.382.081.02166.584.079.284.080.091.886.078.883.369.571.278.082.02285.078.066.883.081.085.093.270.674.777.971.270.084.12367.995.063.989.083.088.085.472.887.377.281.786.084.0

从表3可以看出:x1,x3,x4,x5,x6,x8,x10,x11,在第一主因子Fl上有较大载荷,Fl反映的是学生在大学英语1、高等数学、旅游心理学、导游基础、旅游学概论、导游业务、大学英语2、自然地理方面的信息;x2,x12在第二主因子F2上有较大载荷,F2反映的是学生在道德法律与西域民俗风情方面的

x13,x7在第三主因子F3上有较大载荷,F3反信息;

映的是学生在大学语文与体育方面的信息;x9在

将原始数据标准化,得标准化矩阵表;用计算

机求出标准化矩阵的相关系数矩阵;求相关矩阵

数学建模中主成分分析法的应用

第四主因子F4上有较大载荷,F4反映的是学生在旅游美学与交际礼仪方面的信息。

计算因子得分:F1=0.2875X1+0.1285X2+0.3262X3+0.3703X4+0.3772X5+0.2716X6-0.1864X7+0.3507X8+0.2006X9+0.3201X10+0.3099X11+0.2112X12-0.0122X13;

F2=-0.2346X1+0.5862X2-0.1805X3-0.1099X4-0.1412X5-0.2205X6-0.3476X7-0.0123X8+0.2197X9-0.1083X10+0.1185X11+0.4802X12+0.2503X13;

F3=0.1930X1-0.0918X2-0.1209X3+0.0926X4-0.0681X5-0.1329X6+0.4245X7+0.0952X8-0.2950X9+0.2667X10+0.0068X11+0.2324X12+0.7126X13;

F4=-0.2940X1+0.7346X2-0.2262X3-0.1377X4-0.1770X5-0.2763X6-0.4356X7-0.0154X8+0.2753X9-0.1357X10+0.1485X11+0.6018X12+0.3137X13。

我们以特征值的贡献率作加权系数计算各样本总得分,即

F=46.262F1+12.490F2+10.462F3+7.956F4

表4综合排名

学号

F1

排名

F2

排名

F3

排名

F4

排名

F

综合分排名平均分排名1521810322184715112392171620126141913

1421917322194715112312215182081310166

1-0.2771614-1.30193210.861419-1.6315721-33.05182-3.60731210.832498-0.27614141.043218-151.07330.10214120.6094791.0229770.76381929.116674-0.66023151.5551621.4297421.94895219.3441753.1553121.391213-0.13855121.743433175.76846-4.47842220.965327-1.02977191.209707-196.2737-1.0827819-0.7806619-1.2974320-0.9783519-81.199582.313025-0.37920160.0944611-0.475201699.4762791.585266-0.7292818-2.2557123-0.914051833.35717104.1279211.1522060.8797181.443946226.0483112.389954-0.2961915-1.3056921-0.371181590.25122120.309419-0.1120813-0.1597313-0.140521310.1249713-5.86065231.2233051.2082151.533065-231.009140.2893010-0.57630171.838021-0.722091719.67003153.1074331.2755841.2574241.598654185.5619160.0733213-2.65978221.156506-3.3330922-44.247517-0.96253180.4090910-0.71022160.5126110-42.77118-2.74135200.1050111-1.01253180.1315511-135.055190.2761311-0.1321014-0.4493715-0.16559145.105654201.1383470.0107312-1.77990220.013361234.28088210.384878-1.1132020-0.9831817-1.3950220-17.483822-0.9603917-3.16904231.406673-3.9713623-100.8923-0.78161161.7202410.24353102.1558015.026311

将标准化后的数据分别代入F1,F2,F3,F4,F的

表达式中,我们得到各样本在F1,F2,F3,F4及F上的得分。见表4。

从表4中可以看出,每名同学的综合素质得分、总成绩平均分及在四个主成分方面的得分情况,进而可以判断出各个学生的综合素质及在学科上的优势和劣势。

三、结论

(1)影响学生综合得分的主要因素有四个方面:F1:大学英语1、高等数学、旅游心理学、导游基础、旅游学概论、导游业务、大学英语2、自然地理,可以概括为专业素质因子(大学英语和高等数学是科学研究所必备的素质,所以把他们归入专业素质因子中);F2:道德法律与西域民俗风情;F3:大学语文与体育;F4:旅游美学与交际礼仪。其中最主要的是F1,F1反映了学生专业素质方面的能力水平。

(2)从表5中可以看出,用主成分因子分析后,得到的综合得分排名与按平均分排名基本相符,但也有一定的差距。例如23号同学,他的平均而他的综合排名是第13,原因是他分排名是第6,

在第一主因子F1上的得分较低。而第一主因子反映的是学生的专业基础能力,这是考察旅游专业学生的关键。又如20号同学,按平均分排名,20号排13,而按综合得分排名,20号排6,说明这名同学的专业能力相对于其他方面强。

(3)根据各同学在主因子方面的得分情况及总分所获得的排名,可以客观地了解学生各方面的得分情况及综合得分排名,可以客观地了解学生各方面知识掌握的情况,了解学生各方面的特综合得分排名与平均得分排名点。如13号同学,

均是23名,他在F2,F3,F4得分排名中均在前五名,但是在F1的排名中却位居23名,可以看出该同学的优势是在道德法律、西域民俗风情、大学语文、体育、旅游美学与交际礼仪这些课程;而劣势是专业素质太低,因此,在今后的学习中该同学应该加强提高专业素质即在大学英语1、高等数学、旅游心理学、导游基础、旅游学概论、导游业务、大学英语2、自然地理课程的学习中下功夫。

参考文献:

[1]张小燕,付小芹,韩润萍.主成分分析法对毕业生素质的评价[J].北京服装学院学报,2000,20(2):70-75.

[2]杨宇音,赵雅明,曲立敏.因子分析法在大学生综合排名中的应用[J].贵州工业大学学报(自然科学版),2005,34(1):9-13.

本文来源:https://www.bwwdw.com/article/99a1.html

Top