数据分析实验

更新时间:2023-09-30 10:41:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

实验课程:专 业:班 级:学 号:姓 名:

数据分析 数学与应用数学 11070141 1107014111 宁巧娇

中北大学理学院

实验一 SAS系统的使用

【实验类型】(验证性) 【实验学时】2学时

【实验目的】 使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要

的SAS语句。

【实验内容】1. 将SCORE数据集的内容复制到一个临时数据集test。

SCORE数据集

Name Sex

Alice f Tom m Jenny f Mike m Fred m Kate f Alex m Cook m Bennie f Hellen f Wincelet f Butt m Geoge m Tod m Chris f Janet f

2.将SCORE数据集中的记录按照

Math Chinese English 90 85 91 95 87 84 93 90 83 80 85 80 84 85 89 97 83 82 92 90 91 75 78 76 82 79 84 85 74 84 90 82 87 77 81 79 86 85 82 89 84 84 89 84 87 86 65 87

math的高低拆分到3个不同的数据集:math

大于等于90的到good数据集,math在80到89之间的到normal数据集,math在80以下的到bad数据集。

3.将3题中得到的good,normal,bad数据集合并。

【实验所使用的仪器设备与软件平台】

台式电脑,笔记本电脑

【实验方法与步骤】

程序如下: data score;

1

input name$ sex$ Math Chinese English; cards;

Alice f 90 85 91 Tom m 95 87 84 Jenny f 93 90 83 Mike m 80 85 80 Fred m 84 85 89 Kate f 97 83 82 Alex m 92 90 91 Cook m 75 78 76 Bennie f 82 79 84 Hellen f 85 74 84 Wincelet f 90 82 87 Butt m 77 81 79 Geoge m 86 85 82 Tod m 89 84 84 Chris f 89 84 87 Janet f 86 65 87 ; run;

proc print data=score; run;

data test; set score;

data good normal bad; set test; select;

when (Math=>90) output good;

when (Math<90 and Math=>80) output normal; when (Math<80) ouput bad; end; run;

proc print data=good; run;

proc print data=normal; run;

proc print data=bad; run; data A;

set good normal; run; data B; set A bad; run;

2

proc print data=B; run;

【实验结果】

结果:

1. 将SCORE数据集的内容复制到一个临时数据集test

2.math大于等于90的到good数据集:

math在80到89之间的到normal数据集

math在80以下的到bad数据集:

3

3.将3题中得到的good,normal,bad数据集合并:

实验二 上市公司的数据分析

【实验类型】(综合性) 【实验学时】2学时

【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟悉

数据分析方法,培养学生分析处理实际数据的综合能力。

【实验内容】 表2是一组上市公司在2001年的每股收益(eps)、流通盘(scale)

的规模以及2001年最后一个交易日的收盘价(price).

表2 某上市公司的数据表

代码 流通盘 每股收益 000096 8500 0.059 000099 6000 0.028 000150 12600 -0.003 000151 10500 0.026 000153 2500 0.056 000155 13000 -0.009 000156 3600 0.033 000157 10000 0.06

4

股票价格

13.27 14.2 7.12 10.08 22.75 6.85 14.95 12.65

000158 000159 000301 000488 000725 000835 000869 000877 000885 000890 000892 000897 000900 000901 000902 000903 000905 000906 000908 000909 000910 000911 000912 000913 000915 000916 000917 000918 1、对股票价格

10000 7000 15365 7700 6000 1338 3200 7800 6000 16934 12000 14166 21423 4800 6500 6000 9500 6650 8988 6000 8000 7280 15000 8450 4599 34000 11800 6000 0.018 0.008 0.04 0.101 0.044 0.07 0.194 -0.084 -0.073 0.031 0.031 0.002 0.058 0.005 -0.031 0.109 0.046 0.007 0.006 0.002 0.036 0.067 0.112 0.062 0.001 0.038 0.086 -0.045 8.38 12.15 7.31 13.26 12.33 22.58 18.29 12.55 12.48 9.12 7.88 6.91 8.59 27.95 10.92 11.79 9.29 14.47 8.28 9.99 8.9 9.01 8.06 11.86 14.4 5.15 16.23 10.12

1)计算均值、方差、标准差、变异系数、偏度、峰度; 2)计算中位数,上、下四分位 数,四分位极差,三均值; 3)作出直方图; 4)作出茎叶图;

5)进行正态性检验(正态W检验); 6)计算协方差矩阵,Pearson相关矩阵; 7)计算Spearman相关矩阵; 8)分析各指标间的相关性。

2、1)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计值及残差;

5

2)给定显著性水平α=0.05,检验回归关系的显著性,检验各自变量对因变量的影响的显著性;

?,X,X及XX的残差图及残差的正态QQ图。分析 3)拟合残差关于拟合值Y1212这些残差,并予以评述。

【实验前的预备知识】

1、1)数据的数字特征:均值、方差、中位数、三均值与极差等; 2)数据的分布:直方图、茎叶图、箱线图、正态性检验等; 3)多元数据的数字特征与相关性分析:均值向量与协方差矩阵等。 2、1)线性回归模型的参数估计及有关的统计推断; 2)残差分析。

【实验方法或步骤】

1、对股票价格

程序如下:

data price; input x @@; cards;

13.27 14.2 7.12 10.08 22.75 6.85 14.95 12.65 8.38 12.15 7.31 13.26 12.33 22.58 18.29 12.55 12.48 9.12 7.88 6.91 8.59 27.95 10.92 11.79 9.29 14.47 8.28 9.99 8.9 9.01 8.06 11.86 14.4 5.15 16.23 10.12 ;

proc print data=price; run;

proc means mean var std cv skewness kurtosis; var x; run;

proc univariate plot normal; run;

proc capability graphics; histogram x/normal; run;

1)计算均值、方差、标准差、变异系数、偏度、峰度; 由proc means过程得:

6

所以,股票价格的均值为11.9477778、方差为23.7675143、标准差为4.8751938、变异系数为40.8041891、偏度为1.5160302、峰度为2.7205929 2)计算中位数,上、下四分位数,四分位极差,三均值; 由proc univariate过程得:

所以,股票价格的中位数为:M=11.355,、上四分位数Q3=13.735、下四分位数Q1=8.485、四分位极差为:R1=Q3-Q1=5.25、三均值:

?=1/4*Q1+1/2*M+1/4*Q3=11.2325. M

3)作出直方图;

由proc capability过程得

7

4)作出茎叶图;

由proc univariate过程得:

5)进行正态性检验(正态W检验);

有proc uniwariate过程,算得:

W=0.872266

P值为:

p?p{W?0.872266}?0.0006

8

取?=0.05,因p=0.0006<0.05,故拒绝正态性假设 6)计算协方差矩阵,Pearson相关矩阵; 程序如下:

data a1;

input eps scale price; cards;

8500 0.059 13.27 6000 0.028 14.2 12600 -0.003 7.12 10500 0.026 10.08 2500 0.056 22.75 13000 -0.009 6.85 3600 0.033 14.95 10000 0.06 12.65 10000 0.018 8.38 7000 0.008 12.15 15365 0.04 7.31 7700 0.101 13.26 6000 0.044 12.33 1338 0.07 22.58 3200 0.194 18.29 7800 -0.084 12.55 6000 -0.073 12.48 16934 0.031 9.12 12000 0.031 7.88 14166 0.002 6.91 21423 0.058 8.59 4800 0.005 27.95 6500 -0.031 10.92 6000 0.109 11.79 9500 0.046 9.29 6650 0.007 14.47 8988 0.006 8.28 6000 0.002 9.99 8000 0.036 8.9 7280 0.067 9.01 15000 0.112 8.06 8450 0.062 11.86 4599 0.001 14.4 34000 0.038 5.15 11800 0.086 16.23 6000 -0.045 10.12 ;

9

本文来源:https://www.bwwdw.com/article/0qfd.html

Top