2.1.1 简单的随机抽样 教案3

更新时间:2024-04-22 07:45:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第三章 简单随机抽样

第一节 简单随机抽样概述

一、简单随机抽样的概念

简单随机抽样也叫作纯随机抽样。其概念可有两种等价的定义方法: 定义之一:简单随机抽样就是从总体N个抽样单元中,一次抽取n个单元时,使全部可能的样本被抽到的概率均相等。

定义之二:简单随机抽样是从总体的N个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n次,以抽中的n个单元组成简单随机样本。

按简单随机抽样,抽到的样本称为简单随机样本。

二、简单随机抽样的具体实施方法

(一)抽签法

抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本。

(二)随机数法

随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n比较大时。

三、简单随机抽样的方法评估

简单随机抽样是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。

它要求总体要比较均匀,且样本容量要比较大,但在社会经济现象中,均匀总体是很少见的;未能充分利用关于总体的各种其它已知信息;要有好的抽样框可用。

第二节 总体参数的估计

一、估计量

1、总体均值和总和的简单估计量

在简单随机抽样条件下,总体均值的简单估计量分别为:

??y?Y?yinin

可以证明,样本均值是总体均值的无偏估计,即

E(y)?Y

因此总体总和的简单估计量为

N?yiin??Ny?YnN?n?yini

其中N/n也称作膨胀因子。 2、总体比例的简单估计量 总体比例的简单估计量为:

??p?n1 Pn且

E(p)?P

总体中具有D类属性的单位总数的估计量为:

??NP??Np N1二、估计量的方差

在抽样推断中,有时往往只计算出估计量的值,而不大注意估计量的误差(方

差或标准差)。但是,总体均值的估计量通常与总体均值的真值间不完全一致,即存在误差,而且所有可能的样本均值相对于总体均值的误差大小也是不一致的。

总体均值估计量的方差为

1?f2V(y)?S

n其中,f为抽样比,1-f为有限总体不重复抽样校正系数,记为fpc。

由此进一步可推出

2N(1?f)2N(N?n)2?)?V(YS?S

nn总体比例估计量的方差为

?)?1?fP(1?P) V(Pn总体中具有某种属性单元总数估计量的方差为

?)?V(NP?)?1?fN2P(1?P) V(N1n三、方差估计量

估计量的方差的估计量分别为

?(y)?1?fs2 VnN2(1?f)2??V(Y)?s

n?(Y?)分别是V(y)与V(Y?)的无偏估计。 ?(y)与V而且V?)的无偏估计量为 同理,可得V(P?(P?)?1?fP?(1?P?) Vn?1?)的无偏估计量为 V(N12N(1?f)?(N?)?Vp(1?p) 1n?1

第三节 样本容量的确定

一、必要样本容量的确定

在确定样本容量时,必须在估计的精度要求和可供调查使用的费用之间进行权衡,使在费用一定的条件下精度达到最高,或在精度要求得到保证的前提下使费用最省。通常将在这一原则指导下所确定的样本容量称之为必要样本容量,它是在最大限度地满足规定精度要求以及尽可能节约调查费用的前提下,所应该抽取到的最少的样本容量。

(一)依规定精度来定 1、关于精度的不同提法

提法之一:以置信度1-α,允许总体参数θ的估计量??的最大绝对误差为Δ,即

?????)?1?? P(?提法之二:以置信度1-α,允许总体参数θ的估计量??的最大相对误差为r,即

P(?????r)?1??.(r?????为相对误差)

??提法之三:以置信度1-α,允许总体参数θ的估计量??的最大方差不超过V,即

?)?V)?1??. P(V(?提法之四:以置信度1-α,允许总体参数θ的估计量??的最大变异系数不超过C,即

?)?C)?1??. P(C(?2、样本容量n的确定

当n足够大时,可以认为??服从正态分布N(θ,V(??))(理由如前述样本统计量的抽样分布)。因此,由上述四种对估计量精确度的不同提法,可以分别得到下列方程式

?) r??ZV(??) ??Z?V(??22?) C?V?V(??)S(????)V(??

因为V(??)是n的函数,求解以上四个方程,即可确定n。

(二)依调查费用来定

设C表示抽样调查工作的总费用,可大致分为两个构成部分:一部分为固

定费用,用C0表示,不管调查单位数的多少,这部分费用都要花费,主要包括组织领导、宣传、设计等费用。一部分为可变费用,用C1表示,它是每调查一个单位平均要花的费用,其费用的大小随调查单元数的多少变动,如调查表的印刷、调查的差旅费等。这样

C= C0+ C1n

当总费用一定,且C0和C1依其他有关资料也大致可以确定时,就可推算出必要的抽样单元数目

n?C?C0 C1(三)在精度和费用间谋求平衡 依费用确定抽样数目后,可进行实地抽样调查,计算其样本指标和抽样方差,进一步估算其估计精度,考察其满足允许误差范围和可信程度的要求程度,以及根据精度和费用分别确定的抽样数目的符合程度,谋求精度和费用间的平衡。

二、总体方差的确定

运用精度要求来确定样本容量时,必须事先知道总体的方差。确定总体方差的方法一般有以下几种:

其一,两步抽样法。即在正式开展抽样调查工作之前,先从总体中抽取一个

?,把n1和s2 (或容量为n1的简单随机样本,求得S2的估计值s12或P的估计值P11?)代入相应的公式计算所需的n,然后,再补抽其余的n-n1个单元进行正n1和P1式调查。

其二,对于一次性的调查,采取在正式调查前进行试点调查,根据试点调查的结果估计S2或P。

其三,对于经常性调查项目,可以利用以前调查的结果,也可对以前调查的结果作适当调整。

其四,根据总体的结构,应用数学方法预测总体方差S2或P。

其五,估计比例时,如果能借助某些基本信息或方法,或经验等,估计总体比例大约在0.3-0.7之间,则也可以直接取成数方差的最大值0.25来确定样本量,这通常是一种比较“安全”的选择。

本文来源:https://www.bwwdw.com/article/84wp.html

Top