问卷编制 - 图文

更新时间:2024-03-30 20:34:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

问卷编制与测量

? 问卷是科学研究中收集资料的重要工具。 ? 英国著名社会学家莫泽(C.A.Moser)指出:“社会调查十有八九是采用问卷方法进

行的。”

? 从某种程度上说,问卷编制的质量和水平决定了课题研究的质量和水平 一、问卷的基本特征

? 1. 标准化

? 问卷项目的编制、试用和实施、结果统计和解释等环节等程序都要按照统一的标准

和程序进行。

? 标准化程序可以保证问卷结果的可比性和稳定性,提高问卷的可靠性。

? 研究者(主试)的说明和指导语都要遵循统一的标准,不允许出现任何随意性的暗

示或提示。 ? 2. 有效性

? 每一个项目或题目都要与目标具有一致性。

? 通过概念的操作化过程确立问卷的内容与结构,以保证问卷题目对所调查内容的代

表性;

? 通过试用、题目分析和问卷质量评价,确保问卷的测量误差降低到最小; ? 通过科学的概率抽样方法,保证问卷结论合理,科学。 ? 3. 适合性

? 影响问卷质量的两个因素是问卷的回收率和有效性

? 解决这两个问题的关键在于问卷要适合被调查者,或者说被调查者愿意如实地回答

问卷中的问题。 ? 遵循可接受性原则

? 有研究表明,当被调查者对调查题目不感兴趣时,无论问卷的长短,人们都不会如

实参与。 ? 匿名性 ? 4.精炼化

? 教育研究中的问卷多属于专题性调查,而非综合性调查,专题性调查中使用的问卷

尤其要简洁精炼,题目不宜过多,以不多于30项为宜。回答问卷的时间控制在20-30分钟之内。

? 并非多多益善,问题简明扼要。 ? 5. 回收率

? 有研究认为,如果问卷的回收率达不到50%,那么问卷调查就应该终止,问卷的回

收率达不到70%,问卷调查的结果就不足以可信。这是基于大规模的社会调查的结果,但是对于教育研究来说,样本量和样本的代表性才是关键问题,即使回收率不是很高,只要达到了必要的样本量,而且样本的分布合理有效,调查结果同样是有效的。

? 保证和提高回收率的一个办法就是当面发送,当场回收。 二、问卷的类型

? 结构型问卷 非结构型问卷 ? 开放式(主观型)问卷 ? 封闭式(客观型)问卷 ? 1. 结构型问卷

? 最常用的、最普遍的问卷形式,便于回答,节省时间,易于操作,信息量大,适用

1

于各种不同阶层和背景的调查对象,便于资料的整理和统计分析。 ? 其题目是封闭式的,即全部是客观型问题 ? 也可以有少量开放式的问题,即主观型题目

? 问卷的题目具有结构化的形式,问题和选项的数量是固定的 ? 2. 无结构型问卷

? 没有严格的结构化的形式,研究者可以根据实际情况,增加或减少题目 ? 实际上是一种访谈提纲 ? 只针对小样本被调查者使用

? 适合对某些问题进行深层访谈时使用 三、问卷编写的步骤

? 1. 问卷的编制:

? 前期准备;概念操作化;编制初稿; ? 使用;修订与定稿 ? 2. 问卷的实施 ? 3. 问卷的结果报告 ? 1. 明确调查目标

? 总体研究目标是什么?

? 问卷中涉及的核心概念是什么?

? 这些概念与总体研究目标有什么关系? ? 2. 了解调查样本属性

? 要分析问卷资料的可能来源,强调问卷对于被调查者的适用性和针对性。针对中小

学生的比较简单,应主要考虑调查对象的性别、年龄、学习状况等,针对教师和其他人员来说,还要考虑其他属性。 ? 性别构成; ? 年龄分布; ? 民族;

? 受教育程度;

? 专业背景;职业构成;经济状况分布;宗教信仰等等 ? 3. 概念操作化的阶段

? 教育课题研究中,经常会涉及到相对比较笼统、抽象的概念或问题,不能直接提出

观测变量和指标。这就需要把抽象的研究主题转化为可操作的具体问题。

? 所谓概念的操作化,就是将教育课题或者问卷调查中使用或需要测量的主要概念做

出明确的界定,明确概念的边界,发展观测指标和变量,为题目的编写提供基础和素材。

? 例:概念、概念维度、变量、指标 ? 问卷:2004年青少年阅读问卷 ? 概念:阅读

? 概念维度:阅读状况、阅读评价、阅读需求、阅读服务 ? 变量和指标:

? 阅读状况——阅读时间(小时/周)、数量、费用(比例)、途径、载体、地点、类型

(题材)、阅读计划和组织、活动等;

? 阅读评价——对阅读数量、价值、影响、满意度的评价及其原因; ? 阅读需求——题材、供给关系、影响因素;

? 阅读服务——现状评价、服务方式(读书计划、活动)。

2

4. 试用阶段

试用的意义如同心理测验的预测(pre-test),经过预测才能发现问卷结构、内容、选项设计方面的问题。 ? (1)专家评价法

专家来自两个方面,一是来自相同研究领域的专家,二是来自被调查领域的专家。 要实施一项关于中学生心理问题的问卷调查,除了邀请心理学专家外,也要邀请中学教育专家或中学教师参与问卷的试用评价,这样可以从理论与实践两个层面对问卷做出全面的判断和评价。

? 专家评价法的人数不必很多,有条件的可以5-10人,不具备的可以2-3人。 ? (2)预调查法

? 从正式调查的被调查者总体中随机抽取一定数量的被调查者对问卷初稿进行预测。 ? 一般样本在30人以上

? 题目分析:回答率、难度、区分度、选项百分比 ? 选项上:

? 选项率极低的选项(选择率在5%以下) ? 过度集中的选项 ? 存在错误的选项 ? 选项排列顺序不当 ? 选项中的其他问题 ? 题目上:

? 与问卷调查目标不一致的题目(专家评价,题目与总分呈低相关) ? 与概念维度不一致的题目(专家评价,题目与同类题目总分呈低相关) ? 区分度为负值或比较低的题目 ? 存在错误选项或答案的题目 ? 多数被调查者没有回答的题目 ? 5. 修订与定稿阶段

? 问卷修订的核心是调整题目和选项 ? 这里有一个关键问题,即题目的数量

? 一般情况下,问卷数目在20-30题之间,其中每个概念维度的题目数量以7-10题居

多,每个概念维度中的观测变量以3-7题为宜。

? 多个概念维度的综合性问卷题目可能在几十甚至上百个。

? 简单或单一问卷应该在10-20分钟完成,综合性问卷应该30-50分钟内完成,时间

太长会影响被调查者的心态。 ? 6. 问卷的发放

? 当面发送,邮寄发送,专门发送,报刊发送,网上发送

? ?

3

当面发送 邮寄发送 专门发送 报刊发送 网上发送

调查范围 比较窄 比较广 比较窄 比较广 比较广

影响力 很大 比较小 比较大 很小 很小

样本代表性 控制力

很高 比价高 比较高 比较低 比较低

很大 比较小 比较大 很小 很小

回收率 很高 比较低 比较高 很低 比较高

有效性 很高 比较高 比较高 比较低 比较低

反馈时间 很快 比较慢 比较快 比较慢 很低

经济成本 很高 比较高 比较高 比较低 很低

人力成本 ? ? ? ?

很高 比较低 比较高 很低 很低

问卷的回收率:

收回的调查问卷数/发放出去的调查问卷数*100%=调查问卷回收率

有效回收率=回收的有效问卷/发放问卷=(回收问卷-无效问卷)/发放问卷

如果有效回收率在30%左右,资料只能作为参考,有效回收率在50%以上,可以采纳其中的部分建议,有效回收率达到70-75%,方可作为研究结论的依据。 ? 因此,一般要求问卷的有效回收率不应少于70%。 四、测量层次

? 1. 称名量表

? 是最低水平的一种量表,也称为命名量表、类别量表等,只是用数字带代表事物或

把事物归类。

? 这种量表的数字没有数量化的关系,只有区分性,不能相加、相减,没有顺序。 ? 例如给每个学生或每个被调查者编上号码,便于数据整理和分析,根据性别将学生

分为两类,用“0”代表女生,用“1”代表男生。 ? 2. 等级量表

? 比称名量表稍微精确些,也成顺序量表。

? 不仅能确定事物的类别,还能根据一定标准排列出事物及属性的顺序和等级。 ? 考试的名词、能力的等级、对事物的喜爱程度都属于等级量表。

? 如将某所学校办学质量高低的等级进行定量赋值:优秀3,良好2,一般1,较差0. 等级量表的有点在于它标志着事物之间的顺序关系,它所适用的统计方法,仅限于中位数、

4

百分位数,不能做加减乘除 ? 3. 等距量表

? 比顺序量表又进了一步,不但具有大小关系,而且一定数量的差异在整个量表的所

有部分都是相等的 。

? 比如在标准化教育考试中,标准分数80分与90分之间的差距,与70分与80分之

间的差距是相同的。

? 等距量表不能进行乘除运算,但可以进行加减运算。 ? 同时加减一个常数不会破坏原有数据间的关系。 ? 4.等比量表

? 最高水平的量表 加减乘除

? 例如甲的体重是80KG,乙为40KG,我们既可以说甲比乙重40KG,也可以说甲的体

重是乙的两倍。

? 教育研究中的调查较多使用的是称名量表和顺序量表。 五、抽样

? 抽样原则:

? 一般教育研究课题中的抽样调研要遵循随机化原则。所以随机化原则,即抽样完全

按随机的方式进行,总体中每一个研究对象被抽到的机会是均等的,即有同等被抽到的机会。这样抽取的样本就能很好地代表总体。 ? 1. 简单随机抽样 ? 抽签法和随机数字法

? 抽样法:把总体中的每一个个体都编上号码,并做成签,充分混合后从中随机抽取

一部分,这部分所对应的个体就组成一个样本。这是最普通的随机抽样方法。 ? 随机数字法:先给总体中的每个个体编上号码,然后参照随机数字表,从表中选取

任意一个起始数字,沿一定方向选取数字,选出号码所对应的个体就进入样本。 ? 例:从50人组成的班级中抽取10人作样本

? 步骤1:将50个学生从1到50编上随机号码,总体编号为50; ? 步骤2:从随机数字表中任意区域的任一数字开始往下数; ? 步骤3:就可以得出样本的号码。

5

简单随机抽样是最基本的抽样方法。但它十分费事,效率不高,适用于总体单位比较少的情况。在大规模的抽样中,要进行编号、抽签或者查随机数字表都是比较麻烦的。

? 此方法的另外一个重要缺陷就是,忽略了总体的结构信息,反而有可能降低样本的

代表性。 ? 2. 等距抽样

? 又称系统抽样或机械抽样,该方法是等间隔的随机抽样。它把总体所有个体按一定

顺序编号,然后按固定间隔取样,间隔的大小视所需样本容量与总体中个体数目的比率而定,起始数字随机决定。

? 例:调查某中学初三学生的职业兴趣,采取等距抽样 ? 步骤1:初一学生总体为300人,每个人随机编号; ? 步骤2:确定100人为样本量,则每2人为抽样间隔; ? 步骤3:每隔2人抽取1人,1、4、7、10……299,共100人;或3、6、9、12、……300,

共100人。

? 等距抽样使得样本分布更均与,但是,如果名单排列中存在周期性变化,则会造成

取样偏差。 ? 3. 分层抽样

? 把总体分成几个不同的部分或层次,然后从各种不同部分中随机抽取若干个体组成

样本。

? 如何分层,视总体的结构特征而定,基本原则是,层内差异要小,同质性要高,层

间差异要打,同质性要低。

? 例:调查本省初中学生性知识状况,采用分层抽样 ? 步骤1:首先按性别分为2层;

? 步骤2:再将全省初中学生按年级或年龄分为3层; ? 步骤3:再按社会经济发展水平,分为东、中、西3层; ? 步骤4:共分成2×2×3=18层

? 步骤5:采用简单随机抽样或者等距抽样,确定各层内个体样本。 ? 4.整群抽样

? 随机抽取群体为单位进入样本,这是一种简化了的分层抽样方法。

? 必须要了解各校学生的学习情况,可在哥学校随机抽取几个班级,进行调查 ? 但此方法在小范围内意义不大,对总体的代表性比较差 ? 5.非随机抽样

? 受课题研究条件所限,不能实现随机抽样 ? 缺点:随意性和盲目性

? 样本对于总体的代表程度,限制了将样本结论推广至样本范围之外的

可能

? 但是,其应用并不少 六、问卷的内容和结构

? 一般来讲,问卷由卷首语、指导语、问题、问题编码和结束语五部分组成。 ? 量表性问题组成的问卷都是封闭式问题,也不必包含结束语。 ? 网上问卷由于在后台解决了编码问题,一般只有四部分组成。 1. 卷首语

? 卷首语是写给调查对象的一封短信,主要是向被调查者简单介绍问卷调查的主要目

的、意义、内容以及研究者身份等。其作用主要体现在三个方面:一是建立被调查

6

?

? ? ? ? ? ? ? ? ? ?

者对研究者的信任关系,获取调查对象的理解、信任和支持;二是使调查对象了解问卷的目的、意义和内容,使其形成相应的心理预期;三是在一定程度上提高问卷的有效性和回收率。 卷首语的主要内容: 1. 问卷的目的和意义 2.问卷的内容

概括性的介绍问卷调查涉及的主要问题,通常用一句话陈述问卷希望了解调查对象关于哪个领域或哪些方面的态度。 3. 填写要求

请调查对象如实、客观地回答问题 4. 保密承诺 5. 感谢辞 6. 调查者身份

精炼有效的卷首语

完整全面的卷首语

7

2. 指导语

? 1. 总体指导语

? 一般在卷首语之中或之后,正式问题之前。可以举例说明,也可以用简单语言说明。 ? 2. 分类指导语

? 根据对不同题目和不同调查对象的特定要求,分布别提出不同的指导语。

? 一般放在一组相同类型的问题前面,如果有必要,一道题目也需要一条单独的指导

语。

卷首语中包含指导语

8

? ? ? ? ? ?

总体指导语

填写文件时请不要与别人商量。 不要再问卷或答题卡上写你的名字。

确保仔细阅读每个问题。只能使用发给你的铅笔,在答题卡上将相应答案的圆圈涂黑。请按调查员的指令做。

这里有一个如何填充答案的例子: 请这样涂黑答案的圆圈 不要这样 或这样

问题分类指导语

对问题中概念的解释

? 下面的问题是问关于身体攻击的。当一个人或几个人用武器(如棍棒、刀或枪)或

不用武器打另外一个时,就是身体攻击。而力气差不多的两个学生相互打闹嬉戏不算是身体攻击。

3. 问题

? 问题按照所涉及的内容分类,分为特征问题、行为问题和态度问题三类。 ? 1. 特征问题

? 主要用于了解调查对象的个人背景信息和基本情况,比如被调查者的性别、年龄、

民族、收入等。

? 一是用于对呗调查人群的社会特征分布作统计,描述参加问卷调查的由哪些人构成,

同时也用来分析调查样本对总体的代表性如何

? 二是分析具有不同社会特征的人对问题的不同态度和行为表现,比如,对不同年龄

段的调查对象进行分组,可以推断不同年龄段对某一问题是否存在统计学意义上的显著差异,进而分析形成这种差异的社会心理原因。

9

? ?

? ? ?

3. 态度问题

用来了解被调查者对事物的观点、看法、感觉、态度等主观性内容,与行为问题一起构成问卷的核心内容。在研究性问卷调查中,态度问题的比重相对更高。 ? 您对自己阅读课外书的状况总体上是否满意? ? A. 非常满意 B. 比较满意 C. 不满意 ? D. 比较不满意 E. 很不满意

? 您是否了解学校制定的读书计划?

? A. 非常了解 B. 知道一些 C. 听说过 D.不了解 您对改进学生阅读课外书状况的具体建议有哪些?

4. 问题的形式

10

2. 行为问题

用来了解被调查者的实际行为、学习生活和工作状况等客观型内容,行为问题在关于社会生活状况的问卷调查中占有绝对比重。

1. 封闭型问题

提出的问题包含若干选项,需要被调查者从中作出选择。可以选择一个答案,也可以选择多个答案。封闭型问题是问卷调查中最常见的问题形式。 ? 例:您每月的平均阅读课外书有多少本:

? A. 不读 B. 1-2本 C. 3-4本 D.5-6本 E.7本以上

? 您认为学校图书馆的质量如何?(1代表很好,5代表很不好) ? 藏书数量 1 2 3 4 5 ? 新书更新 1 2 3 4 5 ? 工作效率 1 2 3 4 5 ? 服务态度 1 2 3 4 5 ? 2. 半封闭型问题

? 主体还是封闭型问题,只不过在备选答案的最后增加了一个选项“其他”。当研究者

对问题答案的范围和数量不确定时,就需要使用半封闭型问题。 ? 半封闭型问题增加了数据整理和编码的难度。 ? 例:你主要通过何种途径阅读课外资料: A. 书 B. 杂志 C. 报纸 D.网络 E.其他

? 3. 开放型问题

? 由被调查者根据实际情况或主观感受自拟答案,此类问题的答案是开放性的,没有

统一标准。封闭型问题一般置于问卷的中间或最后。 ? 例:

? 您对当前教育乱收费现象的主要看法是什么? ? 您对此项调查的意见或建议有哪些? ? 您认为一位称职教师的标准是什么?

? 一般的常见问题中只使用少量开放型问题,主要是因为开放型问题填写起来费时、

费力,占用调查对象较多的时间,问卷的回收率肯定会受到影响。其次,开放型问题也不便于统计分析,第三,开放型问题的答案中还包含了许多与调查目无关的信息,称为无效信息。 5. 问题的编写 ? 1. 填空题

? 例:您的年龄( )周岁

? 您家庭月收入总额为( )元

? 您对班主任教学能力的总体评价是几分(满分为10分)?( ) ? 如果需要将被调查者的答案固定在几个确定 的范围内,可以将填空题改为单向选择

题。 ? 例: ? 您的年龄

? A. 20岁及以下 B. 21-30岁 C. 31-40岁 ? D.41-50岁 E.51岁及以上 ? 您家庭的实际月收入为

? A. 1000元及以下 B. 1001-2000元 ? C. 2001-3000元 D.3001-4000元 ? E.4001元及以上 ? 两项选择题:

? 就是二选一的问题。两项选择题属于典型的称名量表。主要用于搜集两种调查内容:

11

? ?

一是被调查者的特征资料,比如性别,是否具有某种特殊身份,二是被调查者的态度或行为资料,对特定事物的态度是肯定还是否定,是赞同还是反对。 ? 例:你是少先队员吗?A. 是 B. 否

? 你对教改方案的总体态度是 A. 赞同 B. 反对 ? 你是否参加过同学自发成立的读书团体? ? A. 是 B. 否 ? 多项选择题:

? 题干后面列出3个以上的选项,从中选择一项,即所谓的三选一、五选一,多选一。 ? 这是使用频率最高、应用范围最广泛,易于回答、便于统计的特点。 ? 例:

? 你对中学生参加“超女”类文娱节目的态度是: ? A. 支持 B. 不明确 C. 反对

? 你目前上网浏览最多的是哪类题材?(选1项)

①新闻类 ②文学类 ③体育类 ④科技类 ⑤娱乐类 ⑥旅游类 ⑦历史类 ⑧外语类 ⑨其他

? 多项多选题

? 在多个选项中选择两个以上的选项作为自己的答案。

? 例:在互联网上,你最感兴趣浏览的是哪些类题材(任选3项)? ? ①新闻类 ②文学类 ③体育类 ? ④科技类 ⑤娱乐类 ⑥旅游类 ? ⑦历史类 ⑧外语类 ⑨其他 ? 使用多项多选题的需要注意的一个问题,就是如何统计选项的选择率。多项多选题

的一个潜在前提是,被调查者所选择的几个选项都是同等重要的,即每个选项的权重都是相等的,因此可以将被选选项的数量直接相加。

? 统计时一般用有效样本数作为分母,比如100人参加了调查,用被选相同选项的数

量作为分子,比如有90人选择了①理论学习类,80人选择了②时事新闻类,70人选择了⑤体育类,这三个选项排在前三位,则选择率分别是90%、80%和70%。 ? 第二种算法是,用被选选项的总次数作分母,比如100人种共选择了300个选项,

可以用300作为分母,用被选相同选项的数量作分子,比如同样有90人选择了①理论学习类,80人选择了②时事新闻类,70人选择了⑤体育类,这时得到的比率就是每个选项的被选次数百分比。

? 两种统计结果的排列顺序是一样的,只不过后一种算法的比率值减小很多,并且各

选项的选择率之和额外100%。 ? 多项任选题

? 对被调查者选择的选项数量不加限制,可以由被调查者根据实际情况作出选择,可

以选一,也可以全选。 ? 例:

? 最近一周时间内,你在互联网上浏览过哪些类题材的网页(可任选)? ? ①新闻类 ②文学类 ③体育类 ④科技类 ⑤娱乐类 ⑥旅游类 ⑦历史类 ⑧外语类 ⑨其他 ? 排列式选择题:

? 在互联网上,你最感兴趣浏览的是哪些类题材的网页(请按感兴趣的程度选出前3

项,分别填在下面的括号内)?

? 最感兴趣的是( )次感兴趣的是( )

12

第三感兴趣的是( )

①新闻类 ②文学类 ③体育类 ④科技类 ⑤娱乐类 ⑥旅游类 ⑦历史类 ⑧外语类 ⑨其他

您为孩子择校时,最看重哪些因素(请按重要性程度将全部选项排除顺序,将所选数字填写在每个选项后面的括号内)

? 最重要 最不重要 ? 9 8 7 6 5 4 3 2 1 ? ①办学水平( ) ②地理位置( ) ? ③硬件环境( ) ④升学率( ) ? ⑤素质教育( ) ⑥学校知名度( )

? ⑦学习费用( ) ⑧孩子的适应性 ( ) ⑨其他: ( ) 6. 问题编写时容易出现的问题 ? 1. 问题指向不明确

? 您认为盲校学生的生活状况如何?

? A. 很好 B. 一般 C. 不好 D. 说不清 ? 2.问题中包含双重问题

? 您认为盲校学生的学习和身体状况如何? ? A. 很好 B. 一般 C. 不好 D. 说不清 ? 您认为盲校学生的身体状况如何?

? A. 很好 B. 一般 C. 不好 D. 说不清 ? 3. 问题中包含抽象概念

? 您认为当前中学的教学体系是否适合社会发展的需要? ? A. 很适合 B. 适合 C. 不适合 D. 很不适合 ? 4.问题范围不加限定 ? 您上网的平均时间是:

? A. 1小时以下 B. 1-3小时 C. 4-6小时 ? D. 7-10小时 E. 11小时以上 ? 5. 问题中包含专业术语

? 以下问题是关于“欺负”的。欺负就是一个学生或几个学生对另一个学生说或做令

其讨厌或不愉快的事情,或一个同学被他人用不礼貌的方式取笑、逗乐或被他人有目的地抛掷物品。当力量相当的两个学生发生争执或搏斗时,或以善意和有趣的方式开玩笑时,不是欺负。

? 在过去15天里,你有多少天受到同学欺负?

? A. 0天 B. 1-2天 C. 3-5天 D. 6-9天 E. 10-15天 ? F. 每天都受欺负

? 6. 问题不能带有倾向性

? 许多人认为中学生不宜早恋,您同意这种观点吗? ? A. 同意 B. 不同意 C. 说不清

? 中学生早恋会对学习产生不利影响,您认为是吗? ? A. 是 B. 不是C. 说不清 ? 7.与问题内容逻辑衔接 ? 您担心孩子经常上网吗?

? A. 浏览不健康网站 B. 耽误学习时间 ? C. 影响视力健康 D. 上网费用偏高

? ? ? ?

13

8. 内容维度要单一 你感到数学老师讲课

A. 太慢,太简单 B. 太快,太深 C. 不快也不慢,适合我 9. 选项之间互相独立

你平均每月可支配的“零花钱”为 A. 100元以下 B. 100-200元 C. 200-300元 D. 300-400元 E. 400元以上

10. 避免使用不确切的词语

尽量不使用“经常,有时,偶尔,极少,很多,较多,很少,几乎没有” 40%的被调查者课后“经常”上网 30%的被调查者课后“有时”上网 20%的被调查者课后“偶尔”上网 10%的被调查者课后“很少”上网

改变这种情况的方法是变虚为实,用确切的量词来代替不确切的词。下面经过量化后的选项统计结果就比较有价值:

? 40%的被调查者课后的上网时间在“1小时以内” ? 30%的被调查者课后的上网时间在“1-2小时之间” ? 20%的被调查者课后的上网时间在“3-4小时之间” ? 10%的被调查者课后的上网时间在“5小时以上” 7. 题目的质量分析

? 1. 题目的回答率

? 回答率是评估问卷资料有效性的一个基本参数。题目的回答率通常用调查有效样本

中实际回答某题的人数占应该回答该题人数的百分比来表示。用公式可以表示为: ?

该题目实际回答人数? 题目的回答率=

该题目应该回答人数

? 例:在一项关于中学生压力情况的调查中,有如下一道题目: ? 请问,最近两周内,你是否出现过失眠现象? ? A. 出现过 B. 未出现过

? 已知共有100位中学生参加该项调查,而只有80人作了回答,求此题的回答率。 ? 因而可得到此题目的回答率80% ? 题目的回答率是一个重要指标,如果某项题目的回答率过低,会导致此题目的无效。 ? 在上例中,在100位学生中,80人对题目作了回答,20人未对该题目作答。假设在

这80人中,有40人选A,40人选B。对没有作答的20人,选A还是选B情况,我们不知道。按极端宣发,题目可能全部选择A,也有可能全部选择B。由于这20位未作答者,题目X的调查结果可能会出现误差。20位未作答者,选择A的人数可能有0-20人,选择B的人数可能有0-20人,具体如下表所示。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

?

14

从上表可以看出,若100位学生全都回答,选择A的人数最多不超过60%,最少不低于40%。选项A的真值范围为40-60人。

对于该题目,在“回答者中有50%的人选择A”这一假设条件不变的情况下,对于题目不同的回答率,选项A真值的可能范围如下表所示:

从图中可以看出:题目的回答率越高,调查结果的真值范围越窄,调查的误差越小;而题目的回答率越低,调查结果的真值范围越宽,调查的误差越大。

进一步分析,可发现调查结果选项真值的误差范围(真值上限与真值下限之差)与题目的回答率之间有如下关系:

调查结果真值的误差范围内=1-题目的回答率

若题目的回答率为30%,则调查结果真值的误差范围(真值上限85%-真值下限15%)=1-30%=70% ? ?

?

对100位中学生的压力情况进行调查,在第一轮调查中,只有80人作了回答,现从第一轮20位未回答者中选择12位做了补救调查,其中,有10位作了回答,根据公式,调整后题目X的回答率为: 96.67%

题目回答率的修正方法

由于某些客观原因,被调查者没能对某些题目进行回答,这时,可以采取对回答者进行重新调查的方法进行补救,并用下列公式进行修正:

?

2.题目的难度

? 问卷题目的难易程度。

? 称名类题目不能计算题目难度

? 等级类、等距类和等比类题目可以计算难度

? 由于问卷题目的记分方法有0-1计分和非0-1计分,所以,题目的难度计算方法也

分为0-1计分和非0-1计分。 ? 0-1计分题目难度的估计: ? (1)直接计算法

? 题目的难度用所有被调查者在该题目上的答对率来表示。用公式表示为:

15

P=

? ? ? ? ? ?

P表示某题目的难度指数 R表示该题目答对的人数 N表示被调查的总人数

某研究小组对1000名高三学生的“聪慧性”进行调查,其中有如下两道题目:

? ? ? ?

其正确答案为B和C.

经调查,对题目1,在1000名高三学生中,选A的有200人,选B的有700人,选C的有90人,没有选择的有10人;对于题目2,在1000名高三学生中,选A的有120人,选B的有10人,选C的有680人,选D 的有190人。

将有关数据代入公式,可得到题目1和题目2的难度指数分别为:0.70,0.68 (2)分组计算法

Kelldy于1939年提出了另一种估计0-1计分题目难度的方法。

将所有被调查者在所有项目上的总分按照由高到低顺序排列,取得分最高的27%和得分最低的27%分别形成高分组和低分组,然后以高分组和低分组某题目答对人数比率的平均数作为该题目的难度指数,用公式表示为:

? ? ?

? ?

PH表示高分组某题目答对的人数比率 PL表示低分组某题目答对的人数比率

用瑞文标准量表调查740名高中学生的智力水平,将成绩最高的27%(200人)定位高分组,成绩最低的27%(200人)定位低分组。对于某道题,高分组200人中有180人答对,低分组200人中有80人答对,则 PH=180 ÷200=0.9 PL =80÷200=0.4

16

? ? ? ?

?

?

代入公式,得到该题目的难度系数为:0.65 (3)0-1计分题目的难度校正

对问卷的选择题,选择正确答案的比率有可能受猜测机率的影响,从而使答对该题的人数增加,增大题目的难度指数。

例如前面的两道选择题,若被调查者不会作答,那么他就有可能进行猜测,因而,题目1中选择正确答案的B的700人中有可能有部分人是凭借猜测而选中的,该题目难度指数P为0.70也就不能完全代表题目1的真实难度系数。同样,题目2选择正确答案C的680人中有可能存在猜测因素,该题目难度指数P为0.68也就不能完全代表题目2的真实难度系数。

对题目进行猜测成功的机率与题目所提供的备选项的数量多少有关。备选项目越少,猜测成功的机率越大,难度受猜测机遇因素的影响也就越大。备选项目越多,猜测成功的机率越低,难度受猜测机遇因素的影响也就越小。

为了克服多重选择题中猜测机遇因素对题目难度指数的影响,可采用下列公式对题目的难度指数进行校正:

? CP表示校正猜测机遇之后的某题目的难度指数 ? P表示未小郑猜测机遇的某题目的难度指数 ? K表示某题目的被选项的数目。

? 例如上题,题目1,K1=3,P1=0.70,题目2,K2=4,P2=0.68,讲有关数据代入公式,可得

到两题目的校正后的难度指数分别为: 0.55 0.57 ? 2. 对非0-1计分题目难度的估计

? 非0-1计分题目的难度等于所有被调查者在该题目上的平均得分与该题目满分的比

率。用公式表示为: ? X 表示所有被调查者在该题目上的平均得分 ? Xmax表示该题目的满分

? “中国独生子女人格发展”课题组在1996年9月至10月中旬通过问卷对全国12个城

市的独生子女及其家长进行了中国独生子女人格发展现状调查,经统计,儿童《自我接纳量表》的12道题目的平均得分如图所示,求题目的难度。

17

题目难度的使用与评价

? 要对题目的难度进行评价,首先要弄清题目的方差与其难度之间的关系。题目的方

差σ 2与题目难度P之间的关系可用公式表示: ? σ2=P(1-P)

? 从中可以看出,题目的方差σ2的范围是[0,0.25]。当P=0或1时, σ2最小为0。当

P=0.5时,题目的方差σ2最大为0.25.。

? 题目方差的大小是反映题目鉴别能力高低的指标,题目的方差越大,题目的鉴别能

力就越强;题目的方差越小,题目的鉴别能力就越弱。当题目的难度为0.5时,题目的鉴别能力最高。

? 题目的取值范围是[0,1],如果一个题目的难度指数P=0,说明该题目太难,没有一

个人答对,如果P=1,说明该题目太容易。 P=0或P=1的题目一般要被排除掉。 ? 一般问卷的难度指数分布0.35-0.65之间比较合适,而且,整个问卷的难度指数平均

在0.5左右为最好。 3. 题目的区分度

? 题目的区分度也称为题目的鉴别力,它是指题目对于不同水平的被调查者反应的区

分程度和鉴别能力。若题目的区分度高,则水平高,能力强的被调查者得分高;水平低、能力弱的被调查者得分低。若题目的区分度低,则水平高的不一定会得高分,水平低的不一定会得低分。 ? 1. 0-1计分题目区分度的估计 ? (1)分组法

? 用高分组答对该题的人数比率与低分组答对该题的人数比率之差来表示 ? ? ? ?

? 用瑞文标准量表调查740名高中学生的智力水平。对于某道题,高分组200人又180

人答对,低分组200人有100人答对,则该题目的区分度: ? 0.4

? (2)点二列相关法

? 对于单个题目答对记1分,答错记0分的问卷,各题目的总分是连续变量。题目与

总分之间的关系可以用点二列相关来表示。

18

例如,20个学生参加语文测验的总分以及在一个选择题上的得分如表所示。试计算选择题的区分度。

由上表数据可知:

X?(86?72?65?83?80?75?76?62?91?74?81)?11?76.82p

Xq?(52?94?22?76?73?47?88?82?58)?9?63.56 p?11?20?0.55q?9?20?0.45

22 X2?X?1059471417????St ???????16.66??N20?20??N?

76.82?63.56rpq??0.55?0.45?0.396 16.66??? ? ?

用SPSS计算:

analyze——correlate——bivariate

用一份《中学生人文素质调查问卷》去对500名学生进行调查,下表是15位同学在人文素质历史知识部分10道题目上的得分情况(正确得1分,错误得0分)

19

? ? ? ? ? ? ?

R表示积差相关系数

X表示所有被调查人员在某题上的得分 Y 表示所有被调查人员问卷总分 N表示被调查人员总数

《数学课态度量表》区分度的计算

20

2. 非0-1计分题目区分度估计

由于题目分数和总分分数均为正态连续变量,非0-1计分题目的区分度,可以用被调查人员在某题上的得分与其总分之间的积差相关来表示。 (1)用原始数据计算

本文来源:https://www.bwwdw.com/article/97er.html

Top