测量心理学复习

更新时间:2024-05-03 21:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 心理测验总论

1、心理测量的定义:心理测量是依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。 心理测量与心理测验的区别:心理测验,是了解人心理的工具,主要在“名词”意义上使用; 心理测量,则是运用测验为工具,达到了解人类心理的实践活动,它主要在“动词”意义上使用。 因此,心理测量的意义范围更广一些。 2、测验的特性(选择):

间接性:心理测量不同于物理测量,无法直接测量人的内在的心理特质。

相对性:测量结果没有绝对的标准,只有一个相对的位置信息。必须有一个参照点。分为常模参照和标准参照。

客观性:测验不受主试支配,其测量方法是可以重复的。 3、心理测验的种类(理解)

答:(一)按测验功能分类(重要):

能力测验:分为普通能力测验和特殊能力能力,前者即智力测验,后者多用于音乐、美术等特殊才能;

成就测验:测量个人或团体经过某种正式教育或训练之后对知识和技能掌握的程度,最常见的是学校中的学科测验; 人格测验:测量个性心理特征,如性格、气质等。 (二)按测验对象分类:个别测验和团体测验

(三)按测验方式分类:纸笔测验、操作测验、口头测验和电脑测验

(四)按测验目的分类:描述性测验、诊断性测验、预示性测验 (五)按测验难度分类:速度测验、难度测验

(六)按测验要求分类:最高作为测验、典型作为测验 (七)按测验性质分类:构造性测验、投射性测验 (八)按测验解释分类:常模参照测验、标准参照测验 (九)按测验应用分类:教育测验、职业测验、临床测验 第二章 心理测验的编制

1、测验用途:描述、诊断、选拔和预示

2、编造复本(复本指具有两个或两个等值但是测题不同的测验): 答:(1)有足够数量的题目,按难度排:1、2、3、4、5?? (2)分成两个等值的测验本:(三个等值的如此类推) A本:1、4、5、8、9、12、13?? B本:2、3、6、7、10、11、14?? 3、测验使用的标准化的环节

答:测验标准化包括测验编制的标准化和测验使用的标准化两方面。测验使用的标准化又可分为施测过程标准化、评分计分标准化、分数解释标准化三个环节。

(一)施测过程 :1. 指导语 2. 时限 (二)评分、记分

对于客观题:评分和记分都是客观的;

对于主观题:多个评分者之间的一致性需要检验。 (三)分数解释

心理测验分数的解释,必须与某参照点比较才有意义。参照点有常模参照和标准参照两种。因此分数解释的标准化在于建立常模或标准的标准化。 4、测验的项目分析

答:测验的项目分析包括定性分析和定量分析。定性分析是依靠测验编制者丰富的经验和所受的训练,对项目的内容和形式是否得当

进行分析;定量分析是指对项目难度和区分度等进行分析。 5、项目的难度

答:难度有相对性,难度就是指测验项目的难易程度。取值范围0~1。

6、难度估计的方法(计算):

答:(1) 二分法记分项目难度的计算及矫正:

对于是非题、选择题等采用0和1进行二分法记分的项目,难度通常使用通过率来表示。

P=R/N P:项目的通过率;

R:答对该题的或通过该项目的人数;

N:全体被试人数;

P值越大,难度越小;P值越小,难度越大。P的取值范围是0到1。

当人数较多时,我们也可以使用极端分组法。先根据被试的测验总分由高到低排序,然后将总分最高的27%和最低的27%的被试定为高分组和低分组,分别计算两组在某一项目上的通过率,最后用下列公式计算难度:

P=(PH+PL)/2

其中PH、PL分别为高分组和低分组的通过率。 对于采用二分法记分的选择题,为了平衡机遇对难度的影响,可采用下面的公式进行矫正:

CP=(KP-1)/(K-1)

CP:矫正后的通过率;P为实得通过率;K为备选答案数目。 (2)不采用二分法记分的项目(论述题)

(3)测验整体难度水平的测定 7、项目的区分度

答:区分度是指测验项目对被试的心理特性的区分能力。区分度的作用:使水平高的被试能够通过该项目,并且使水平低的被试无法通过该项目。区分度的取值范围:-1到+1。 8、计算区分度的方法 (一)鉴别指数法

(二)相关法:鉴别指数(D)为0.40以上,项目评价很好;0.19以下,项目评价差,必须淘汰。 1. 对于采用二分法记分的项目: (1)二列相关 (2)点二列相关

* 二列相关与点二列相关的区别:二列相关适用于两个连续变量,但其中一个变量被人为划分为两类。点二列相关系数,要求一个变量是连续变量,另一个变量真正的二分变量(非人为划分)。 * 考验点二列相关是否显著与考验积差相关系数的显著性相同。用t检验的方法比较与二分变量对偶的两组连续变量的平均数的差异是否显著,如果平均数的差异显著,则相关系数也显著。 2. 对于不采用二分法记分的项目: (3)积差相关 9、区分度与难度的关系

答:当难度越接近1或0时,项目的区分度就越小;

当难度越接近0.5时,项目的区分度就越大。

项目难度的分布以正态为主,越接近中等难度的项目越多,而所有项目的平均难度为0.50

第三章 测量的误差及其检验(重点) 测量的误差、信度、效度为经典测量理论 1、误差

误差是在测量中与目的无关的因素所产生的不准确的或不一致的结果。 (1)误差由无关变量所致 (2)误差表现为不准确或不一致两种方式 (3)误差不一定是错误 6、稳定性系数:重测信度反映测验跨时间的稳定性,又称为稳定性系数。

等值性系数:复本信度反映的是两个测验之间的等值程度,因此又称为等值性系数。 7、估计信度的方法(重点): 信度系数 估计方法 应用 稳定性系数 重测法(积差相关) 人格、速度测验 等值性系数 复本法(积差相关) 智力、学绩、速度2、随机误差与系统误差

随机误差:由与测量目的无关的、偶然的因素引起而且不容易控制的误差。系统误差只影响测量的准确性,不影响稳定性。 系统误差:由测量目的无关的引起的一种恒定而有规律的误差 。随机误差既影响准确性又影响稳定性。 3、误差的来源

答:常见的误差来源主要有三个方面:测验自身、施测过程、受测者。

(一)测验自身:测量工具,主要来源于测验的编制过程,项目取样影响最大。题目类型:如是非题容易猜测;项目用词模糊、叙述不清

(二)施测过程:测验环境、测验时间、主试因素、意外干扰、评分记分

(三)受测者:测量对象:应试动机、测验焦虑、测验经验、练习效应、反应倾向、生理变因 4、真分数

答:真分数的定义:指在测量没有误差时所得到的真值。

实测分数定义:测量的分数称作该特质的观测分数或观察分数(Observed score),也叫实测分数。

(1)经典测量理论的基本假设:把任何一个测验成绩都看做是真分数和测量误差的和。

X = T + E observed score true score error

观测分数 真分数 随机

误差

E可能是正值也可能是负值,因此观测分数可能大于真分数也可能小于真分数。

(2)根据经典测量理论的基本假设(真分数假设和平行测验假设),我们可以推导出如下关系:

SX2=ST2+SE2

其中S是变异数,表示分数的变异性或变异大小。

(3)真变异数还可以分成两个部分:与测量目的有关的变异和与测量目的无关的变异:

ST2=SV2+SI2

(4)将前面两个公式合并(重要),得到: 一组测验分数的变异性是由与测量目的有关的变异数稳定的但出自无关来源的变异数和随机误差变异数所决定的。

SX2= ST2+ SV2+SI2

5、信度的定义:是指测量结果的一致性或稳定性。信度的大小用信度系数来表示。

等值稳定性系数 复本重测法(积差相关) 智力、学绩、人格1. 分半法(积差相关,斯皮 内部一致性系数 尔曼——布朗公式校正) 2. 库德——理查森公式 人格、学绩、智力3. α系数(克伦巴赫系数) 评分者信度系数 1. 斯皮尔曼等级相关法 2. 肯德尔和谐系数 作文、创造、投射(1)重测信度:用同一测验,对同一组被试进行前后两次施测,所得相关系数就叫重测信度。需要施测两次才能求得信度。 (2)复本信度:也称为平行测验信度。对一组被试用两个复本测验(平行测验)施测,计算积差相关系数,就是复本信度。需要施测两次才能求得信度。

(3)分半信度:实施一次测验后,将测验分为等值的两半,分别计算被试在两半测验上的得分,再计算其相关系数,此相关系数就代表了两半测验在内容取样上的一致性程度。

(4)同质性信度:同质类信度也称内部一致性,是指测验内部所有题目间的一致性。

(5)评分者信度:如果有两个评分者, Spearman等级相关系数;如果有多个评分者,需计算肯德尔和谐系数(Kendall W系数)。 8、连续变量、分类变量和数据分布:Pearson、Kendall tau-b和Spearman系数:

等间距连续变量:等距数据,当两个变量数据都服从正太分布时,可以进行所有参数检验(Pearson);

非等间距连续变量:连续等级数据,当变量数据分布正态时,可以使用Pearson系数,当不满足正态分布应该使用非参数检验(Spearman);

当数据是分类变量时,数据是离散分布,使用Kendall tau-b系数。 9、信度与误差变异的关系(ppt复习计算) 信度系数类型 误差变异来源 再测信度 时间取样 复本信度(连续施测) 内容取样 复本信度(间隔施测) 分半信度 评分者信度

10、信度系数的用途:

时间与内容取样 内容取样 评分者间的差异 答:(1)专家判断法:也叫逻辑效度,专家对测验项目与所涉及的内容范围进行符合性判断,看题目是否代表了规定的内容。这是一种定性分析的方法。 专家判断法具体方法步骤如下: ①定义好内容总体,并描绘出有关知识与技能的轮廓; ②划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详细的描述;

③确定每道题所测的知识与技能,将自己的分类与测验编制者的纲目作比较; ④制订评定量表,从各方面对测验作出评定。 (2)复本法:相关 答:两个主要用途,一是用来评价测验,二是用来对分数作解释。 (一)评价测验: 信度系数用于评价测验 典型信度系数 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 (二)解释分数:

测验类型 能力、智力、成就 人格测验和态度、兴 趣等一些等级量表 课堂测验 投射测验 解释 (3)再测法:差异检验 15、确定构想效度的方法 答:(1)测验内法 (4)经验法:通过率 测量误差几乎没有影响 高到中等的信度 要是通过研究测验内部结构,如测验的内容以及题目间的关系等来分析测验的构想效度。 中到低的信度 A. 确定测验的内容效度:定性 低信度 B.分析被试对项目作反应的过程:定性 C. 考查测验的同质性:定量。相关法 (2)测验间法 A. 相容效度:又称求同效度。确定构想效度的最简单的方法是计算被试在新旧两个同类测验上的分数之间的相关。(定量)

真分数和误差对测验 B. 区分效度:一个有效的测验不仅应与其他测量同一构想的测验分数有同等影响 有较高的相关,而且还应与测量不同构想的测验具有较低的相关,用此种方法确定的效度叫区分效度。(定量)

C. 因素效度:建立构想效度最为常用的方法是,通过对一组测验进行因素分析,找到影响测验分数的共同因素,每个测验在共同因素上的负荷量即每个测验与共同因素的相关,称做测验的因素效度。(定量)

(3)效标关联法(定量) (4)实验操作法(定量) 16、预测效度与同时效度

答:根据搜集效标的时间,可以将效标效度分为预测效度和同时效度。

同时效度:效标资料是与测验分数同时搜集的;

预测效度:预测效度的效标资料需要过一段时间才可以搜集到。 17、因素分析的过程:

答:1.因素抽取:有三种方法,主成分法、主轴因子法、极大似然法。

2.因素旋转:抽取公因子后,绝大多数变量在第一个因子上肯定都有显著的负荷,其后的因子负荷的变量都很少,这很不便于解释。这时需要改变因子轴的位置,重新分配各因子所解释的方差比例,从而得到易于解释的“简单结构”,这个过程就称为因素旋转。

因子负荷:各因子的系数值,反映因子和各变量间的密切程度。 18、效标效度的估计方法:最常用为相关法,常用积差相关法、等级相关法、二列相关法。 19、效标分数的预测:p61 20、回归分析的步骤、概念:

答:(1)绘制散点图:以因变量(总产量)为Y轴,以其中一个自变量为X轴,画出所有自变量和因变量的简单散点图。

通过散点图可以观察:

根据标准误(SE),我们可以根据每个人的实际测量分数估计出真分数可能范围(置信区间),一般采用95%和99%两种置信水

平——区间估计:X—1.96SE< T < X+1.96SE

X—2.58SE< T < X+2.58SE

SE=SX 1-rxx

SE为标准误,SX为所得分数的标准差,rxx为测验的信度。 11、影响信度的因素(简答或选择)

答:(一)被试的样本:1. 样本团体异质性(公式,理解字母含义)2. 样本团体平均能力水平

(二)测验的长度:当测验越长(项目数越多),信度值也越高。 (三)测验的难度:测验难度对信度估计没有直接影响,不能用公式直接进行估计。通常选择0.5左右的难度水平,使测验分数分布达到最广,从而提高效度。

可信的测验未必有效,而有效的测验必定可信。因此信度是效度的必要条件。

12、效度的定义:是指测量的有效性,即一个测验对它所要测量的特质准确测量的程度。

测验对所要测量的特质准确测量的程度有两层含义:测验能不能测到它要测的东西;测验对它的测量对象测量到什么程度。 13、效度的分类:分为内容效度、构想效度和效标效度

内容效度:指测验题目对所要测量的内容范围的代表性程度。实际上是说题目取样的代表性问题。

构想效度:指测验对理论上的构想或特质的测量程度。构想效度也称为结构效度。

效标效度:也称为准则关联效度、效标关联效度、实证效度、统计效度,考查测验分数与效标的一致性程度。 14、确定内容效度的方法

1. 因变量和自变量的相关程度(结合积差相关矩阵观察) 2. 直线或曲线回归 3. 是否存在异常值

(2)考察数据分布:正态性(所有参数检验要求各个变量应符合正态分布,先绘制带正态曲线的直方图初步观察是否是正态分布,然后再通过偏度(skewness)和峰度(Kurtosis)来判断是否正态分布)、方差齐(所有参数检验要求各个变量的方差齐性,方差齐性检验)

(3)进行回归分析:求解回归方程、相关统计量。检验回归方程是否显著,若F检验显著,则回归方程有统计学意义。 (4)残差分析:残差独立与否,残差分布正态与否,标准残差的绝对值的最大值不大于3

(5)共线性判断强影响点诊断:强影响点共线性,发现强影响点,可采取去除强影响点等方法。 21、影响效度的因素:

答:(一)测验本身:(1)项目质量(2)项目数量:即测验长度 (二)测验的实施:在施测时不遵照指导语,被试作弊,测试环境太差,评分标准不客观,记分错误等都会影响测验的效度。 (三)被试:(1)身心状态(2)样本特点 (四)效标

22、效度与信度的关系:

信度是效度的一个必要的前提,没有信度,效度不可能单独存在。信度是为效度服务的,因而效度是信度的目的;效度不能脱离信度单独存在,所以信度是效度的基础。

第四章 分数的合成与解释

1、分数转换:将测验的原始分数转换为可以相互比较的导出分数,是建立常模的一个必要步骤。分数转换是针对一个测验,在测验内部进行。

分数合成:既可以在一个测验内部进行,也可以在不同的测验进行分数合成。

2、分数合成的层次或者类型:

项目的合成:如瑞文推理测验直接将所有项目分数求和; 分测验或量表的组合:如韦氏成人智力量表是将三个分测验分数求和。

测验或预测源的组合:如科研30%+面试30%+笔试40%。 3、组合变量的方法(看)

答:(一)临床判断——直觉合成:临床诊断是一种根据直觉的经验,主观地将各种因素加权而获得结论或预测的方法。

(二)推理方法:包括单位加权、等量加权、差异加权三种方法。由于推理方法都是先加权然后再求和,所以又称为加权求和法。 (1)单位加权:是最简单的推理方法。即将各个变量(题目、分测验或测验)直接相加而得一个合成分。(与其他加权的区别) (2)等量加权:相对于单位加权法,等量加权法是真正等量加权。将所有分数转换成标准分数,然后再求和。等量加权只适用于各个变量对预测效标具有同等重要性或者各变量离散程度差异较大(单位加权不适用)时。

(3)差异加权:通常情况下,各个变量对预测效标的作用是不同的,因此需要根据各个变量与效标之间的经验关系来作差异加权。差异加权通常使用多重回归法来进行计算。

(三)多重分段:把人分成达到最低标准(接受)与未达到最低

标准(拒绝)两类,而不在这两组人内部作进一步区分。(记) (四)多重回归:一个预测源加入合成体后所增加的R值,叫渐进效度。

(五)合成分数的特殊方法:完形计分、轮廓分析(MMPI剖面图)

4、各种组合方法的比较(了解)

(一)应用范围:预测和描述;选人、安置、描述 (二)资料特征:输入资料的种类、输出资料的方式 (三)效度:合成体的效度、元素的效度、效度的比较

5、分数的解释包括两个方面的问题:一是如何使分数具有意义;二是如何将有意义的信息传达给当事人。

6、原始分数:直接从测验上得到的分数叫做原始分数; 导出分数:通过统计方法由原始分数转化到量表上的分数叫做导出分数。

7、导出分数的分类:根据解释分数时的参照标准不同,可以将导出分数分为常模参照分数和标准参照分数。

用来作比较的参考团体叫常模团体,常模团体的分数分布叫常模。

常模分类:根据参照的是已达到的发展水平还是某团体中的相对位置,常模就可划分为发展常模和团体内常模两大类型。

发展常模:将个体测验成绩与各种发展水平的人的成绩相比较,来说明该个体发展,包括年龄常模、年级常模和顺序常模;

团体内常模:也称作组内常模,通常是根据标准化被试样组的测验分数、经过统计处理而建立起来的、具有参照点和单位的测验量表。包括百分等级常模与标准分数常模。 8、常模参照分数的解释: 答:发展常模(发展量表):

(1)年龄常模(年龄量表)——智龄

一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄——智力年龄,即智龄。

(2)年级当量:所谓年级当量,也称年级常模,是把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。 (3)顺序量表

(4)比率智商:包括智商(智龄表示心理发展的水平,它是一个绝对的量数,而智商则表示心理发展的速率,是一个相对的量数)、教育商数(教龄指某个年龄的儿童所取得的平均教育成就)、成就商数(将一个学生的教育成就或学业成绩与同等智力的学生比较) 团体内常模 (1)百分等级

百分等级的计算方法:PR=(i/N)×100

(小于或 等于该分数的个数,记为i)

(2)标准分数:

A、线性转换的标准分数:就是根据标准分数的定义得来的Z分数:

Z分数的性质:1、Z分数是以原始分数的平均数为零点,以标准差为单位来表示的,因为它只有相等单位没有绝对零点,所以属等距量表,可以作一般代数运算;

2、Z分数的绝对值表示某一原始分数与平均数的距离,Z分数的正负号则表示原始分数是落在平均数之上还是平均数之下;

3、Z分数的分布形状与原始分数相同,原始分数所能进行的计算,Z分数也能进行,并且结果没有丝毫失真;

4、假如原始分数的分布是常态的,则Z分数的范围大致是从-3到+3。

B、常态化转换的标准分数 常态化转换的方法:先把原始分数转化为百分等级,然后从正态曲线面积表中查得对应的标准分数。

适用条件:所测特质分数在总体上为常态分布,由于取样误差或测验本身问题而导致了原始分数的分布稍有偏斜。 C、T分数:T=50+10z

D、离差智商(韦克斯勒智力量表):IQ=100+15z

离差智商是将一个人的测验分数与同年龄组的人比较所得到的标准分数,已经没有商数的意义。 E、标准九: 5+2z F、标准十:5.5+2z

G、GRE/CEEB分数 : 500+100z 9、标准分数的优缺点

答:优点:(1)用等距量表来表示测验分数,使进一步统计分析成为可能;(2)常态化标准分数可参照常态曲线面积表直接转换成百分等级,因而容易解释;(3)允许将几个测验或量表上的分数作直接的比较。

缺点:(1)由于统计上较复杂,不像百分等级那样为一般人所熟悉;(2)在实际应用时,通常只以标准分数来表达,而没区分是常态化的还是线性转化的分数;(3)常态化标准分数是人为使分数呈常态分布,当所测特质的分数在实际上不是常态时,便扭曲了分布的形状。 第六章 智能测验

1、1905年,比奈和助手西蒙发表了第一个心理取向的智力测验——比奈-西蒙量表。(比奈-西蒙量表和韦氏量表是个别测验) 2、什么是离差智商?

答:离差智商是将一个人在智力测验上的成绩和同年龄组的平均成绩比较而得到的一个相对分数。 3、智力水平的表示方法

答:以通过智力测验项目的多少表示智力水平的高低;

以智力年龄表示水平的高低;

以心智商数的大小表示智力水平的高低; 以智力商数的大小表示智力水平的高低; 以离差智商表示智力的相对水平。 4、陆军甲种测验是第一个团体智力测验。 第七章 人格测验 1、人格测验的编制方法

答:(一)合理建构法:该方法要求在某种人格理论指导下确定所要探讨的个性特征的结构并据此编制测验,故又称推理法。例如,爱德华个性偏好量表(EPPS)。

(二)经验标准法:用这种方法编制测验不是从某种理论出发,而是完全依据经验来选择题目。例如,明尼苏达多相人格问卷(MMPI)。

(三)因素分析法:依据因素分析的统计结果来选取题目,例如卡特尔16PF人格因素问卷(16PF)。

(四)综合技术:将以上三种技术综合利用。先根据理论构想编制和搜集题目,然后筛选题目,最后对题目做因素分析。例如,

杰克逊人格问卷(JPI)。

2、人格测验的类型

答:(一)自陈量表:自陈量表是依据所测量的人格特征编制客观问题,要求被试根据自己的实际情况或感受去逐一回答,以此衡量个人的性格特征。

(二)评定量表:评定量表通常由一组描述个体特征或特质的词或句子组成,要求由他人经过观察对某个人的某种行为或特质作出评价。

(三)投射测验:投射测验是一种特殊的人格测评技术。投射技术是向被试提供一些未经组织的刺激情境,让被试在不受限制的情境下,自由表现他的反应。主试分析反应的结果,便可推断被试的人格特征。

3、投射测验的分类

答:(1)联想法:荣格的文字联想测验和罗夏墨迹测验 (2)构造法:莫瑞编制的主题统觉测验 (3)完成法:语句完成测验 (4)表露法:画树测验

4、量表缩写:

答:瑞文标准推理测验 SPM

明尼苏达多相人格问卷 MMPI 卡特尔16种人格因素问卷 16PF 艾森克人格问卷 EPQ 爱德华个性偏好问卷 EPPS

加州心理问卷(青年性格问卷) CPI 詹金斯活动性调查表 JAS 主题统觉测验 TAT 大五人格测试问卷 NEO 房树人绘画心理测验 HTP

5、什么是能力?能力是指个体顺利完成某项活动所必须具备的心理特征的综合。

一般能力倾向/性向测验:一般能力倾向测验正好相反,它不追求总的得分,而是各个能力倾向的具体强弱分数,可以得到智能的详细剖面图。主要用于职业中的人才选拔与分类。

智力测验:智力测验一般得到一个智商总分,早期智力测验的研究者希望通过广泛的心理功能,从而得到个体智力的总体水平。主要是日常生活中或者学校评估个体的智力水平。

6、多重能力倾向测验

答:多重能力倾向测验可以说是多种能力倾向测验的复合体,包含

这几个不同性质的分测验。它在理论上是以多因论为依据,以因素分析为基础。

本文来源:https://www.bwwdw.com/article/ceig.html

Top