自学考试--心理测量与评估
第一章 绪论
一、测量活动结构:由主测者、被测对象、规则、测值
二、测量是按一定规则,给所考察对象在某种性质的量度系统上指定值的活动
三、量度系统:名义量表、顺序量表、等距量表、比例量表
四、心理测量及其特点
1、 心理测量就是按规则给所考察对象的心理特性,在一定性质的量度系统,即量表上指定
值的活动
2、 测量对象不是特质实体及其特性,而是人的心理特性,是精神的非实体的存在
人有元认知
对被测者的观察 被测者自陈报告 周围人的观察
3、(1)间接性:
被测对象是心理活动
人的心理是世界特质发展到最高阶段的产物,个体的心理特性既是相对稳定的,又是对人的行为活动起支配决定作用的,因而会在人的行为的各个方面不断表现出来
(2)相对性
内部心理特性与个显行为间不存在确定性函数关系,测量结果只有相对意义
按心理测量对象本身的特性,测量结果大都只能在顺序量表上取值,具有相对性,最多也只能在等距量表上取值
(3)主体间交往性
五、心理测验
1、心理测验是心理测量的一种,是更加符合实证科学精神与要求的心理测量中特别的一种。其定义,一般认为是行为样本的客观而标准化的测量
2、心理测验定义所说的行为样本的意思有三
(1)测验所直接测察的是个体的外部行为
(2)这些外部行为应是所要测察的内部心理结构的代表性“行为样本”
(3)所测行为是否能构成代表性“行为样本”,要经实际检验由客观事实资料来确证
3、标准化是所有测量活动走向科学化的共同要求。就心理测量来说,标准化包括整个测验编制、施测与评分、分数解释等全部工作的标准化
常模指的是打算要测的被试群体在所测特性上的一般水平及水平分布状态
4、标准化讲的是工作中的实际要求,客观性指的是人们思想上应有的态度
测验信度是指测验对同一被试多次施测时,所得分数的一致性
至于测验的效度,指的是测验测到它打算要测的心理特性的程度
六、心理评估就是使用测验、行为观察、晤谈、个案资料研究和其他测评程序,为达到对个体或少数人作出深入的心理评价,从而来进行收集和整合资料的活动
心理评估是针对特定个体或少数个体的某种心理问题,连续不断地提出假设和检验假设的过程;是评估者以其关于所要考察评估的问题和涉及的特定人群的知识、经验为基础,利用收集到的资料来进行专业判断的活动
七、心理测验的发展
比纳-西蒙智力量表
斯坦福-比纳量表
人格测验的先驱克雷佩林 萨默
自陈问巷 使用表现 投射技术
八、心理测验的种类和功能
1、心理特性
能力测验 学业成就测验 人格测验 神经心理测验 心理卫生评定量表
2、接受测验对象规模
个别测验 团体测验
3、 施测方式
文字测验 非文字测验 情境测验 计算机测验
4、 测验对作答行为要求
最高成就测验 典型行为测验
5、 测验分数解释参照体系
常模参照测验 标准参照测验
6、 测验刺激性质
结构化测验 投射测验
7、 测验的目的
描述性测验 诊断性测验 预测性测验
8、 测验的应用领域
教育测验 职业测验 临床测验
9、 心理测验的基本功能大体有:认识和鉴定个别差异的、描述的功能、诊断的功能、预测
的功能以及评价的功能
九、对心理测验应有的正确看法,一是要认识到测验是心理学的重要研究方法,是决策的辅助工具;二是要认识到测验作为研究方法与测量工具尚不完善
第二章 心理测量中的统计技术
一、次数分布与售中量数、差异量数与标准分数
1、测验分数的次数分布表与图
频数f 组距R 定组数K
在编制次数直方图和次数多边图时,横坐标都是各组的中值。累积次数分布图却不然,这一点需要读者加以注意
2、集中量数
用来描述数据的集中趋势的特征量数称为集中量数;用来描述数据的离散程度的特征量数称为差异量数
在一组数据中,每个数据都 加上或减去、乘以或除以一个常数C ,所得平均数等于原来的平均数加上或减去、乘以或除以这个常数C
3、在正负一个标准差之间取值的概率为68.26%,在正负两个是95.44%,在正负三个是99.72%。
4、反映次数分布中各数据所处地位的量,就叫地位量数。标准分数是一种重要的、在心理测量中用途极广的地位量数
二、相关与回归
1、相关取值范围在正负一之间。正表示正相关,负表示负相关,绝对值越大,相关度越大。
2、回归分析中用决定性系数来表达回归议程的有效性程序,决定性系数就是相关系数的平方
第三章 测验的编制、实施与评分
一、测验的编制
1、测验编制的一般程序
(1)确定测验目的 对象 目标 用途
(2)拟定测验编制计划
(3)开发测验项目
收集测验编制资料——资料要丰富、要有普遍性
选择项目形式——一要考虑编制测验的目的和测验材料的性质;二要考虑被试的特点和人数的多少
编写测验项目——直接采用、修改采用、个人编写——测验项目的取样应当对欲测心理特质具有代表性、测验项目的取材范围要与测验编制计划所列项目范围相一致、测验项目的难度应有一定的分布区间、初编项目的数量要比最后所需的数目多一倍至几倍,以备筛选或编制复本用、编写测验项目的用语力求精炼简短,浅显明了、测验项目作答说明必须简明
检查项目:测验项目编制的技术性问题、初步确定测验项目是否具有必要的有效性与可信度
(4)预测与项目分析
预测注意——被试对象应取自将来正式测验准备要测查的群体、样本应有充分代表性,采用分层随机抽样、预测实施的情境与过程,应力求跟正式测验相同,以便较好地控制无关变量对测验结果的影响、预测的时限可以适当延长,让每一被试都能将题目做完,从而能获得较充分的反应资料、在预测过程中,要随时记录被试的反应状况
分析——一是要从内容上检查取样的适当性,文字表达是否清楚、二是要对预测的数据结果进行统计分析,确定项目的难度、区分度及备选答案的适宜性等
(5)合成测验
测验项目的选择——符合测验目的与性质、难度要恰当、区分度要高
测验项目的编排——由易到难,由熟悉到不很熟悉 逐类直进式 混合螺旋式 编制复本——关键是等值
(6)测验的标准化
测验内容标准化
施测过程标准化——相同的施测方法与步骤、相同的指导语、相同的测验时间
测验评分标准化
分数解释的标准化
(7)测验质量的检验
(8)编写测验手册
测验的目的和功用
编制测验的理论背景以及依据
测验的实施方法、时限及注意事项
测验的标准答案和评分方法
常模资料,包括常模表、常模适用的团体及对分数如何作解释
测验的信度与效度资料,包括信度、效度数据是在什么情境下得到的
2、测验项目的编制技术
(1)命题的一般原则
(2)几种眩要的测验项目类型
二、测验的实施
1、标准化心理测验实施的最基本要求,是使所有被试都处在相同条件下去表现出自己的正被行为,以便 通过观测被试在测验情境中的行为样本来推断他平日的一般行为特征
2、主试的资格
(1)心理测验的理论知识
(2)心理测验的专业技能
(3)测验工作者的职业道德
3、测验的选择
(1)根据测验目的来选择测验
(2)根据被试的情况来选择测验
(3)根据测验的质量来选择测验
4、测验的准备
(1)预告测验
(2)准备好测验材料
(3)熟悉测验的具体程序
(4)确保满意合适的测验情境
(5)协助被试做好准备
5、测验的实施
(1)指导语和时限
(2)作记录
(3)如何对待被试的要求
(4)主试的职责
6、影响被试作答反应的因素
(1)测验技巧
(2)练习效应
(3)教练测验
(4)应试动机
(5)测验焦虑
(6)反应定势
三、测验的评分与解释
1、所谓原始分数就是根据被试的实际作答,按测验的评分程序与标准,对每个测验项目及整个测验上所作反应评出的分数,“卷面分”,“粗分”
2、测验分数的解释
(1)如何看待测验分数的意义
主试应充分了解测验的性质与功能
对导致测验结果的原因,解释应慎重,谨防片面极端
必须充分考察测验的效度和局限
解释分数应参考其他相关资料
对测验分数应以“一个区间分数”来对待,而不应以“特定的数值”来解释
对来自不同测验的分数不能直接比较
(2)如何向被试和有关人员报告测验分数
使用当事人所理解的语言
要保证当事人知道这个测验测量或预测了什么
如果分数是以常模为参照的,就要使被试知道他是和什么团体进行比较
要使当事人认识到分数只是一个估计
要使被试知道分数将被如何运用
要考虑测验分数将给被试带来什么心理影响
测验结果应向无关人员保密
对低分者的解释应谨慎小心
报告测验分数时应设法了解被试的心理感受,并采取适当的措施加以引导
第四章 项目分析与常模
一、项目分析就是要对测验中每个项目的质量,都进行质和量两方面的分析评价,从而为筛选个性项目提供依据,为确保和改进整个测验质量服务。对项目作质的分析,就是要分析项
目的内容与形式。而对项目作量的分析,就是要收集实测资料,采用统计方法来分析试题的性能,主要包括难度和区分度等,并以此为筛选、个性项目提供实证依据
二、项目难度
1、难度是用来表现测验项目难易程度的指标
2、常用方式:
通过率
高-低分组估计法(27%)
非二值记分项目的难度
3、分数分布范围较广,测验分数方差大,求出的相关值可能大,测验信度就会高;分数分布范围,测验分数方差变小,求出的相关值可能小,信度值就会低
4、表达在等距量表上的项目难度,就被称为绝对难度
三、项目区分度
1、区分度,又称为项目鉴别力指数,一般用D 表示。它是指项目得分对被试心理特质水平高低的区分鉴别,也即项目得分的高低与被试实际能力或特质水平高低的一致性程度
2、区分度D 的聚会范围介于正负1之间。与相关系数类似‘
3、常用方式:
高低分组法——二值记分项目的区分度 多值记分项目的区分度计算
点二列相关法
四、测验项目的筛选评价
1、根据难度筛选项目
项目难度为0.50左右时,测验的信度和区分能力都有可能达到高的水平
一般要求测验项目的难度值可位于0.20~0.80或0.30~0.70之间;同时,所有项目的平均难度则要求在0.50左右
2、根据区分度筛选项目
项目区分度的提高会显著地提高测验的信度和效度
区分度在0.30以上就比较理想;在0.20~0.30之间的项目的,如果能很好地体现测验的目的,也酌情予以保留
五、常模
1、 测验常模,简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状
况或分布形态;实际操作中则是指被试样组在测验上得分的分布状况或分布形态
2、 常用的发展常模有年龄常模、年级常模和顺序常模;常用的团体内常模有百分等级常模
与标准分数常模
3、 常模的求取过程
(1) 确定有关的测试团体,并从中抽取有的被试样组
(2) 对被试样组进行合于标准化要求的测试,获得该被试团体成员在所测特质上足够而
真实可靠的数据与测验分数
(3) 把原始分数转化为某种形式的导出分数,制作常模表,并给出使用说明
4、 发展常模
(1) 年龄常模
比纳 智力量表 智龄
年龄常模三个要素——一套能区分不同年龄组的项目;一个由各个年龄的被试所组成的常模样组;一个表明答对哪些项目或能得多少分,就该归入哪个年龄的常模表
(2) 年级常模
年级当量通常用两位数表示,第一位为年,第二位为月
(3) 顺序常模
顺序常模和所编制的量表,更着重定性的研究,对促进心理计量模型与心理学实质理论的结合,有较好的作用
5、 团体内常模
(1) 团体内常模也称作组内常模,通常是根据标准化被试样组的测验分数、经过统计处
理而建立起来的、具有参照点和单位的测验量表
(2) 百分等级常模是从应测试的被试团体中,抽取一个有的被试样组,并把这个被试样
组中所有个体在某一心理测验上的原始分数,按大小顺序划分为100个等级,并建立起原始分数与百分等级之间一一对应的关系。找出某一测验分数的百分等级的办法,就是去找出全组分数中,比这个分数低和相等的分数个数,占全组分数总个数的百分比
(3) 标准分数常模
导出分数=变换分数的平均数+变换分数的标准差*标准分数
韦氏智力量表中各分测验的量表分:T=10+3Z
韦氏智力量表智商(离差智商):IQ=100+15Z
美国大学入学考试报告分数:CEEB=500+100Z
我国大学英语四、六级考试分数:T=500+70Z
6、 常模的应用
(1) 分测验成绩的比较与合成
分测验成绩的比较与合成
测验量表剖析图
分数合成的方法——临床诊断、加权求和法
(2) 全国常模与特殊常模
第五章 测验的信度与效度
一、测验信度
1、 信度概述
(1) 定义:信度就是测验抗干扰能力或者说所得结果一致性的指标
(2) 作用:
反映测量过程中所存在的随机误差的大小,能有效地评价一鳻测验的可靠性程度 用来解释个体测验分数的意义
用来解释不同测验间的分数差异
2、 信度的估计方法
(1) 重测信度
重测信度指的是用同一个测验对同一组被试施测两次时所得结果的一致性程度,结果是稳定性系数。实际上它评估了些影响对特质稳定性认识的种种误差的能力,主要来自重测实施中的间隔时间、练习将就、被试的动机差异等方面
利用条件:
所测的心理特质必须是稳定的
练习和遗忘的效果基本上相互抵消
(2) 复本信度
复本信度指的是两个平等的测验测量同一批被试所得结果的一致性程度,结果是等值性系数。评估了测验控制影响平等性的种种误差的能力,主要来自项目匹配的不均等、施测的方法与条件的不一致、以及练习将就的影响等
(3) 同质性信度
同质性信度是指测验内部所有项目间的一致性程度,结果是内部一一致性信度。它主要评估了测验控制测试内容误差的能力,务求测察同一特质的一批项目彼此间确具内部一致性。误差主要产生自项目的编制与选用上
分半信度——指将一个测验分成平等对等的两半后,被试在这两半上所分数的一致性程度,属于同质性信度,也可算等值性系数
库德—理查逊信度——二值分记分项目
克龙巴赫阿尔发系数——论述题等
(4) 评分者信度
评分者信度指多个评分者给同一批被试的作答反应进行评分的一致性程度。评估测验控制评分误差的能力,这种误差主要来自评分者对评分标准的把握,以及评分过程中的其他因素
3、 信度系数的使用
(1) 测量标准误的求取——是被试个体在大批平等测验上所得误差分数的标准差
(2) 解释测验分数差异——根据统计学的原理,只有当两个测验分数的差异大过1.96个
测量标准误时,我们才能以95%的把握断言,两分测验分数的差异是显著的
(3) 对测验信度系数值的一般要求——一般的原则是:当信度系数值小于0.70时,测验
不能用于对个人作出评价或预测,而且不能做团体间比较;当在大于等于0.70小于0.85时,可用于团体比较;当大于等于0.85时,一般才可以用来鉴别或预测个人的成绩或水平。对标准货损智力测验和学业成绩测验,常常要求其测验信度系数值大于0.90
4、 保证和提高测验信度的方法
(1) 影响测验信度的主要因素
抽样误差对测验信度的影响——求取测验信度时,就要力求在被试团体的全距中取样。测验分数全距越宽,方差越大,测验信度系数值就有可能高
随机误差对测验信度的影响
(2) 提高测验信度的常用方法
延长测验的长度
控制测验的难度(0.50),提高测验的区分度
提高测验内容的同质性
测验实施时严格按要求施测,努力争取被试的积极配合,测验评分严格按标准客观评定
二、测验效度
1、 效度概述
(1) 定义:是测验测到它打算要测的心理特性的程度
(2) 效度与信度关系
2、 效度的验证
第一是从测验内容的角度来分析难,并提供证据来说明是否能达到测验目的
第二是从测验是否符合心理学上某种理论结构的角度来分析验证,并提供证据来说明是否能达到测验目的
第三是从测验的实效角度来分析验证,并提供证据来说明明是否能达到测验目的
(1) 内容描述的效度难分析法
是指系统检查一个测验实际测到的内容与所要测量的内容之间的吻合程度,结论称为内容效度。较为适合于评价教育成就测验和职业测验,对标准参照测验更显得重要
包括三个方面:
项目所要测量的,是否真属于应测量的领域
测验所包含的项目,是否覆盖了应考察领域的所有方面
考察所测特质不同方面的测验项目,其比例是否恰当,是否跟所考察特质自身结构要求相符 逻辑分析法、再测法、复本法、经验法
(2) 结构鉴别的效度验证分析法
是分析和证实测验能够说明心理学上的理论结构或特质的程度,结论称为结构效度。主要用于智力测验、人格测验等一些心理测验中
逻辑分析法、发展水平的变化、与另一有较高结构效度的测验比较、与另一测查不同结构的测验相比较、实验操作法、因素分析法
(3) 效标预测的效度验证分析法
是分析测验分数与作为效标的另一独立测量结果之间的一致性程度,称为效标关联效度 称为效标的东西,一类是学业成绩和工作成绩与表现,一类是教学训练中的日常考察记录,一类是效度已经得到确认的现存测验上的分数
同时效度常用来查明老师或实际工作者的自编测验的效度,预测效度主要用来评价本测验的预测能力
3、 效度系数及应用
(1) 效度系数
用来描述资材关联效度高低的相关系数,称为效度系数
(2) 应用
估计标准误——指依据测验分数来估计效标测量值时的误差;即具有同一预测源值的所有被试所被估出的效标测量值的标准差
对效度系数值的一般要求——智力测验分数与教师对学生的等级评定之间的效度系数,一般应达0.30~0.50的范围;标准化学业成绩测验分数与教师对学生名次排列之间的相关系数,一般应达到0.60~0.70之间;两种不同的智力测验,或测查同一特质的标准化心理测验之间的相关系数,应达到0.60~0.80之间
4、 提高测验效度的方法
(1) 影响测量效度的因素
测验信度——同质性测验能获得较高的信度,但它的预测效度却可能会低;非同质性测验能获得较高的预测效度,但它的同质同性信度又可能会不理想
测验的构成——延长测验也能提高效度
接受测验的被试
所选效标的性质
(2) 提高测量效度的方法
三、测验使用的有关问题
1、 测验性能考察与选用决策
(1) 测验手册内容的考察
特别要认真考察测验的信度与效度资料——
设计验证了哪些种类的信度和效度指标
信度和效度的分析验证是在什么样的被试组上、如何具体地来进行的
信度和效度的时效性如何
(2) 效度资料的考察
2、 测验有偏性分析
指测验对于参加测试的某些群体或个体来说有偏见或不公平
第六章 智力测验
一、概述
1、 智商
(1) 智龄(心理年龄) 答对率80%-90%
(2) 比率智商 采用心理年龄与实足年龄的比值进行计算
(3) 离差智商 一个被试的智力测验成绩与同他相同年龄组被试的平均成绩相比较,并
以该组被试成绩的标准差为单位时的离均差,即一个在该年龄组中的相对位置分数
2、 智商的分布和智力的等级划分
(1) 推孟的智力等级分布表
140- 天才
120-140 上智
110-120 聪颖
90-110 中材
80-90 迟钝
70-80 近愚
50-70 低能
25-50 无能
25以下 白痴
(2) 韦克斯勒的智力等级分布表
极超常 大于等于130 2.2
超常 120-129 6.7
高于平常 110-119 16.1
平常 90-109 50.0
低于平常 80-89 16.1
边界 70-79 6.7
智力缺陷 小于等于69 2.2
二、个别智力测验
1、 斯坦福-比纳量表
(1) 第4版斯坦福-比纳量表是由桑代克等人编制的,他们将卡特尔的流体智力和晶体智
力理论与他们自己的认知能力理论相结合,创建了三层次的认知能力结构模型,以此作为编制量表的依据
测量2岁幼儿到成人被试的智力水平
(2) S-B4的施测
施测用的材料
施测顺序——混合的顺序,保持兴趣和注意
施测过程——第一阶段是例行的词汇测验,其作用在于选择其余测验的进入水平
第二阶段主试根据被试的实际成绩,确定每个测验的基底水平和顶端水平 测验的评分与分数的转换——除词汇、解释、挑错、临摹和言语关系5个测验,包含了自由反应型项目外,其余测验均由定向反应型项目组成
(3)S-B5测量5个核心领域,每个领域均包括言语和非言语两个部分,因而共由10个分测验组成。5个核心领域是流体推理、知识、数量推理、视空间加工和工作记忆 施测步骤——第一步是进行例行的分测验
第二步是进行非言语水平的测试
第三步是进行言语水平的测试
2、 韦克斯勒智力量表
(1) 韦克斯勒成人智力量表-中国修订版(WAIS-RC ) 16-89岁的成人
韦氏儿童智力量表(WISC-CR ) 6-16岁儿童
中国-韦氏幼儿智力量表(C-WYCSI ) 3-7岁3个月年龄水平的被试
(2) 韦克斯勒成人智力量表第3版
基本结构包括言语量表、操作量表和由二者构成的全量表;一共含有14个分测验 16-89岁成人
变化——在实施一些分测验时,所有的初试都从两个最基本的项目开始
W AIS-3除了提供言语智商、操作智商和总智商3个智商分数之外、还提供4个指标分数,即言语理解、知觉组织、工作记忆和加工速度分数
(3) 韦克斯勒儿童智力量表第3版和第4版
WISC-3包括言语和操作两个量表,总共由13个分测验组成
四个基本因素:言语理解因素、知觉组织因素、注意集中或克服分心因素、加工速度因素 WISC-4由15个分测验组成,其中5个是备用测验
四个指标因素:言语理解指标、知觉推理指标、工作记忆指标、加工速度指标
(4) 韦克斯勒成人智力量表-中国修订版(WAIS-RC )的使用
测验的选择
测验的准备——测验材料的准备
施测步骤安排
具体分测验的内容、施测和项目的记分(先言语后操作)
原始部分及其转换
结果解释
3、考夫曼儿童评定成套测验(K-ABC )与传统测验不同
理论依据——
考夫曼夫妇造成认知心理学的观点,即人类信息加工方式包括同时性加工和继时性加工两种。根据两种加工方式不同,设计了同时性加工测验和继时性加工测验。由心理加工量表和成就量表组成,心理加工量表又由同时性和继时性加工量表组合而成。共16个分测验,7:3:6
三、团体智力测验
1、 陆军甲种测验为文字测验
陆军乙种测验
军队资格测验(AFQT )
2、 瑞文图形矩阵推理测验
(1)英国心理学家瑞文
非文字智力测验
RPM 主要以引发能力为依据编制而成,引发能力是不依赖于过去经验和已有知识的、对事物之间关系的认识能力,不少人认为它可用于跨文化研究
瑞文标准图形矩阵推理测验(SPM ) 6岁以上的儿童和成人被试
瑞文彩色图形矩阵推理测验(CPM ) 5.5岁至11.5岁的儿童和智力低于平均水平的成人 瑞文高级图形矩阵推理测验(APM ) SPM 得分高于55分的被试进行更精细的区分评价 彩色型和标准型合并本的修订工作——联合型瑞文测验(CRT )中国修订版——本测验适合于5岁至75岁以内的儿童和成人,也可用于有言语障碍的个体。既可以个别施测,也可以团体施测;但对年龄较低的儿童和智力低下者,以及不能自行书写的人,宜个别施测。该测验还可用于不同民族和不同语种间的跨文化研究
(3) 瑞文标准推理测验中国城市修订版的使用
测验的选择
测验的准备
测验的实施——发答卷纸和测验图册
主试根据指导语向被试作讲解
主试与助理开始巡视
当被试完成测试的全部题目后,他可以举手要求离开
测验记分
分数转换——确定每一被试的实际年龄
根据被试的实际年龄,找出他所属的年龄组
根据被试年龄分组结果,查常模表将原始分数转换为常模分数
分数评价与解释——根据百分等级对被试水平进行分级
3、 奥蒂斯-莱农学校能力测验
多重水平成套测验 学校能力指数
四、智力测验的理论问题
1、 智力的结构——大多数定义都承认智力是认知过程中表现出来的各种能力的组合,它们
按不同的方式组成了一个智力系统
(1) 斯皮尔曼的二因素论 g s
(2) 瑟斯顿的群因素论 七个测验群
(3) 弗农的三层次结构论 三个层次的因素
(4) 三维结构理论 内容、操作和产品三个维度去考虑
(5) 卡特尔的流体智力和晶体智力理论 流体智力和晶体智力
(6) 斯腾伯格的智力三元论 完备的智力理论应该说明三个方面,即智力的内在成分、
这些智力成分与经验的关系,以及智力成分的外部作用。包括三个亚理论,即智力情境亚理论、智力测验亚理论、智力成分亚理论
(7) 加德纳的智力多元理论 7种相对独立的智力成分构成
(8) 智力的PASS 模型 注意系统、信息加工系统、计划系统
2、 智力发展的影响因素:遗传与环境
(1) 遗传决定论的鼻祖高尔顿《天才的遗传》
(2) 环境决定论的主要代表华生 《行为主义》 “一打婴儿”
(3) 混合 :两种因素相互依存,任何一种因素作用的大小、性质都依赖于另一种因素,
它们之间不是简单的相加或会合;两种因素相互渗透和相互转化,当前对环境刺激作出某种行为反应的有机体是它的基因和过去环境相互作用的产物
3、 智力测验成绩的公平性
(1) 性别的公平性
(2) 职业公平性
(3) 文化与教育差异:第一,在测验的开始阶段,应获得有关文化认同、同化的程度和
类型、最初文化的特征等,这些方面因素可能影响个体测验成绩的充分信息;第二,施测者自身的行为需适应被试的需要;第三,施测者自身要和被试建立良好的人际关系
4、 智力测验的预测能力
(1) 婴幼儿智力成绩的预测能力
(2) 智力测验分数的稳定性
(3) 成人智力测验分数的变化
第七章 人格测验
一、人格测验先驱——克里丕林 历史上第一个自陈问卷原型——伍德沃斯
大致两种类型:人格问卷(自陈量表)、投射测验
二、自陈量表
1、 项目结构清晰,意义明确,被试只须根据自己的实际情况选择较符合自己人格特征的描
述回答即可。同时,自陈量表的施测使用也简单、方便、经济。主试只需做一简要指导,就可对大量被试同时进行施测,也可用于一个被试;对主试要求不高,记分和分数的解释也较为明确。
易受被试反应定势的影响,作答也较受限制,提供的备选项并不一定完全包含了被试实际人格特征的描述
2、 明尼苏达多相人格问卷(MMPI )
(1) 美国哈撒韦、麦金利
宋维真
(2) 采用经验法进行问卷编制
陈述句表达,用是或否回答
10个临床量表——Hs 疑病;D 抑郁;Hy 癔病;Pd 精神病态;Mf 男子气-女子气;Pa 妄想狂;Pt 精神衰弱;Sc 精神分裂症;Ma 轻躁狂;Si 社会内向
3个效度量表——L 说谎分数;F 诈病分数;K 校正分数
MMPI-2由567个项目组成,第个项目的作答方式不变,前370个项目包含了传统的10个临床量表和3个效度量表,其作的197个项目是新增的,可以得到三个新得效度量表——Fb 反向量表;VRIN 可变反应不一致量表;TRIN 真实反应不一致量表
(3) 测验选拔——年满16岁、具有小学毕业文化水平以上、且没有能影响测验结果的生
理缺陷的成年人
测验材料——卡片式、问卷式
测验实施——熟悉测验的全部材料,包括调查表的内容、简介,特别是指导语
尽量保持施测环境的安静
规范而细心地进行正式测验
测验的记分和分数的转换——分类
Q 量表
记分,不加K
加K
剖面图原始分数栏
平均数为50,标准差10的T 分数
剖面图,分男女
测验结果解释
3、 加利福尼亚心理调查表
采用经验法编制
用于测量健康和人格层面,对于人际关系和社会行为等尤为注重
第三次修订版包括434个是非题,近一半来自MMPI ,组成20个量表,3个是效度量表——幸福感、好印象、社会性
3个结构量表——内在-外在、规范接受-规范拒绝、自我实现
CPI 在适用对象上与MMPI 不同,它专门用于正常成人
4、 卡特尔16种人格因素问卷
(1) 理论基础是卡特尔的人格特质理论:表面特质,根源特质
英文原版有5种形式的版本,AB 为全版本,含187个项目,CD 为缩减本,含106个项目,E 适用于文化水平较低的被试,含128个项目
适用于16岁及以上的被试,可作为个性原因及心理疾病诊断的重要手段,也可用于
坐标选拔
16PF 第5版有185个项目,包括了16个基本人格因素量表和一个印象操纵量表,3个新的施测指标来评估被试的反应偏向——印象管理IM ,默认指标ACQ ,罕见指标INF
(2) 我国修订的16PF
刘永和、梅瑞狄斯——两千多名港台地区的中国学生
戴忠恒、祝蓓里——内地各种常模
施测步骤:先发放一张答卷纸给被试,让其填上基本信息;然后发给题本,翻到测题的说明部分,指导语,例题;当被试掌握项目作答方式之后,开始正式测验
16PF 除聪慧性因子B 项目外,其他因子的每个项目有abc3个选项,聪慧性含ab 两个选项,电脑记分或模板记分
原始分数得出之后中,对照常模表,将其转换为标准分数(标准十分数),转换后的标准分数登记在剖面图左侧的标准分数栏内,画特征曲线图
16PF 中16个主要因素和4个次级因素的解释,根据每个因素标准分的高低来进行,3分以下为低分,8分以上为高分
5、 艾森克人格问卷
(1) 英国 艾森克夫妇 龚耀先
EPQ 的是理论基础是艾森克的人格类型理论,人格由3个基本维度构成,这3个基本维度分别是内倾-外倾、神经质和精神质
分儿童问卷和成人问卷,都包含4个分量表之 其中3个分量表用来测量上述3种人格维度,一个效度量表即说谎量表L
我国修订版的EPQ 儿童和成人问卷均由88个项目组成
(2) EPQ 的施测方法集中在对被试的指导语中
在被试了解了作答方法之后,便开始正式实施测验。这时,主试要检查被试的基本资料是否填写完整、正确
被试做完问卷后,可开始记分
根据被试的性别和年龄,便可以将各量表的原始得分转化为平均数为50,标准差为10的T 分数
各量表的标准分求出来后,我们在剖面图上将各分量表的T 分数点相连,便可得到被试的人格特征曲线图
EPQ 根据被试在各量表上的T 分数不同,将被试区分为高分者、低分者和中间分数者。一种是中间分数者占50%,两端临界T 值分别为43.3和56.7,另一种是中间分数者占75%,两端临界T 值为38.5和61.5
在对被试解释分数前,先检查L 量表的得分是否过高
6、 修订NEO 人格因素调查表
(1) 人格特质理论认为,特质是构成人格结构的基本单元。许多人格问卷,如16PF 和
EPQ 都是以特质理论为基础编制的
(2) 戈登伯格提出五因素模型
NEO-PI-R 含5个领域或维度——神经质、外倾性、经验的开放性、宜人性、自觉性——每个领域又包含6个分量表,共30个量表
(3) NEO-PI-R 包括240个项目,每个分量表项目数相同,均为8个,采用5级评分法。大约有一半项目为反向记分,这样做的目的是解决可能存在的默认偏差。
(4) 不包括效度量表,但有三个评估反应效度的项目。一个项目要求被试回答,他们是否以一种诚实和正确的态度回答了项目;另一个项目询问被试回答,他们是否以一种诚实和正确的态度回答了项目;另一个项目询问被试,是否回答了所有的项目;最后一个项目评估
被试的回答是否与题号对应。
(5)自我报告型S 型,观察者报告形式R 型
(6)很多研究结果NEO-PI-R 可用于人格障碍的测量,包括对心境障碍、焦虑和特质滥用方面人格特点的测量。同是,NEO-PI-R 也广泛用于人员选拔等许多领域
7、中国人人格量表
(1)王登峰 中国人人格七因素模型 中国人人格量表QZPS ——外向性、善良、行事风格、才干、情绪性、人际关系、处世态度——18个小的人格因素
(2)根据18个小人格因素进行二阶因素分析,QZPS 还得到中国人的自我指向、他人指向和事物指向三个组合因素
(3)对180个陈述句项目评定从很不同意到很同意共分5个等级,明显错误,则圈选1;明显正确,则圈选5 以标准分数高低于1.96作为划分高低分者的依据
三、投射测验
1、罗夏墨迹测验
(1)瑞士 罗夏 墨迹测验 投射测验的发端
(2)由10张卡片组成,每张卡片上印有一幅左右对称的墨迹,5张是黑白的,2张略带鲜红,3张彩色
(3)根据位置、决定因素、内容和通俗性等进行记分
2、主题统觉测验
(1)哈佛心理诊所默里和同事编制。与罗夏墨迹测验相比,TAT 很少用来评估适应不良,而通常是用来揭示问题是否存在、需求的特点或者是人际关系的质量
(2)TAT 由31张图(1张空白图片)组成,大多数图片描写的是处于不同情景下的人,也有少数几张只画有物体。一些图片只适合男孩和男人,一些图片只适合于女人和,还有一些两性均适用‘
四、从格测验的理论问题
1、特质与情境的交互作用
(1)人格特质作为主要因素,传统人格测验
(2)情境论者,跨文化测验的兴起
(3)交互作用,特定情境类型下的特质概念——考试焦虑调查表TAI ,测量两类人格特质,担心和激动——涉及特质与状态的区分——状态-特质焦虑调查表STAI ,测量两种焦虑,状态焦虑,特质焦虑
2、人格问卷的反应偏向问题
有的学者将反应偏向分为两种类型:反应定势和反应风格。反应定势是指被试有意或无意地掩盖其真实情况,而按他(她)自己或别人所希望表现的形象进行作答。常见的反应定势是社会称许性,它是指被试在测验上有依社会所期望的行为方式作答倾向
反应定势的一个重要特征是它与测验的内容有关;被试从测验的内容上可以判断并决定如何改变其反应趋向。反应风格则与测验的内容无关,它是指当测验的刺激或意义并不明确时,或当被试实际作出反应时,他或她所使用的一种特别的反应方式
3、投射测验的信度和效度问题
评分者信度 再测信度 内部一致性信度 复本信度
在合理使用这类测验的过程中同时去寻求新的方法,以改进和解决它的信度和效度问题
第八章 心理卫生评定量表
一、概述
1、 种类
(1) 按项目编排方式——数字量表、描述量表、标准量表、检选量表、强迫选择量表
(2) 按测主体分类——自评量表、他评量表
(3) 按量表内容分类——很多
2、 优点——客观、数量化、全面、经济方便
3、 心理卫生评定量表的选择和评价原则
(1) 量表的功效
(2) 敏感性
(3) 简便性
(4) 可分析性
二、症状自评量表
1、 简述
(1)又名症状清单SCL-90,HSCL ,现在常用的是德若伽提斯1975年编制,还有一个51项文本,称为简易症状问卷BSI
(2)王征宇翻译
金华、吴文源1388名正常成人及245名神经症病人
2、(1)共有90个项目,包含有较广泛的精神症状学内容。从感觉、情感、思维、意识、行为直至生活习惯、人际关系、饮食睡眠等均有涉及。并采用10个因子分,分别来反映10个方面的心理症状情况
(2)躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性、其他
3、量表的实施及解释
(1)施测步骤——
前,交代清楚,铅笔填写
文化程度低。。。
时间范围是“现在”或“最近一周内”的实际感受
结束后,逐一查核
(2)评分标准——五级评分制
总分:总分、总均分、阳性项目数、阴性项目数、阳性症状均分
因子分:其实是该因子平均分,可作轮廓图分析
常模和分界植:作者未提出分界值(划界分数)。如果采用5级评分,则部分超过160分,或阳性项目数超过43项,或任一因子分超过2分,可考虑视为筛选阳性 。70 43 2
(3)结果分析与解释
总分的分析:疗效可用减分率来评估,大于等于50%为显效,大于等于25%为有效,其等于前后分差比上前总分
因子分与轮廓图的分析
(4)适用范围
在精神科和心理咨询门诊中,作为了解就诊者或求助者心理卫生问题的一种评定工具
在综合性医院中,常以该表了解躯体疾病求助者的精神症状,事实说明这常能得到较满意的应用结果
应用该表调查不同职业群体的心理卫生问题,从不同侧面反映各种职业群体的心理卫生状况
(5)注意事项
量表项目全面性不够,缺乏“情绪高涨”、“思维飘忽”等项目,使其在躁狂或精神分裂症求助者组中的应用受到一定限制
筛选阳性只能说病人可能患有心理疾病,并不说明一定患有心理疾病。要做出心理疾病的诊断,必须进行面谈并参照相应疾病的诊断标准做出深入考察
三、大学生人格问卷
1、 UPI 由三部分构成:第一部分是学生的基本情况,作为问卷分析时参考。第二部问卷本
身,共60个项目。
55、20、35、50测伪项目,不计分;其余56个症状题,包括身心两个方面。8、16、25、26是关键项目,应给予更多关注
第三部分是辅助题,共4项,了解被测试者对自己身心健康的评价以及主要困扰问题
2、 问卷的计分及解释
(1)肯定记1分,否定记0分,筛出三类
第一类 含25分以上 25题肯定 辅助题2个及以上 明确提出——ABC
第二类 20-24 8、16、26 辅助题1 个及以上 ——有条件面谈,半年左右再查
第三类 非以上两类
(2)UPI 的施测与统计分析
四、中小学生心理健康量表
1、MHT 共有100个项目,包含8个内容量表和一个效度量表(测谎量表)。8个内容量表为——学习焦虑、对人焦虑、孤独倾向、自责倾向、过敏倾向、躯体症状、惊恐倾向、冲动倾向
2、量表的计分与解释
二级评分,“是”“不是”,ab ,a 计1分,b 计0分
效度量表得分在7分以上者,可以考虑将被试的该答卷作废,适当时候再行重测
全量表分(这里面本身就不包括效度量表)超过65分以上,存在一定心理障碍
五、焦虑与抑郁评定量表
1、焦虑自评量表
(1)SAS W.K.Zung
由20个反映焦虑主观感觉的项目组成,每个项目按症状出现的频度分为四级评分;其中15个为正向评分,5个为反向评分
(2)量表的实施与解释
施测步骤——
前,交代清楚,铅笔填写
文化程度低。。。
时间范围是“现在”或“最近一周内”的实际感受
结束后,逐一查核
评分标准——粗分乘以1.25取整数为标准分(非Z 分)
结果解释——50为分界值,50-59分为轻度焦虑,60-69分为中度焦虑,69分以上为重度焦虑
适用范围——本量表可以评定焦虑症状的轻重程度及其在治疗中的变化,适用于具有焦虑症状的成年人。主要用于疗效评估,不能用于诊断
注意事项——一是由于焦虑是神经症的共同症状,故SAS 在各类神经症鉴别中作用不大;二是关于焦虑症状的临床分级,除参考量表的总分值外,主要还应根据临床症状,特别是要害症状的程度划分
2、抑郁自评量表
(1) SDS 由20个反映抑郁主观感受的项目组成,第个项目按症状出现的频度分四级评
分;其中10个为正向评分,10个为反向评分。20个项目反映抑郁状态的四组特异性症状:精神性-情感症状、躯体性障碍、精神运动性障碍、抑郁的心理障碍
(2) 施测步骤——
前,交代清楚,铅笔填写
文化程度低。。。
时间范围是“现在”或“最近一周内”的实际感受
结束后,逐一查核
评分标准——注意正反向,乘以1.25取整数(非Z 值)
结果解释——53为分界值,53-62为轻度抑郁,63-72为中度抑郁,72分以上为重度抑郁 适用范围——该量表可以评定抑郁症状的轻重程度及其在治疗中的变化,特别适用于发现抑郁症病人。其评定对象为具有抑郁症状的成年人。
注意事项——一是SDS 主要适用于具有抑郁症状的成年人,它对心理咨询门诊及精神科门诊或住院精神病人均可使用。对严重阻滞症状的抑郁病人,评定有困难。二是关于抑郁症状的临床分级,除参考量表的总分值外,主要还应根据临床症状,特别是要害症状的程度划分;量表的总分仅能作为一项参考指标而非绝对标准
六、自我意识与自尊评定量表
1、Piers-Harris 儿童自我意识量表
(1)PHCSS 由80个项目构成,分为6个分量表;行为、智力与学校情况、躯体外貌与属性、焦虑、合群、幸福与满足。有的项目可同时属于不同的分量表,项目7同时属于两个分量表而项目8同时属于3个分量表。6个分量表项目的总和并不等于全量表部分;其中还有15个项目并不属于任一分量表,但计于总分
(2)量表的计分 二级计分,正性计分,得高分即评价好,所考察的方面不存在问题,然而总分过高,却也并不很理想
2、自尊量表
(1)SES Rosenberg
(2)自尊量表一共有10个项目,从“非常符合”到“很不符合”按1-4级评分
七、生活事件量表
1、LES 由杨德林、张亚林1986年编制了48个项目,含我国较常见的涉及三方面的问题,一是家庭生活方面28条,二是工作学习方面13条,三是社交及其他方面7条
2、量表的实施与解释
(1)施测步骤
(2)评分标准 一次性事件记次数 长期性事件,半年内记1次,超过半年记2次;影响程度从毫无影响到影响极重分别记为0-4分;某事件刺激量=该事件影响程度分*该事件持续时间分*该事件发生次数分
(3)结果解释 LES 部分越高反映个体随的精神压力越大。95%正常人一年内部分不超过20,99%不超过32。负性生活事件的分值越高对身心健康影响越大,正性生活事件分值意义尚待进一步研究
(4)适用范围 LES 适用于16岁以上的正常人和神经症、身心疾病、各种躯体疾病求助者
(5)注意事项
注意调查的时间范围,只计研究所规定的时限内发生的生活事件
为了保证该生活事件确在评定要求的时限内,对每项作肯定回答的事件,还要让受检者说明具体的发生时间,以便核查
一般应向受检者本人进行调查
八、社会支持评定量表
1、肖水源认为,社会支持从性质上可以分为两类,一类为客观的、可见的或实际的支持;另一类是主观的到的情感上的支持;还包括对支持的利用情况第三个维度
2、量表的内容与结构
3、量表的计分方法
九、应对方式问卷
1、应对方式的评定主要采取两种方法,一是让被试自己描述,可视作非结构式的评定方法;二是依据理论分析事先编出的问卷或量表,由被试问答
2、量表的内容与结构
肖计划应对方式问卷包括62个条目,共分为6个分量表:解决问题、自责、求助、幻想、退避、合理化
3、 量表的实施与解释
(1) 施测方法
自陈式评定量表,自己回答,当声收回
“是”——有效 否——下一个条目
(2) 评分标准
量表分记分方法 计算各分量表的因子分
(3) 结果解释
根据各分量表的因子分的值,绘出应对方式因子的轮廓图
根据轮廓图和各分量表因子分结果,解释被试个体或群体的应对方式类型和应对行为特点,比较不同被试个体或群体的应对行为差异;不同类型的应对方式还可以反映人的心理发展成熟的程度
各分量表理论意义简析
退避——幻想——自责——求助——合理化——解决问题
解决问题——求助,成熟型
退避——自责,不成熟型
“合理化”,混合型
(4) 适用范围
文化程度在初中和初中以上
年龄在14岁以上的青少年、成年和老年人
除痴呆和重性精神病之外的各类心理障碍求助者