注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

零售创新,创新那些事儿,SPSS,VBA

零售创新

 
 
 

日志

 
 
关于我

新浪微博,零售创新 研究经理,数据分析师 希望和市场研究和零售业的同事共同进步! 本博客发表的都是免费或试用的资料,如果有版权问题请发邮件wangli12a@163.com联系删除。 spss excel vba blog

网易考拉推荐

【转载】测量学分析方法:比如:试卷分析的四个度:难度、区分度、信度、效度  

2012-06-28 16:27:16|  分类: spss学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

一、难度

 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。一般认为,试题的难度指数在0.30.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。

 1、难度的两种定义:

1P=1x/w    x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1

2P=x/w    这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1

2、难度的计算:

1)主观性试题的难度

 A   基本公式法:P=1x/w

 B 极端分组法 P=1(XH+XL)2W    XH :高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。

2)客观性试题的难度

A  基本公式法 :P=1R/N      R 为答对人数,N 为全体人数。

B  极端分组法: P=1—(PH+PL)∕2  

 PH=RH/n 叫高分组通过率,RH:高分组答对人数,n:总人数的前27%PL=RL/n 叫低分组通过率,RL:低分组答对人数。

二、区分度

 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。

    试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。

    区分度指标的评价: -1.00D+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。

 2、 区分度的计算方法:

    基本公式法 :D=(HL)÷ND代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。

 极端分组法:

1)主观性试题:D=SHSLn(WH-WL)

 SH:高分组得分总数,SL:低分组得分总数,WH:该题的最高得分,WL:该题的最低得分,n为高分组(或低分组)的人数,即总人数的27%

2) 客观性试题:D= PHPL  ,D= RHRLn

3) 一般也可以用D=XHXLX满 计算。XH:高分组某试题的平均分,XL:低分组某试题的平均分,X满:该题的满分。

三、信度

    信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。

    信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。一般来说,要求信度在0.7以上。

 1、评价信度的方法:

 1)重测法,(2)复本法—副题,(3)折半法,或者说:用再测信度、复本信度和内部一致信度三种方法来进行评估。

 再测信度是指将同一试卷在相同的条件下对同一组考生先后实施两次,两次测评结果的相关系数。

 复本信度是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数。

 内部一致信度是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。

 2、信度系数  γxx=ST2SX2     ST2  叫真分数方差,SX2  为获得分数方差。信度系数的最大值为1,表示测验的可靠性高,最小值为0,表示测验的信度低。当γxx0.70时,测验可用于团体间的比较。当γxx0.85时,测验可用于个体之间的比较。

四、效度

     效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标的符合程度.

 任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西(如用英语试卷测试学生的数学能力),那么,对目前所要测试的东西,这个测试将是无价值的。

 由于心理现象本身的特点,测评的效度尤为重要。心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质。如智力水于主要是借助于个体对一些问题的反应及正误等结果来推断的。

 效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分。效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度。

  评论这张
 
阅读(240)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017