注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

零售创新,创新那些事儿,SPSS,VBA

零售创新

 
 
 

日志

 
 
关于我

新浪微博,零售创新 研究经理,数据分析师 希望和市场研究和零售业的同事共同进步! 本博客发表的都是免费或试用的资料,如果有版权问题请发邮件wangli12a@163.com联系删除。 spss excel vba blog

网易考拉推荐

信度与效度的参考  

2012-04-01 17:54:32|  分类: spss学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
信度与效度
1.信度所关心的是测量的一致性或稳定性,信度主要在说明测量结果中测量随机误差所占的成分。
···信度可划分为稳定性(通过重测信度和复本信度体现)和一致性(通过折半信度和项目间一致性信度来体现)信度有「外在信度」(external reliability) 与「内在信度」(internal reliability)二大类。外在信度通常指不同时间测量时,量表一致性的程度,再测信度即是外在信度最常使用的考验法。在「多选项 表」(multipleitem scales)中,内在信度特别重要,所谓内在信度指的是每一个量表是否测量单一概念(idea),同时,组成量表题项的内在一致性程度如何。因素分析完 后每个构念层面的内在信度α系数通常会较总量表之信度值低,内在信度最常使用的方法是Cronbach's alpha系数。

2.项目间一致性信度:在同一量表中受试者(被调查者)对所有题项答案的一致性。由于一量表内的一组题目是对同一概念从不同角度进行的测量,因而不同题项之间应有一定的相关。常用Cronbach α系数度量此类信度
3.信度标准:吴统雄, 1984 建议可信程度的参考范围:
信度≤.30: 不可信
.30<信度≤.40: 初步的研究,勉强可信
.40<信度≤.50: 稍微可信
.50<信度≤.70: 可信[最常见的信度范围]
.70<信度≤.90: 很可信[次常见的信度范围]
.90<信度: 十分可信
4.如何增进信度:明确的概念化:当我们只测量单一构念或构念的一个面向(subdimension),并有清楚的理论定义时,信度就会增加;提升测量尺 度的精确性;使用多重指标:多重指标能使研究者测量一个构念的广泛定义内容,使研究者能测量到一个构念的不同层面;使用预试
(pretests)及重复测试(replication)等手段。
5.检验项目间一致性信度:analyse-scale-reliability analysis,把几个项目选入选scale if deleted,如果整个量表的信度系数较低,当删除某题后的量表信度显著提高,则应将该题删除。
6.研究的效度(Validity)主要分为三种:
A.构念效度(属于测量的效度)(Construct Validity,简称C.V.):“构念效度”是指理论中的抽象概念在多大程度上在实际研究中成功地进行了操作化,即操作变量在何种程度上体现了它想要 体现的理论概念的真正含义;···理解为变量对概念的反映吻合程度?
···构念效度通常用聚合效度(convergent validity)和区别效度(discriminant validity)来评价。聚合效度反映使用不同方法度量同一概念所得出的度量结果之间的一致性。例如,测量学生的英语能力(构念),有两种测量方法,一 是英语六级考试,二是英语上课老师根据生课上的长期表现的打分。如果两种分数具有较高的相关系数,则说这两种测量方法都具有聚合效度。区别效度:如果使用 同一测量工具测量(理论上认为)两个不相关的构念时,结果发现这两个构念的实际测量结果确实不相关,那么则称该测量工具具有区别效度。例如, 理论上讲,“英语能力”和“数学能力” 这两个构念不相关。对于“考试”这种测量工具,如果英语考试成绩与数学考试成绩不相关,则说明,“考试”这种测量工具具有区别效度。
B.内部效度(Internal Validity,简称I.V.):内部效度是指在多大程度上,特定研究样本或在特定研究环境下所得到的研究结论是正确的;··理解为变量间关系说明程度?
C.外部效度(External Validity,简称E.V.):外部效度是指在多大程度上可以将对特定研究样本和在特定研究环境下所得到的研究结果推广到理论假设中所明确的总体和环境中去。···理解为研究对真实情况的解释程度?
····一般来说,研究者在进行研究时,总是希望研究最终的结果能够超越具体的研究背景,而能在更广泛的背景条件下成立,即具有最大的外部效度。外部效度直接影响到社会关系理论的普遍意义和应用范围。

7.测量的效度是指在测量中测量在多大程度上反映概念的真实含义,它包括:
(1)测量对象是否是所要测量的变量;
(2)被测量的变量的结果是否接近真实值。
如果二者均一致与接近,则该测量的效度较高。
8.X0=XT+XS+XR,对构念的度量效度的评价包括了两个部分:XR和XS。与XR有关的部分称为信(Reliability),指在何种程度上度量避免了随机误差。
广义的效度是指操作化定义或测试的结果多大程度上能代表要研究的概念,是指测试结果多大程度上能避免全部误差 (XR+XS),本身包括信度。狭义的效度是指测试结果多大程度上能避免系统误差 XS ,不包括信度。如不加声明通常效度指的是广义的效度。效度以信度为前提,没有信度就没有效度。在假定度量具有高信度的前提下,构念效度主要取取决于系统误 差XS 。
9.提高测量的效度:在操作化之前对概念的界定要清楚,这是进行有效研究的前提;采用多项目度量方法,即采用多个变量测量同一构念(用多个问题同时测量一个构念。这样有助于提高测量精度和度量的信度);重视统计口径的统一、数据的可比性、数据收集方法设计和具体实施

10.会同时呈现α系数与标准化之α系数(standardized item alpha),这二个α值略微不同,究竟这二个α值之适用时机为何?当研究者采用试题之标准分数的总和作为量表分数时,此情况宜选用标准化α系数;当研究 者用试题之原始分数总和作为量表分数时,则不宜选用标准化α系数
  评论这张
 
阅读(2661)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017