信息函数在标准参照测验中的应用研究

信息函数在标准参照测验中的应用研究

ID:33199595

大小:529.00 KB

页数:10页

时间:2019-02-22

信息函数在标准参照测验中的应用研究_第1页
信息函数在标准参照测验中的应用研究_第2页
信息函数在标准参照测验中的应用研究_第3页
信息函数在标准参照测验中的应用研究_第4页
信息函数在标准参照测验中的应用研究_第5页
资源描述:

《信息函数在标准参照测验中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、信息函数在标准参照测验中的应用研究涂冬波1(1.江西师范大学教科院2001级硕士研究生,江西南昌,330027)摘要:本文主要从项目、测验、被试能力三方面来探讨信息函数在标准参照测验中的应用。研究结论表明:信息函数较经典测量理论能更精确地评价项目质量、测验质量及被试能力水平,因而对测验及学生能力水平的评价更科学,同时对测验的编制有更强的指导作用,值得推广。关键词:信息函数;最佳评分加权;标准参照测验;项目反应;理论一、问题的提出(一)应用经典测量理论(CTT)作项目分析、测验分析及被试能力分析的缺陷如何评价一个测验及其项目的优劣,这是广大测验编制者和

2、使用者所关注的问题。在CTT中认为区分度高的项目就是好的项目,而当项目难度适中时,项目区分度大。因而CTT一般挑选难度适中、区分度高的项目。而在CTT中难度与区分度的求取是彼此独立的。虽然它也承认这两个度是彼此相关联、统一起来发挥作用的,但却没有定义一个关于项目质量的、包含难度和区分度等各方面作用的、统一的综合指标。另外,CTT中的测量误差是一个笼统的概念,它是针对所有被试而言。它不能反应测验对不同能力水平被试的测量误差的不同,且它的求取公式(SE=Sx(1-rxx)0.5)与项目难度和区分度的取值并无直接关系。再者,CTT中答对一道难题得l分与答对

3、一道容易题得1分所表达的能力水平是一致的。而实际上,答对难题所反应出的能力水平明显高于答对易题所反应的能力水平,但CTT并不能如实反应这种情况。这些问题一直都是CTT中存在的主要缺陷。(二)项目反应理论(IRT)中信息函数(InfomationFunction)的提出为了克服CTT中的上述缺陷,项目反应理论提出了信息函数概念,它包括测验信息函数和项目信息函数。根据定义,测验信息函数I(θ)=1/SE(θ)2。它是测量标准误(SE(θ)的倒数。这表明,一个测验的信息函数值越大,那么测验对被试相应的能力水平所做估计的误差越小。可以证明:I(θ)=∑Ii(

4、θ)=∑Piˊ(θ)2/Pi(θ)[1-Pi(θ)][2],其中I(θ)是测验信息函数,Ii(θ)是测验项目i的信息函数,Pi(θ)是一个包含项目参数和被试参数的反应函数,Piˊ(θ)是Pi(θ)的一阶导数。它是一个项目参数和被试能力综合作用的函数,它的求取不仅考虑了项目参数间的关系,而且考虑了项目参数与被试能力间的关系,是一个关于项目质量的、包含难度和区分度等各方面作用的、统一的综合指标,这是CTT理论所不具有的优越性。上式表明各个测验项目的信息函数对整个测验的信息函数的贡献是独立的。一个项目的信息量越大,则对整个测验的贡献越大;反之,一个项目的信

5、息量越小,则对整个测验的贡献越小。因而用测验项目信息函数的大小来衡量项目的优劣显然是合理的。由于信息函数是针对特定能力θ的函数,因此在标准参照测验中,可根据划界分数点上对应的能力θ的信息函数值来评价项目质量及整个测验的质量。当划界分数点上的某项目或测验的信息量越大,则该项目或测验在划界分数点上的测量误差越小,区分能力越强,即该项目或测验的质量越好。洛德(Lord)和伯恩鲍姆(Birnbaum)的研究提出,测验总分信息函数求法如下:Ix(θ):测验总分信息函数Wi:项目权重Pi(θ):反应函数Pi′(θ):Pi(θ)的一阶导数并证明,对Logistic

6、模型而言,当:Wi=D(单参数)Wi=Dαi(双参数)Wi=Dαi(Pi-ci)/[Pi(1-ci)](叁参数)时,测验总分信息函数(Ix(θ))最大,也就是测量误差最小。采用以上公式加权求得总分的方法称为最佳加权评分法。它较CTT中原始分数的简单累加更理想,更优越(仅当为单参数时,两者一致)。它能更客观、更准确地评价被试能力。二、研究方法与过程(一)研究对象本研究以2002年7月份高等教育自学考试全国统一命题考试高等数学(一)试卷为对象,从某省随机抽取了633名被试(即作答试卷)。本试卷由五大题(共50个小题)构成,列表如下:(二)分析工具采用测量

7、软件——“现代心理与教育测量通用分析系统”(简记为ANOTE江西师大研制,通过了教育部考试中心主持、张厚粲教授为主任的专家委员会鉴定,结论是“国内领先,国际先进”。)进行分析。选取Logistic双参数多级计分模型。本试卷的项目容量及抽取的被试容量符合:“胡林(Hulin)、李沙克(Lissak)和德拉斯哥(Drasgow)1982年建议用于双参数模型就需要至少30个项目和500个被试”[3](P136)。参数估计采用EM算法。(三)试卷单维性检验用SPSSl0.0统计软件包进行因素分析(FactorAnanlysis),按特征根的值(Eigenva

8、lue)大于l来抽取因子,共得l5个因子,每个因子的特征根的值及其碎石图(Screeplot)如下:第1特征

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。