课堂教学中标准化测验结果的解释
⽬前关于课堂教学评价结果解释类型的划分⼏乎没有专门的研究。但就课堂教学评价结果的解释来说,在实际应⽤中常习惯性地将测验分为传统的标准化测验和⾮标准化测验,⾮标准化测验即是前⾯章节提到的替代性评价测验。因此,在这⾥照应前⾯章节,对课堂教学评价结果的解释就从标准化测验和替代性评价测验的⾓度进⾏阐述。
⼀、课堂教学中标准化测验结果的解释
在课堂教学中,⽬前已经出现了⼀些⾮标准化的测验⽅式——替代性评价测验,但标准化测验仍然是主要的测验⽅式,应⽤仍然⼗分⼴泛。因此,仍有必要在这⾥对课堂教学评价中标准化测验结果的解释进⾏介绍。
(⼀)标准化测验和标准化测验结果解释的概念
标准化测验是指对⼀个既定⼩组内的所有成员在相同条件下以相同⽅式进⾏的考试。([美]
G.D.Borich & M.L.Tombari:《中⼩学教育评价》,242页,北京,中国轻⼯业出版社,2004。)具体到课堂教学,就是在相同条件下,以相同的题⽬同时对所有学⽣进⾏测试,并以同⼀标准对学⽣在测试中的反应作出评估的测验。可以看出,“标准化”强调整个测验过程内在的“⼀致性”,是个理想化的概念,事
实上做到完全的⼀致是不可能的,如,每个学⽣的主观状态在测验时就不⼀样。但在实际的测验中,在排除⽆关条件的情况下,测验的各种因素是接近⼀致的,同时这种假定的⼀致性也为对标准化测验结果解释时进⾏内部、外部⽐较提供了基础。下⾯就阐述什么是标准化测验结果的解释。
对标准化测验评估时,⼀般是依据统⼀的标准对学⽣的反应进⾏评估,最后得到⼀个分数,通常叫原始分数。⼀般来说,原始分数所能反映出的信息很少,要深⼊、全⾯地了解所测量的学⽣的实际情况,就要对这个“分数”进⼀步进⾏阐释。因此,对标准化测验所得到的原始分数进⾏阐释的过程就是标准化测验结果的解释。
(⼆)标准化测验与常模
常模经常⽤于社会⼼理学领域,对其含义界定的说法很多。社会⼼理学研究者在使⽤“常模”⼀词的时候,指的是统管⼩组成员⾏为的⼀组标准⾏为。([美]G.D.Borich & M.L.Tombari:《中⼩学教育评价》,241页、242页,北京,中国轻⼯业出版社,2004。)在课堂教学评价领域,可以界定为作为样本的⼩组成员在所要测量的特质上的标准的反应或⾏为。也就是说,常模代表的是在某⼀个环境下所应该作出的反应,是评价其他对象在同样环境下的表现时所依据的标准。如,在参加学校组织的⼤型活动时,学校规定应该穿什么⾐服、坐在什么位置、说普通话还是⽅⾔等,就可以看作是评价参加活动⼈员⾏为的常模。
前⾯阐述过,标准化测验突出的特点就是强调⼀致性,这就为参照常模来解释标准化测验提供了理论上的可能。事实上,标准化测验通常都是参照常模来进⾏解释的。虽然并不是所有参照常模进⾏解释的测验都是标准化测验,但⼤多数标准化测验都是常模参照型的([美]查尔斯·杰克逊:《了解⼼理测验过程》, 64页,北京,北京⼤学出版社,2000。),有⼈甚⾄认为所有的标准化测验都是常模参照测验([美]G.D.Borich & M.L.Tombari:《中⼩学教育评价》,241页、242页,北京,中国轻⼯业出版社,2004。)──参照常模解释结果的测验。传统的课堂教学评价测验中都含有标准化测验的精神,在对测验结果解释时,⼀般来说也都是参照常模来进⾏的,所以这⾥就重点从参照常模解释的⾓度对标准化测验结果的解释作出阐述。
(三)标准化测验结果解释的⽅式
⽬前,标准化测验的结果⼀般来说仍然是⼀个分数,就是前⾯所说的原始分数。对测验分数进⾏解释时,常模不同,对分数的含义所作的阐述也就不同。常见的对标准化测验分数的解释有以下⼏种。
铜钱价格表1.以平均成绩为常模的解释
这是实际的课堂教学评价中最常见的解释⽅式。在实际的课堂教学评价中,在对原始分数进⾏解释时,教师常常将单个学⽣的测验结果与团体的平均表现进⾏⽐较来解释,即把所有参与考试学⽣的平均分数作为常模,将单个学⽣的考试分数与总体平均分数加以⽐较,再对每个学⽣考试分数的含义进
⾏阐述。如下例。
⼝语测验中,某学⽣得了92分,从这个原始分数我们并不能看出什么意义,因为我们不知道其他学⽣的成绩怎样,没有参照标准,就不能说92分是个很⾼的成绩。如果现在知道了这次⼝语测验的班级平均成绩为80分,那么教师就可以作出这样的解释:该⽣的成绩在平均分之上。也就是说该⽣的⼝语⽔平在班级⾥应该是中等以上⽔平。
到⽬前为⽌,以整体平均成绩为常模对测验结果进⾏解释的⽅法仍常⽤于学业成就的评价测验,但教师可以在实际中尝试着运⽤其他⽅⾯的评价测验。
2.百分位
(1)百分位及百分位对测验结果的解释。在现实⽣活中,当学⽣向家长汇报测验成绩时,家长常常会问“有多少学⽣⽐你考得好(差)?”这就⽤到了另⼀种测验结果的解释——百分位,⼜叫百分等级,即⼀种相对位置量数。通俗地讲,百分位就是被试测验分数在团体中所占的位置,百分位数越⼤,位置就越⾼,说明被试的⽔平就越好。应⽤到标准化课堂教学评价测验中,就某⼀个学⽣来说,百分位数能反映出在⼀次测验中有多⼤⽐例学⽣的成绩⽐该⽣差(好)。如下例。
在⼀次问题解决能⼒测验中,50名学⽣中有40⼈的测验成绩低于45分,占全部⼈数的80%,因此,4
5这个分数就可称为处于第80百分位的分数。凡是原始分数为45者,其百分位数就是80。如果有学⽣得了45分,则有80%的学⽣在这次测验中的成绩⽐该⽣差。
在实际应⽤中,教师可以为了⽅便,使⽤⾃⼰编制的百分位分数常模,如每年固定的学绩测验中,就可以编制百分位分数常模。百分位分数常模使⽤起来⼗分⽅便,对照常模表,马上就可以确定学⽣成绩所对应的百分位。具体制定百分位分数常模的⽅法、过程可以参考有关教育、⼼理测量书籍。表7-1([美]查尔斯·杰克逊:《了解⼼理测验过程》,66页,北京,北京⼤学出版社,2000。)是⼀个学龄⼉童百分位分数的假设样本(常模),从表中可以很容易地看出与某⼀原始分数相对应的百分位分数。
表7-1百分位分数表(假设的范例)
端午高速收费不收费90 …………
……
85 …………
……
80 …………
……
…………
英文剧本……
…………
……
…………
…
…
1 5分或5分以下 10分或10分以下 8分或8分以下
(2)⼏个特殊的百分位。百分位数是连续的相对位置量数。在应⽤中,有⼏个特殊的百分位数常常被⽤到,下⾯就对这⼏个特殊的百分位数进⾏逐⼀介绍。
①中数。中数就是在百分等级中处于中间点的百分位,即第50百分位。处于这个位置的成员,有⼀半的⼈分数⽐他差。在课堂教学评价结果的解释中,中数很少单独使⽤,也很少⽤来对某个学⽣的测验结果进⾏解释,⼀般是和四分位数⼀起⽤于描述整个测验成绩的分布。下⾯就介绍四分位数。
②四分位数。第25百分位和第75百分位称为四分位数。四分位数的中间范围是第25百分点与第75百分点之间的原始分之差异,常常与中数⼀起⽤于测量分数的分布。如果中数所对应分数较⾼,四分位数之间段所对应的分数也普遍较⾼⽽且分布⽐较均匀,那么就说明这次测验学⽣整体成绩较好。如⼀次测验中的中数及四分位数之间段所对应的分数⽐历年同期同样测验所对应的分数⾼,那么就说明这次学⽣整体考得⽐较好。
(3)百分位的使⽤范围。在课堂教学评价结果的解释中,百分位对单个学⽣成绩的解释意义并不⼗分⼤,但在需要对整体测验成绩作简单的描述时常常可以⽤到。另外,百分位在描述整体分数分布时
有⼴泛的使⽤范围,不仅能⽤于学业测验,还可以⽤于⾮学业成就测验中问题解决的评价测验、情感态度评价测验等。
(4)百分位的优缺点。
①优点。第⼀,计算简便,常模的制定不难,使⽤起来⾮常⽅便,对照常模表马上就可以查到学⽣的百分位。第⼆,对原始分数的分布要求不⾼。即使学⽣的成绩不是按照正态分布,也可以⽤百分位进⾏解释。
②缺点。第⼀,不容易作进⼀步的统计分析。要在百分位基础上对总体成绩作进⼀步的分析、整理和描述很不容易,因为百分位不能⽤于四则运算。第⼆,⽤百分位解释原始分数时,只是给出了某⼀分数⽔平在总体中的位置,并未给出关于分数的实际差异信息,如第70百分位和第80百分位的学⽣实际分数差异是多少,在百分位分数常模表中很难看出。第三,从统计学上来讲,⽤百分位解释原始分数,实际上是低估了总体分数中两极分数的差异⽽⾼估了中间段分数的差异,就是说第95、98百分位和第55、58百分位之间同样都是差3个百分位,但前者之间所对应的分数差异⽐后者所对应的分数差异⼤。
3.标准分数
高中周记400字(1)⼀般标准分数。标准分数是以测验分数的平均数为参照点、以标准差为单位来衡量各原始分数在其常模团体中位置⾼低的⼀种评定量表(丁秀峰:《⼼理测量学》,126页,开封,河南⼤学出版社,2001。),⼜常被叫做Z分数。
在课堂教学评价结果的解释中,Z分数的意义有以下⼏点:第⼀,由于标准分数是以0平均数为参照点,教师根据Z分数的正负就可以判断某⼀原始分数在总体分数中的⼤致位置,正值说明在平均数之上,负值在平均数之下;第⼆,可以通过Z分数来⽐较两个以上的测验分数。
假如某学⽣语⽂成绩为92分,数学成绩为85分,教师不能说该学⽣的语⽂就⽐数学学得好,因为有可能语⽂试题简单,整体分数都偏⾼。但通过Z分数,教师就可以直接⽤两个Z分数值来进⾏⽐较,Z分数⾼者,在总体成绩中的位置就⾼,可以说学得更好些。
Z分数应⽤⼴泛,教师可以尝试在学业成就、情感、态度各个⽅⾯的评价测验中使⽤Z分数。具体使⽤时可以参考有关的测量书籍。
(2)转换的标准分数。在实际使⽤Z分数时,因为会有⼩数或负数出现,常常显得很不⽅便,为了避免负数和⼩数,就制订了许多其他的标准分数──标准分数系统。常见的有T分数、离差智商、标准九等。就课堂教学评价来讲,离差智商的⽤处不⼤,本章就不再介绍,这⾥主要阐述T分数和标准九在课堂教学评价中的应⽤。
①T分数。T分数最初由麦克尔(Michael)于1922年为纪念推孟和桑代克⽽提出,表达式可写为T=a+bZ,其中的Z即是上述的⽅法所计算出的可能会有⼩数点或负数出现的标准分数。
在课堂教学评价结果的解释中,T分数除了具有Z分数的⼀般功能外,主要优点是避免了负数和⼩数点,更加直观⽅便。如直接⽐较T分数的⼤⼩,就可以确定相应原始分数在总体分数中的位置,⼗分明了。
T分数最初是被⽤于12岁⼉童⼼理测验的常模团体,现在已经⼴泛⽤于其他常模团体,这⾥作⼀个简单介绍,具体原理可以参见教育、⼼理测量类书籍。在课堂教学评价结果解释⽅⾯,教师可以尝试运⽤于情感、态度、学业⾃我等各个⽅⾯。
②标准九。标准九意思是说标准化九级分制。最初由美国选拔飞⾏员所⽤,分数从1到9,将整体分为九段,是标准分数系统中的⼀种。
标准九在课堂教学评价中的应⽤与T分数相似,避免了⼩数和分数,可以⽤于对分数的整体情况的解释。它的独特之处就是提供了⼀个⼀位数的分数系统,简单明了,使⽤起来也很⽅便。
标准九原理也与T分数相似,最初⽤于选拔。课堂教学中,教师可以尝试⽤于各种测验结果的解释。另外,有分数解释中提到标准⼗,其原理、⽤途与标准九相似。
(3)标准分数与百分位的综合使⽤。如上所述,在解释标准化测验结果时,标准分数更适合于对分数整体作出解释,百分位则更适于对单⼀分数的解释。因此,在具体使⽤过程中教师可以将⼆者结合起来,列出对照表(如表7-2)。(丁秀峰:《⼼理测量学》,132页,开封,河南⼤学出版社,2001。)
表7-2标准⼗与百分等级范围对应表
笔记本排风扇从表7-2中,教师就可以⼀⽬了然地看出某⼀百分位(百分等级)范围所对应的标准分数和某⼀分数段所占的⼈数⽐例,既可以⽤于整体分数的描述,也可以⽤于单⼀成绩的解释,使⽤起来⾮常⽅便。当
然,在具体使⽤时,教师完全可以依据需要制订百分位与标准分的对照表,并附上原始分数。具体的制订可以参见教育、⼼理测量书籍,这⾥不再赘述。
(4)标准分数的优缺点。
①优点。第⼀,标准分数的差异与原始分的差异成⽐例,所以依据标准分数可以描述原始分数的整体情况。⽽且,经过转换后的标准分数往往更加直观、明了,使⽤起来也更⽅便。第⼆,因为标准分数是等距的,可以⽤来作四则运算,在对分数作进⼀步的统计处理时,得出的结果和原始分数⼀致,⽽且标准分数更⽅便,很适合对数据作⼀些深层的处理。如⽤来计算平均数或相关系数等。
②缺点。第⼀,因为牵涉到统计知识,对于⾮专业⼈员理解上会有困难。对于⾮专业⼈员来说,没有⼀定程度的统计学原理知识,理解标准分数很困难,这也是在课堂教学评价中不常⽤标准分数直接向学⽣、家长等反馈的原因。第⼆,如果原始分数不是正态分布,不宜使⽤标准分数。如前所述,使⽤标准分数的⼀个前提就是原始分数要呈正态分布,这是标准分数使⽤的必要条件,所以,尽管标准分数有不少优点,但如果不满⾜分数呈正态分布这⼀条件,也不宜使⽤标准分数。
4.其他分数系统
除了上⾯所述的⼏种参照常模的解释⽅法外,还有⼏种常⽤于解释学业评价测验(或分数)的⽅法。
(1)年级当量。年级当量是把学⽣的测验成绩与各年级学⽣的平均成绩⽐较,看它相当于⼏年级的⽔平。这⾥所说的各年级学⽣的平均成绩事实上指的是“年级常模”——各年级学⽣在测验中所得分数的平均数和分数的分布情况。也就是说,⾸先制订某学科学业成绩在各个年级上的常模,然后将学⽣在该学科上的测验成绩与年级常模⽐较,如果达到了某年级常模的平均成绩,就说明学⽣具有相当于这⼀年级的学业⽔平,也就确定了年级当量。如下⾯的例⼦。
对⼀个学⽣进⾏语⽂测验,其得分与常模上三年级的平均分数相同,那么,他在语⽂测验上的年级当量就是3。
樱的拼音和组词从上例可以看出,年级当量也是参照常模解释的测验分数,常⽤于解释学业测验,使⽤起来⼗分⽅便。但与其他参照常模的解释不同的是,年级当量⼀般只⽤于解释同⼀学科的测验,⽽且只有当⼏个年级同时开设某门课程,课程内容的⼴度和深度是有系统地发⽣改变时,才适宜⽤年级当量来解释被试的测验分数。不同学科之间是不能⽤年级当量来解释测验分数的。教师在使⽤时需要注意这⼀点。
(2)教育年龄。教育年龄(educational age)是模仿智⼒年龄提出的,是指某年龄学⽣的平均教育成就。与年级当量类似,拿⼀个学⽣的教育年龄与常模相⽐较,就可以确定⼀个学⽣的教育年龄。另外,教育年龄并不涉及实际年龄,这可以⽤下⾯的例⼦来说明。
⼀个学⽣的教育年龄是9岁,就是说这个学⽣的教育成就与⼀般9岁⼉童的教育成就相等,与他本⾝的实际年龄⽆关。
在学业成就课堂教学评价结果的解释中,还常⽤到学科教育年龄。学科教育年龄即按学科类别将教育年龄划分为语⽂年龄、数学年龄等,具体可以理解为对某⼀学科,⽤标准化测验对同年龄学⽣团体施测后所得的平均成绩。教师在使⽤时可以灵活掌握。
(四)对标准化测验结果进⾏解释时需要注意的问题
1.选⽤恰当的常模
多数对标准化测验结果的解释都是参照常模的解释,选取或制订的常模不同,对测验分数的解释会有很⼤不同,如,⽤优秀学⽣常模来解释差⽣问题解决能⼒的测验结果就肯定不⾏,所以选取适当的常模⾮常重要。在选取或制订常模时,⼀般来说常模团体的代表性越强越好,容量⼤的更好。教师在选取或⾃⼰制订时⼀定要注意这两点,否则会出现较⼤的误差。
2.考虑测验本⾝的信度和效度
在对测验结果进⾏解释时,除了整个解释的过程要尽量科学严密外,还要考虑⼀下测验本⾝的信度、效度。因为如果测验本⾝存在问题,即使测验结果的解释⾮常客观科学,也会有误差出现。所以,教师在对测验结果进⾏解释时,尤其是觉得有较⼤问题时,要适当考虑⼀下测验本⾝的信度和效度。
3.从发展的⾓度考虑测验结果的解释
⼀般来说,标准化测验的结果都是⼀个分数,因为是参照常模解释,从某种意义上说,分数对学⽣是⼀种终结性的评定。⽽对于学⽣的发展进步情况以及努⼒情况却不容易反映出来,但这些对于学⽣以后的进步却是很重要的。所以,教师在对标准化测验结果进⾏解释时,要尽量去平衡这些不⾜,全⾯考虑,选择恰当的⽤语,从发展的⾓度去解释测验分数。
⼆、课堂教学中替代性评价测验结果的解释
前⾯阐述了课堂教学中标准化测验结果的解释,下⾯介绍⾮标准化测验结果的解释。
(⼀)替代性评价测验和替代性评价测验结果解释的概念
所谓替代性测验,是指除标准化测验外的所有课堂教学评价测验,这⾥也简称为替代性测验,如表现性评价测验等。关于替代性评价测验的具体含义、特点等,本书在“学业成就的替代性评价”⼀章有详细介绍,这⾥不再重复,只是前⾯是针对学业成就的评价⽽阐述的,在这⾥把替代性评价测验的内涵扩⼤到所有课堂教学评价测验,包括本书所涉及的所有⾮标准化的评价测验。
替代性评价测验的结果⼀般是“⼀个分数”或者“⼀个等级附带⼀个分数”,替代性评价测验结果的解释就是对测验后这个分数或等级(加分数)的解释。前⾯介绍过,替代性测验与标准化测验有很⼤不同:它强调个体差异,突出学⽣主体性,不要求⼀致性。另外,除了试题测试外,替代性测验中更多的是任务完成测验,学⽣在完成任务过程中会有不同程度的原创性反应,因此,替代性评价测验中学⽣表现不⼀,多数测验任务没有固定答案。很显然,⼀般情况下替代性测验的结果不适合参照常模来解释,所以在这⾥就介绍另外⼀种解释测验结果的⽅法──参照“标准”的解释,很多⼈把参照“标准”解释的测验叫做标准参照测验。
(⼆)替代性评价测验结果的解释:标准参照测验
1.什么是标准参照测验
标准参照测验是指在和⼀组规定明确的能⼒标准对⽐之下,对被试的测验成绩作出解释⽽制订的测验。(丁秀峰:《⼼理测量学》,133页,开封,河南⼤学出版社,2001。)可以这样理解,在标准参照测验中,对测验评估的指标不只有⼀个,⽽是有很多个,在每个指标上可以有⼀个分数(或等级),也可以有多个衡量分数(或等级),以这样的评估标准来记分、解释的测验就是标准参照测验。下⾯给出了⼀个例⼦。
某教师在评估学⽣的⼿⼯设计时,选取了外型的新颖性、技术含量、做⼯精致程度⼏个指标,在每个指标上,教师制订了三个等级并在每个等级上都赋予了分数。外型新颖性⽅⾯:外型⾮常新颖(从没见到过)=3分,外型⼀般(在别的基础上加⼯⽽来)=2分,外型普通(很常见)=1分;技术含量⽅⾯:技术含量⾼=3分,技术含量⼀般=2分,没有什么技术含量=1分;做⼯精致程度:做⼯⾮常精致=3分,做⼯⼀般=2分,做⼯较差=1分。这就制订了⼀个系统的评估标准,教师在对⼿⼯测验进⾏评价时,就依据这个标准来进⾏。
从上⾯所给出的“标准参照测验”的例⼦中可以看出,对“⼿⼯设计”的评估其实就是等级评定。事实上,实际应⽤替代性测验进⾏评估时,由于学⽣的反应各异,不能够像常模参照那样对学⽣作出⽐较,很多都是界定⼀系列的指标对学⽣的表现进⾏等级评定,其本质上就是参照“标准”的评估,这在前⾯“学业成就的替代性评价”⼀章有详细的陈述,所以也可以说在参照“标准”对替代性测验进⾏评估解释时,替代性测验就是标准参照测验。这⾥并不是说替代性评价测验都是参照“标准”来解释的测验,也可以
参照常模来解释,但⽬前替代性测验的解释主要是参照“标准”来进⾏,所以本章主要从标准参照测验的⾓度对替代性评价测验结果的解释进⾏介绍。
需要补充的是,上述例⼦对“⼿⼯设计”的评估中,在每个等级上都赋予了⼀个分值,这是较为常见的等级评定。在实际应⽤中,等级评定还可以有另外⼀层含义,就是在每个指标上只给出⼀个最⾼分数如10分,但在具体进⾏评估时,教师可以根据学⽣表现,在这个分值范围内给学⽣打分,如5分或8分,这在学业成就测验中很常见,如教师对论述题的打分。以上所述的只是两种赋予分值的⽅式,虽有所不同,但实质上都是参照标准的评估,这⾥单独加以补充,以免教师在使⽤时局限于其中的⼀种。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论