收稿日期:2021-05-08
作者简介:
王希常(1964—),男,山东省教育招生考试院研究员;张敏强(1955—),男,华南师范大学教授,博士生导师;吕冰彩(1988—),女,山东省教育招生考试院助理研究员。
王希常1
张敏强2
吕冰彩1
(1.山东省教育招生考试院,济南250011;2.华南师范大学,广州510631)
新高考等级分数转换模型及
算法实现策略分析
0引言
2014年开始的新一轮高考综合改革(以下简
称“新高考改革”),是自1977年恢复高考以来最
系统、最全面、最深刻的一次改革。本轮改革中,首次在高考选考科目计分中采用等级赋分方式,由此引发了一系列探讨,将新高考改革研究推向深入。作为教育测量分数模型的一种形式,等级分数有其独特的特点,也被国际上很多重要考试所应用[1],如英国的A-level 、韩国的大学入学考试(College Scholastic Ability Test )等。事实上,在针对多水平筛选的考试应用中,等级分数可以更加明确地对应目标需求,简化分数的解释和使用方式,降低“分分计较”的程度。
新高考改革的第一批试点省市——浙江和上海提出的选考科目计分方式是基于起点分数的多等级等距模型,其中浙江使用的是起点分数
为40分的21等级3分间隔模型,上海使用的是起点分数为40分的11等级3分间隔模型,浙江选考科目的最高分数是100分,上海是70分。从这2个等级分数的形式来看,其创新性主要体现在4个方面:1)使用预定比例划分原则确定等级水平,每个等级水平具有各自的比例区间;2)使用起点分数,最低分数确定为一个大于0的正整数,以通过合格考对该起点分数进行解释;3)使用等间隔分等赋分方法,设置多个水平分值;4)具有等级水平和可加分值的双重特性,等级分最后合并到总分数,用于测量考生的整体水平。
上述4个特点反映了新高考改革等级赋分的设计目标和应用特性。起点分数有益于消除一次性考试的偶然性因素,比例划分为等级分建立了测量水平的解释,间隔值的使用力图消除“分分计较”的细粒度分值特性。尽管高考总成绩仍然采用各科目加和方式,在一定程度上削弱了等
Journal of China Examinations 2021年第6期No.6,2021
级分的含义和作用,但是相对于原始分赋分方式来说,等级赋分可以说是一个重大突破。
新高考等级赋分具有鲜明的特点,在统一设计框架下,各试点省份提出了不同的模型,需要对其测量意
义进行一些剖析。从等第划分方面,依据体分数分布形态,按照规定比例划分等第,目的是标识考生在体中的分等水平。从分数量值方面,对各等第依据一定规则赋予分值,可以视为回归量化。因此,新高考等级分数也可以称为分级量值分数。为了将等级分数更为科学、有效地推广到后续的新高考改革省份,应基于等级分数转换的各种规则和本次改革的总体设计框架,针对各种等级分数模型的等级划分方式,建立一个较为统一的表述方式,形成一致的描述公式,以利于在科学性和应用方式上进行分析和解释。
1等级分数转换模型的统一表示形式等级分数转换算法大致有3个基本步骤:第一步,确定原始分数等级区间;第二步,确定原始分数等级区间到转换分数区间的映射函数;第三步,在每个分数段中使用映射函数转换分数。其中,确定原始分数等级区间是一个较为复杂的计算过程,需要通过计算分段比例表、搜索确定端点序列(含第一区间开始端点、其余区间末端点)、由端点序列生成等级区间等步骤实现。
目前已启动新高考改革的省份虽然各自使用的模型都有一定的特点,但可以从形式上给出一个转换的统一表达。为实现统一的表达形式,首先需要转换过程上的统一表述。通过分析目前各种等级分数模型,其转换方法都可以归结为下面的过程:
1)参数设置:等级比例[r1,…,r n],转换分数区间{[y11,y12],…,[y n1,y n2]};
2)原始分数各分值点累计比例计算;
3)按照比例划分原始分数区间{[x11,x12],…,[x n1,x n2]};
4)计算各区间转换公式y i=f i(x);
5)使用公式将原始分数转换至等级分数。
比较关键的区间转换公式,可以统一使用下面的线性公式表示:
y=a
i
x+b
i,i=1,…,n。(1)
其中:x为第i区间的原始分数,x∈[x
i1,x i2];y为
转换后的第i区间分数,y∈[y
i1,y i2];a i、b i为对应区间的转换系数。
公式(1)可以作为一个统一的表达形式,适用于目前已经推出的各种新高考等级分数转换模型,分析如下。
1)浙江、上海、北京、天津模型。采用3分间距等第赋分,将原始分数区间转换为一个固定分值,可以视为转换区间的退化。在转换公式中,采用a=0,b=y i1的设置,输出分数区间退化为一个点,即区间[y i1,y i2]中y i1=y i2。
2)山东模型。使用正态化比例区间划分原始分数区间,分区间进行等比例转换,即在原始分数区间和转换分数区间之间进行线性映射。等比例转换线性公式表示为
y=
高考科目及分数y
i1-y i2
x
i1-x i2
(x-x
i2
)+y
i2,i=1,…,8。(2)3)第三批试点改革的8个省份模型。在山东模型的基础上,进行了起点分值、区间数和比例等参数调整,转换方式相同,可以直接使用公式(2)。具体参数调整为:区间数量n=5,起点分数为30分。
通过上述分析,等级分数转换可以视为从原始分值x,求取映射值y的过程。这个过程可以使用映射关系进行表示,给出一个各类等级分数模型的统一形式,即分段线性公式(1)和公式
王希常等:新高考等级分数转换模型及算法实现策略分析·
·57
2021年第6期
(2)。这个统一形式也表明,作为分数转换的一种创新模式,分段线性分数模型代表了对等级赋分的广泛性认知,这种分数转换模式也值得深入研究和探讨。
2等级分数转换算法实现策略
选考科目的分段线性模型由设置比例、划分区间、线性映射等过程组成,算法实现中会出现多种方案的选择问题,需要进行控制策略的分析,以明确计算过程的流程设计、类型结构及状态表示,保证转换结果的确定性。在科学计算中,计算结果的确定性涉及计算方法和数值表示,经常会造成数据的偏差和歧义,必须给予充分重视[2-3]。
等级分数转换算法策略,主要针对算法实现中的开放性和不确定性,计算结果受算法流程控制方式、数值设置模式等方面的影响。在技术实现方面,可以忽略一些普通的数据和数值处理方式,如文件格式、存储编码、显示方式等。本文主要分析对计算结果产生直接影响的流程控制和数值方法。
2.1流程控制策略
计算流程选择是算法设计的基本策略,也是支持分数科学解释的主要理论支撑,主要包括数据顺序、端点逼近、比例累积、端点确定、退化处理等。这些策略直接影响分数计算的结果。
1)排序方式。
为了确定原始分数区间,需要计算原始分数的各分值点按照一定顺序的累积比例值。累积的顺序是需要选择的一个策略问题,存在升序和降序2种选择。由于分值的离散性和不对称性,不同顺序对结果会产生影响。
2)区间端点比例逼近方式。
使用预定比例值定位区间端点,实质上是在
一个顺序序列中搜索最接近值的问题。在顺序序列中搜索最接近值是一个通用问题算法,在分值点的逼近值计算中,需要考虑更多的选择策略。其中,还存在一个相等比较的误差控制问题,将其归于计算控制策略中。
在累积比例值序列中搜索一个值r的最接近值时,所需要采用的逼近方式有下面4种选择策略:第一种,取上端最小值(upper_min),即搜索大于等于r的值中的最小值;第二种,取下端最大值(lower_max),即搜索小于等于r的值中的最大值;第三种,取最近最小值(near_min),即搜索最接近r的值,存在距离相等值时取最小值;第四种,取最近最大值(near_max),即搜索最接近r的值,存在距离相等值时取最大值。
在near_模式的搜索中,距离相等的情况存在于r的小数尾数为5的情况下,即.xxd5,其前后2个实际比例
值分别为.xxd和.xx(d+1),到两端的距离皆为.0005。当采取near_min的模式时,得到.xxd,而采用near_max时,就得到.xx(d+1)。
如果不考虑分值空值的比例值(即人数为0的分值点),则不存在多个相同值的选择,在搜索最接近值情况中最多会出现2个距离相等值。存在多个空值分值点时,默认的策略是忽略空值的作用,即寻非空值分值点。如果这个策略作为一种扩展,上面的选择会产生更多的方案。
3)区间端点对应比例累积方式。
使用预定比例确定分值区间,需要一个搜索过程,搜索过程是基于比例值寻对应分值点作为区间端点。在比例值对应中会存在一定误差,这些误差是否累积到下一个端点搜索,存在2种选择策略:第一种,非累积方式,即给定预定区间比例值序列[r1,…,r g],搜索第i个区间的端点时,使用值r1+…+r i在考生各分值点的累积比例值表中搜索p i;第二种,累积方式,即如果第i-1次搜
··58
索到的累积值为p i-1,使用p i-1+r i搜索p i,这种方式实际上使用了累积误差。
累积方式的策略是在前面的区间实际对应比例值的基础上,加上当前区间的预定比例值,作为当前区间的预定逼近值,用该值搜索对应的实际比例值。之所以称为累积方式,是该方式会累积每次逼近时的误
差。非累积方式则使用前面区间的预定比例值,加上当前区间的预定比例值,作为确定当前区间端点的比例值。
4)第一区间端点确定方式。
在确定原始分数等级区间的过程中,先确定第一个区间的开始端点,即所有区间端点序列的第一个端点。确定第一个端点有2种方式:第一种,使用卷面定义分值,即卷面定义分值最大(降序)或最小(升序)值;第二种,使用实际分值,即实际得分的最大(降序)或最小(升序)值。5)区间起始端点的确定方式。
除第一个区间外,按照顺序确定各个区间的起始端点时,一般根据上一个区间的末端点来确定本区间的起始端点。如何确定各等级分数区间的起始端点,存在2种确定方式:第一种,共享,即与上一个区间的端点共享,使用上一个区间的末端点;第二种,顺延进阶,即从上一个区间的末端点顺延,根据分值的间隔值增加(升序)或减少(降序)。6)最后区间末端点确定方式。
最后一个区间的末端点,是所有分值端点的最后一个点。由于受到总体分值区间的影响,存在类似于确定第一端点时的不同确定方式,有2种选择:第一种,使用卷面定义分值,即理论最后值,考虑排序的方式,为卷面定义分值最小(降序)或最大(升序)值;第二种,使用实际分值,即实际得分的最小(降序)或最大(升序)值。7)区间退化处理方式。
如果出现一个分值点人数特别多的情况,该分值点所占的人数比例达到了一个区间的比例,则会出现区间退化的情况,即区间退化为一个分值点。在区间退化情况下,线性映射公式不再存在,映射变为一个点对多点的问题,需要使用一个退化处理的策略。
原始分数区间退化的选择策略有3种:第一种,映射到最大值,即将原始分数分值映射为转换分数区间的最大值;第二种,映射到最小值,即将原始分数分值映射为转换分数区间的最小值;第三种,映射到其他值,即将原始分数分值映射为转换分数区间中的某个值(也可以引入计算公式)。
按照分值向上的习惯做法,映射到最大值是最常用的。在大规模考试中,出现该类情况的概率非常小,除非出现分数分布异常情况,或区间划分粒度过小,使原始分数单个分值的人数过多,造成原始分数区间成为单点。
8)区间消失处理方式。
区间消失情况是指某个等级区间没有到。当上一个区间在搜索匹配的比例值时比例值误差较大,覆盖了当前区间的比例值,会造成当前区间的比例值不能匹配。区间消失一般发生在下面的情况:当前区间比例值较小,上一个区间的定位误差较大,致使当前区间的定位比例值被淹没。另外,若出现一个分值点的人数较多,而且选择使用了误差累积的策略,也容易导致某个原始分数等级区间消失的现象。如果消失区间出现在所有区间的末端,说明消失区间内没有实际得分分数,不需要调整策略;但当这个区间
出现在中间位置时,会影响后面区间的对应取值。
区间消失处理的选择策略有2种:第一种,保持实际的位置,后面的等级区间不能映射到消失区间的对应转换分数区间;第二种,调整消失区
王希常等:新高考等级分数转换模型及算法实现策略分析·
·59
2021年第6期
间的位置,将后面存在的等级区间上移,对应到消失区间相应的转换分数区间。
2.2数值控制策略
分数转换是一个数值计算过程,要实现一定的确定性,需要对数值表示和计算处理方式进行一些限定或约定。实际上,等级分数转换涉及浮点算术运算,而浮点数计算是科学计算中需要处理的关键问题[3-4]。
1)分值范围控制。
分值范围限定,可以认为是对考试分数范围值的定义。这个限定策略一般用于支持某些计算模式中策略空间的确定,如首端点或末端点的确定。考试分数范围值,即理论得分值的上下限,也可以理解为原始分数设计的最大值和最小值。2)微小值控制。
设置微小数值,用于在浮点数计算中实现确定性,建立基于忽略微小值差异的浮点数比较和最小误差控制。浮点数比较对分数转换计算中的诸多判断会产生影响,是一个需要注意的问题。为了排除近似表示的影响,通过设定最小误差,使相当接近的数值被判定为相等,是一个好的计算控制方式。
根据分数计算的精度需要和浮点数表示精度,可以将考生人数的倒数作为最小误差的基准要求,考试规模小于千万人数时,推荐设置为10-8。考虑一般计算环境中都会使用双精度浮点数,双精度浮点数的有效位精度为10-16,建议设置的微小值不小于10-15。
3)小数舍入方式控制。
等级分数转换公式会产生浮点数,而转换分值会规定保留小数位数,需要给定一个数值舍入原则,分数计算中基本使用四舍五入方式。目前,大多数计算平台都支持多种舍入方式,其中包括四舍五入,但缺省的方式往往不是四舍五入,如Python中的缺省舍入方式为靠近偶数模式,也称为银行家算法。如果改
为四舍五入,需要使用decimal模块,在decimal类型数值中进行ROUND_HALF_UP设置。同时,需要考虑浮点数的表示问题[3-4],当分数的分母中含有非2的幂的因数时,浮点数不能精确表示,由此造成的失真可能会影响计算结果。
3结束语
新高考改革等级分数转换是一项创新,面临科学性和适用性的双重挑战,为此应给予充分重视。任何一项高利害考试,赋分方法和分数转换都是核心问题,对等级分数的科学性设计和合理的解释应用是考试领域的重要研究课题。本研究在分析新高考目前各种等级分数转换方法的基础上,从分数模型的特点和算法实现的角度,提出了等级分数转换算法实现策略,并使用Python语言对流程控制和数值计算的影响进行了验证,实验证明这一算法是有效的。本文呈现这一研究成果,希冀为新高考改革在选考科目等级赋分的实现方面提供一些有益的参考。
参考文献:
[1]KORETZ D.Measuring up:what educational testing re⁃ally tells us[M].Massachusetts:Harvard University Press,2008.
[2]ACTON F S.Real computing made real:preventing er⁃rors in scientific and engineering calculations[
M].Princ⁃eton,NJ:Princeton University Press,1996. [3]GOLDBERG D.What every computer scientist should know about floating-point arithmetic[J].ACM Comput⁃ing Surverys,1991,23(1):5-47.
[4]IEEE Standards Board.IEEE standard for binary float⁃ing-point arithmetic:IEEE Std754-2008[S/OL].[2021-05-10]./document/4610935.
(下转第69页)
··60
A Study on the Linking of Academic Proficiency Rank Examination
in the New College Entrance Examination
ZHANG Yuanzeng
(East China Normal University,Shanghai 200062,China )
Abstract:Linking grade scores is a major technical problem to be solved in the new college entrance examination system.Based on a comparative analysis of the limitations of the within-grade equal propo
rtion score conversion scheme and the equal logarithmic difficulty ration score conversion scheme,the equal achieving standard degree score linking scheme is proposed,along with an analysis of its application range and conditions.Given the practice and culture of education examinations in China,among the three schemes,while the equal logarithmic difficulty ration score conversion scheme is feasible for the score conversion of the academic achievement rank examination,the equal achieving standard degree score linking scheme is obviously the most ideal.Keywords:college entrance examination reform;academic proficiency rank examination;test linking;score
conversion
(责任编辑:陈
宁)
张远增:新高考学业水平等级考试的等级分连接研究Analysis on the Grade Score Conversion Model and
Algorithm Implementation Strategy in the College Entrance Examination
WANG Xichang 1,ZHANG Minqiang 2,LYU Bingcai 1
(1.Shandong Provincial Academy of Educational Recruitment and Examination,Jinan 250011,China;
2.South China Normal University,Guangzhou 510631,China )
Abstract:According to the college entrance examination reform pilot provinces to adopt the score scheme of selected subjects,this paper puts forward the unified expression of the grade score conversion model and the implementation strategy of grade score conversion algorithm based on the analysis of the characteristics of each conversion model.The establishment of a unified score conversion model and a clear grade score conversion algorithm strategy are very important for the actual examination policy-making and score conversion,which can ensure the standardization of algorithm technology and ensure the standardization and consistency of score conversion.Keywords:college entrance examination reform;academic proficiency rank examination;grade score;score
conversion model
(实习编辑:武录里)
(上接第60页)
·
·69
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论