普通话水平测试国家题库制卷系统研制报告
普通话水平测试国家题库制卷系统研制报告
PSC国家题库建设课题组
一、引   
普通话水平测试国家题库建设,是保证200410月起在全国顺利实施新的《普通话水平测试大纲》的一项基础性工作,被列为国家语言文字应用研究“十五”科研规划重点项目“汉语普通话水平测试研究”的核心子课题(ZDI105—18—21)。
普通话水平测试开展已近10年,但题库研究和建设稍显滞后,部分省市仍采用人工制卷,既不经济也难以保证试卷质量,与蓬勃发展的普通话水平测试工作不相适应。虽有云南、上海、湖北、辽宁等省市相继开展题库建设,取得一定成绩,但尚未在全国范围内实现一致性和通用性,同时对机制试卷的人工干预环节仍需加强。因此,在吸收和借鉴地方题库建设经验的基础上,开发和建设与新《大纲》要求相一致的国家题库,对全国普通话水平测试具有重要意义。它是维护普通话水平测试法定地位的需要,是普通话水平测试工作发展形势的需要,也是维护普通话水平测试的社会信誉、体现国家级考试严肃性和权威性的
需要。国家题库系统的开发,将使测试试卷的规范性、灵活性、经济性和保密性得到很大提高,能够有效降低人工制卷过程中带有的主观性和不确定性,维护和加强普通话水平测试的科学性和权威性。本课题是一项具有基础性和全局性的研究,其成果可供全国共享,因此具有重大的社会意义。
在国家语委普通话培训测试中心、上海市普通话测试中心等单位的共同努力下,课题组经过近一年时间的准备、规划和开发,于20048月基本完成了开发工作,并于2004928日在北京通过了由教育部语言文字应用管理司和
语言文字信息管理司组织的专家鉴定。
                           
    课题负责人:  刘照雄、王晖(执行),成员:姚喜双、韩其洲、刘新珍、侯玉茹、孙海娜、齐影、陈茜、韩玉华(兼课题秘书)、于谦;孙晓先、栾印华、赵伟国、乔丽华、王颐嘉、罗兵。
二、题库系统设计的指导思想
普通话水平测试国家题库系统,是按照《普通话水平测试实施纲要》(以下简称《纲要》)所规定的制卷原则和要求,进行题库内容设计、制卷规则设计,最后由计算机根据这些规则自动随机地产生符合《纲要》要求的试卷。系统的设计完整体现了《纲要》对测试项目的要求,系统所生成的试卷涵盖了目前《纲要》所规定的全部测试项的内容。因此,制成的试卷将是全面反映《纲要》要求的、内容完整的标准试卷。试卷样式的设计在总结几年来普通话水平测试试卷使用情况的基础上,根据不同省市使用的特点,确定了两种不同类型的标准试卷。
系统还提供与试卷相关的辅助内容,便于对所生成的试卷进行分析和检验。其中包括了试卷的标准答案、声韵母覆盖分布状况和单音节词语的声调分布等内容。系统所提供的对题库元素的分类统计功能,将为制卷规则的合理制定提供相应的依据。
系统提供了开放式的结构,用户可进行题库资料的修改。
三、系统的组成
1 系统结构图
整个软件系统主体结构分成以下几个子系统:题库基本资料、试卷系统和系统控制。
(一)题库基本资料
该部分主要是用来执行储存《纲要》全部内容的电子资料,制卷系统所需的试卷元素全部来自该资料库,它是整个系统运行的基础。该部分包含了用户对题库资料的维护、查询和统计的功能。
(二)试卷系统
该部分依据《纲要》所规定的制卷原则,基于题库基本资料所提供的元素,实现计算机自动出卷,并具备试卷输出、试卷相关属性统计的功能,是整个系统的核心。
(三)系统控制
该部分主要涉及系统的安全、系统的日常维护和用户的权限设置,执行对整个系统的管理职能。
四、系统主要特点
(一)系统环境结构
系统采用用户交互的运行模式进行制卷。用户界面采用windows图形界面,界面友好,操作方便。系统的环境结构如图2所示。
系统环境结构
(二)安全控制
进入系统的用户必须由管理员指定,并由管理员指定其登录名和密码,可使系统在使用安全性方面有可靠的保证。
    系统可对每个使用系统的用户指定其使用的范围,目前可进行限制的权限
循规蹈矩的反义词
奥迪a3敞篷版有:1.系统设置;2.题库资料维护;系统软件卸载3.制卷和打印;4.查询。
(三)字词的指标控制和排版
在编制试卷时,声韵母的搭配和声调的控制是比较困难的环节,系统在这方面进行了很好的处理和控制。系统对声韵母出现次数的控制按照均衡性原则处理,第一部分(单音节字词)和第二部分(多音节词语)的每个声母出现的次数控制在35个,韵母出现的次数为七夕 诗句24个(个别特殊韵母除外)。同时,实现了单字和词语两部分的声韵母总的出现次数的上限控制。在音节数的控制方面,尽可能使第一部分、第二部分出现的音节不重复。理想的状态下,实现了音节数198个,一般情况下,可不低于195个。目前,经计算机处理和控制,单音节字词中4个声调出现的次数基本可达到均衡。
系统对第一部分和第二部分的元素的排列顺序作了严格的控制。单音节字词的排版格式是1010列,多音字排在试卷的最右列,并保证相邻位置上字词的声母和韵母不同,相同声调的字词也不会相邻出现。多音节词语的排版格式是77列,四音节的词语(如果有)则放在试卷词语部分的末尾,具有相同属性的多音节词语(轻声、儿化、上声和上声相连或与其他声调连等等),不会出现在相邻的位置上。
(四)制卷效率和性能
系统在CPUP 1.8G以上,内存256M以上,硬盘转速5400以上的PC机上,正常制卷的时间是46分钟。
系统原则上没有限制制卷数量的总数,但考虑到现有数据库的储存容量,同时也为了提高制作效率,建议用户在制满1000份试卷后,在做好的数据库备份的前提下,删除部分旧的试卷。
系统在制卷方式上提供了无指定词语和可指定词语两种方式,对于需指定出现在试卷上的字词,系统提供了相应的选择功能。每次制卷的数量可由用户任意设定。
(五)输出的内容和格式
试卷的输出格式是采用Microsoft Word的电子文件形式。采用该方式可以方便用户进行人工干预,用户可根据需要进行试卷内容的变更。Microsoft Word是目前最流行的字处理软件,使用这种文件格式也为试卷付印提供了方便,一般的印刷商都能接受word文件的格式,不需要进行重新排版。
叶青歌仔戏陈三五娘系统提供了对试卷样式的灵活选取的方式,用户可以对试卷的输出样式和输出字体进行调整。
目前系统输出的试卷内容有:
.A型卷(带选择判断部分);
2腾讯微博账号.B型卷(不带选择判断部分)。
A型卷和B型卷除在选择判断部分不同以外,其余部分均相同。同时输出的还有与该试卷相关的分析内容,其中包括:(1)标准答案;(2)试卷的音节分布表、单音节词语的音节分布表、多音节词语的音节分布表;(3)单音节词语声调统计表。
(六)制卷过程的随机性控制
按目前的大纲要求,由于规则的相互牵制,第一部分和第二部分的字词元素的选择是一个难点,容易造成某些元素在卷面上出现的的频率过高。为避免这种现象的产生,系统对已出现的频率过高的字词元素自动进行锁定。系统在设计上充分考虑了试卷元素对于题库元
素的覆盖性,题库中所有元素理论上均有机会出现在试卷中,除去个别的元素由于人工干预限制其出现,其他部分元素的出现均按随机性原则进行处理。
(七)题库资料分类统计
    系统可对储存的题库资料进行分类查询和统计。由于系统在输入《纲要》资料时对所有的元素进行了详细的标注,用户可按目前的测试要素对题库中的元素进行查询和统计,例如:可按儿化词语、轻声、表号等条件对题库内的资料进行搜索,搜索的条件可以是多重组合的。
(八)试卷分析和统计
    系统可对已经生成的试卷进行各个测试要素项的统计。通过这些统计资料,可以对音节和词语的覆盖状况进行分析,也可以检测每份试卷不同词级的比例(《纲要》中以***和不带*作区别)、轻声、儿化和上声连接词语等测试要素的数量是否满足规定要求。
五、开发工具
系统采用的主要开发工具是VB 6.0,数据库采用的是Microsoft Access 97,报表输出是采用Crystal Report
六、部分性能实测结果说明
为了检验系统的效率和各项性能指标,我们对系统进行反复测试,所得结果完全达到设计的要求。
下面是2004819日的部分测试结果。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。