高校档案馆自建全文数据库实践探索
高校档案馆自建全文数据库实践探索
直播平台哪个最火
档案数字化是档案馆发展的方向和目标,随着档案馆功能的转变利用数据库技术来组织、管理档案信息成为必然趋势,是实现档案从传统工具价值到信息价值转换的核心工具。而档案数字化的完成,应根据本馆的实际情况来进行,对于数量大、重要程度高、对设备、人员有较高要求的档案可以由外包公司来承担。而那些相对简单对设备、人员没有太高要求的。则可以由档案馆人员通过自建数据库来完成,通过自建数据库,既可以锻炼工作人员能力,使工作人员自身价值得以提高,增加自信心,也能促进工作人员的学习能力和人员之间的团队协作精神。同时还能减少档案数字化的资金投入,让有限资金发挥无限的作用,把更多的资金投入到更高层次,更具内涵的档案内在信息的开发工作中。
四川农业大学档案馆从自身的实际出发,在以外包为主的数字化模式基础上,充分利用现有设备、人力、网络免费软件,以自建数据库为辅,共同完成档案的数字化建设。由于,教务处学生成绩以条目的形式存在于数据库中,每个学生有几十条数据,与档案馆数据库要求的著录项目、字段、格式、要求相差太大,利用转换软件,错误率又太高。再加上历史原因,大部分学生成绩都没有电子版无法与现在的档案管理系统接轨。学生毕业后,教务处因数据
库整理等各种原因,导致学生无法下载成绩,这就加重了档案馆查阅工作。因此,学生成绩档案全文数据库的建立就成为势在必行的工作。同时,相对其它档案的数字化,学生成绩全文数据库对人员、设备要求较低。因此,我馆能够在现有设备和人员的基础上完成全文数据库建设。作者通过实践工作总结了一些经验以供同行借鉴参考:
一、自建数据库存在的问题
(一)人员问题:自建数据库对工作人员的数量、专业能力、计算机水平都有较高要求,而普遍档案馆工作人员不稳定,真正档案学专业人员较少、计算机水平偏低、自主学习能力太差。
(二)设备问题:这里的设备包括硬件和软件设备,根据建设的数据库类型不同所需设备也不一样,学生成绩数据库要求较低,只需一台高速扫描仪、几台计算机以及与之相适应的软件,但同样需要工作人员经过实践筛选出符合要求的设备。
清明节祝福语大全(三)技术问题:技术问题包括人员的计算机操作水平、设备运用能力、专业水平以及数据库维护能力等,而相对其它部门档案馆技术能力普遍较弱。
农贸市场管理制度
(四)标准和规范问题:档案数据库建设缺乏统一的标准与规范,著录格式不规范,如题名录入不全、不准确,造成数据接受和二次开发的困难;标引不规范,同一数据库的文献,有的用主题词标引,有的用关键词标引,前后不一致。主题词提取不规范,造成档案信息查询误检、漏检,利用效率下降。
(五)数据库维护问题:许多部门只重视数据库系统的建设,而忽视后期维护,更新迟缓,数据得不到完善与加强,安全防护不到位。后期的维护是保证数据库正常运行的保障,维护人员的业务水平、责任感直接决定数据库的利用效果。
二、解决措施
(一)建库人员的选择与培训。选择相对年轻、学习能力强、对工作热情、既有档案专业知识又有一定计算机知识的人员。经过有针对性的系统培训提高建库人员的计算机操作技能与网络知识的应用水平。
(二)设备的选择。(1)硬件设备的选择:由于大量历史遗留的学生成绩纸质档案,跨越年限较长,部分档案的纸张可能已经受损变质,同时由于不同年代纸张质量、规格、打印
要求不一致,加之,纸质档案具有易损坏,无法再生的特点。对纸质档案的保护也就成为档案部门必须重视的工作。因此,档案的现状,就对硬件设备的选择提出了要求,既要价格与功能适宜又要保护纸质档案不受损,最佳性能扫描仪的选择是保证档案数据库质量的基石。建立电子档案,尽可能减少对纸质档案的接触,是保护纸质档案的有效途径之一。
在充分利用现有设备的基础上,我馆通过多方论证,选择、准备好数字化所需的高速扫描仪。熟悉扫描仪的特点、功能和运用技巧,选择适合扫描件清晰度要求的模式,尽量选择清晰度高,而文件偏小的格式,有些模式清晰度高,但文件太大。所占档案管理系统内存太多,影响管理系统的运行(我们一般都选择PDF格式,也可以选择TIF或其它适合的格式)。
(2)软件设备的选择:在免费资源丰富的网络系统中,充分利用网络资源是实现节约资金成本的关键途径。根据建设成绩数据库的实际情况,成绩单的扫描,会产生很多图像文件,高速扫描仪通常是默认一页为一个文件。而在数字化过程中常常需要把相同的文件合并成一个文件或者把不同的文件分割成几个文件。这就需要一款PDF分割/合并软件,我馆通过实践筛选选择的是PDF Split Merge。该软件是1个独立工具不需要单独安装,主要用
于分割,合并PDF文件,允许分割/合并大的PDF文件到小一些的PDF文件。PDF Split Merge提供易用的图形界面应用程序和命令行应用程序。分割功能可以让你基于页组,页范围分割1个或多个PDF文件。合并功能允许你快速组合所收集的PDF文件及页码设定。支持文件拖放,列表顺序组织,保存,装载和附加批处理清单以及对所有产生的文件修改文件信息,例如修改作者,题名,名称或者关键字[1]。自建数字库过程中除了分割/合并软件,还需要一款批量改名系统,把图像文件与Excel表格中的学生名单合并起来,在实际工作中经过多次运用分析最终选择的是《春林文件批量改名系统》。该系统是一款功能强大集中了常用批量更名文件的优点的文件更名工具,可以把所有的文件快速方便的重命名;支持所有序号格式;支持更改文件扩展名,支持指定文件名的基本名称和扩展名,支持改名预览;支持按照mp3标签批量重命名文件,能去掉文件名中的数字、字母或其他指定字符,支持像acdsee那样按照指定模式重命名文件如自动添加序号,保留原文件名等功能;可以直接根据文本中的文件名创建文件夹[2]
(三)技术力量的支持。高校是一个人才云集的地方,现在大部分高校图书档案归属同一部门,图书馆数字化起步早,技术成熟,力量雄厚,有许多经验可以借鉴。因此,争取图书馆技术力量的支持是档案馆实现数字化的关键。
(四)制订统一标准规范。在自建数据库之前,先要查有关资料、问询档案同行制订出适合数据库要求的统一标准和规范[3]。包括标引的深度、分类、主题词和关键词的提取、著录规则。除严格按照国家标准以外,在细节上,要适合本馆特点,从档案的利用率从发。在尽可能提高查准率与查全率的基础上,还要为以后档案的深加工打好基础。
(五)数据库维护。数据库的后期维护是数据库正常运行的保证,数据库以数据准确、内容丰富、更新及时为特,才能吸引利用者利用查询。充分发挥出数据库的功能,体现信息的价值性。这就需要档案工作人员时时维护、更新数据,并形成制度与规定。 
三、自建数据工作的具体过程
我馆根据工作进度把工作细分为三步由三个人员来完成,流程如下图:
淘宝关键词优化纸质档案原件收集      整理      扫描      数据整合      挂接数据    质量控制
(一)纸质件整理、扫描。由一位工作人员做好学生成绩纸质档案的前期准备工作,与教
11月你好朋友圈说说
务处联系,把Excel格式的学生名单、学院名称、班级等信息的表格上传。整理纸质档案原件把成绩单按学院、专业、班级细分,编好序号,检查纸质档案的顺序,按顺序扫描纸质成绩单,并与原名单核对,发现缺失、错误的及时与教务处沟通补齐。扫描时,以人为单位建立一个图像文件,一个班合并为一个文件夹。但在实际工作中有些班级人数多照片页超过一页,学生也并不全是一人一张成绩单,有可是两页或者更多,这就需要使用前面介绍合并软件将多页的合并为一个文件。
我馆经过实践使选用的PDF Split Merge,是一款绿免费软件,操作简单便捷,只需把需要合并/分割的文件添加到软件中按提示操作就可达到所需要求。但在扫描过程中要注意扫描仪不能漏扫或者进纸不匀造成文件倾斜、变形,影响图像文件的质量。   
(二)整合数据。由第二位工作人员通过远程登录第一位工作人员的机子调出已经扫描好的学院的文件(这是因为,第一位工作人员随着工作进度,文件在不断更新),准备好教务处提供的Excel表格,选择学院、专业、班级,根据档案管理系统的要求,选择隐藏、添加行列。选定班级后,在第一行照片栏与扫描的班级照片文件相对应。并添加实体分类号、案卷号、保管期、一级目录、二级目录等以及档案管理系统所需的著录项,添加档案
号,如:第一卷第一项为1.0002(1.0001为班级照片卡),一个班级如果30个人就是10.0031。其它项按要求填写,然后复制名单与照片卡到春林文件批量改名软件,选择文件,把所需改名的班级调出,已经扫描好的文件就会出现在界面内。这时如果顺序不对可以通过拖动调整顺序,接下来就要把从Excel复制下来的班级学生名字顺序粘贴到左下角的框内。然后,在起始空格处选择,从1开始就默认为1不改动。如果不是就从实际序号开始,填写模板最为重要。格式如:2014-JX14,1.00##,(注意此处逗号为半角状态)如果模板错误又没有及时发现会造成接下来的文件都会出现错误。因此,必须认真检查、核对,填写好模板后就可以点击预览。这时,在改名预览处会出现改好名的文件,与前面框内文件顺序以及原纸质档案对应检查就会发现有无错误。如果确定正确后点击执行,改好名的文件正式生成.
所有文件完成改名后在教务处提供的Excel表格中把这个院的名单全部复制到一个新建的后缀为.xls.的文件中,通过档案管理系统(南大之星)按照预先设定的模板如:学生成绩模板、照片格式模板、光盘输入模板等,选定所需模板,选择著录项目倒入系统中,项目越多,检索点也越多,检索也越便捷。
(3)挂接。由第三位工作人员把文件挂接到预先倒入的案卷级目录下面,检查无错误后,再远程调出第二位工作人员改好名的图像文件,通过档案管理系统(南大之星)中的上传文件选择已改好的文件名称,挂接完成。核对无误后,打印案卷目录、再次整理顺序,装盒。
阴谋家四、数据质量控制
数据库建设是一项量大而烦琐的工作,必须要有足够的耐心与责任心,保证数据质量关系到数据库的查准、查全以及以后数据库的利用效率[4]。抓好质量控制主要做好以下几个方面的工作:1.互检:即互相检查、监督。下一项工作人员检查上一步工作人员的工作。发现错误及时提醒、修改。2.自检:即工作中的自我抽检。在做完一项工作过程中,自主抽检,不能只追求数量而忽视质量。3.审校。在所有工作完成后,由一位经验丰富的工作人员或者领导,认真复核,审查数据。如:数据的准确性检查、著录标引数据的核对检查,按照相应的标准与规范,把错误率控制在最低,并把容易出现错误的环节做记录,在总结时,即时提出。以便工作人员在接下来的工作中吸取经验、教训。避免浪费人力物力,做到事半功倍,充分保证数据质量。
数据库自建工作是外包数据的补充,是完善档案馆数字化的不可缺少的部分。信息化的趋势使档案工作者前所未所的贴近时代,而自建数据库是档案工作者实现自身价值、挖掘自身潜力,增强职业荣誉感的有效途径。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。