数字化加工管理办法
(暂行)
为了加强对数字化加工工作的监督与管理,特制订本办法。
1 原始资源的检验
1.1 电子排版文件验证整理
1.1.1资源收集整理
(1)查已经出版图书的电子源文档。
(2)如无法到相应的电子版源文档,则进行登记。重阳节是法定假日吗
(3)按出版时间对电子文档应进行归类。
根据出版时间对电子文档进行分类,著录相关元数据信息:图书名、ISBN、书名、作者、出版社、出版日期、版次、纸书定价。
1.1.2 资源验证
对电子版文件进行验证,主要对图书内容的完整性、正确性进行验证。验证内容包括:图书封面、版权、插图、正文内容、字体等。
1.2纸质图书及电子源文件比对验证
验证内容水费网上缴费主要包括:
(1)核对文件接收清单与实际图书的名称一致性。
(2)检查待扫描图书完整性、正确性。检查内文是否有空白页、缺页、缺封面、缺封底、破损、插页、脏污、倒页、装订压字等状况。
(3)核对纸质图书版本与电子文件版本一致性。
1.3纸书拆装要求
(1)加工如需对样书进行裁切,裁切后的图书要进行还原,还原后的图书不得伤及和损坏内文,不得丢页、混页。
(2)样书还原要恢复原有装订形式。
2 各类资源的加工范围
2.1 纸质图书
双层PDF文件:图像层包括从封面到封底的所有页;文字层包括除封面、封底的所有页内容,其中正文的书眉、装饰性的底纹、花边等不做加工。
单层纯图像PDF文件(供按需印刷使用):包括从封面到封底的所有页。
XML文件:包括从封面到封底的所有页,广告页、装饰页、宣传页除外。
2.2 电子文件
矢量PDF文件:包括从封面到封底的所有页。其中封面、封底、勒口需要扫描(出版社提供实体书)。
XML文件:包括文前、文后及正文的所有页内容。
说明:单纯纯图像PDF文件:指通过扫描录入后,经过去污、纠偏后生成的纯图像PDF文件。
双层PDF文件:指通过扫描录入后,经过去污、纠偏、OCR识别,并辅以人工校对,生成可以检索的PDF文件,这个PDF文件是双层的,上层是原始图像,下层是识别结果,保留原始版面效果,并且支持选择/复制/检索等功能。白葡萄酒和红葡萄酒的区别
矢量PDF文件:指由电子文件直接转制生成的PDF文件。该文件保有原始版面效果,并且保有完整的文字和图片信息,支持选择/复制/检索等功能。
3 成品数据规格及质量要求
3.1原始图像文件
(1)图像文件的规格
1)书的封底、封面、勒口及书中的含有彩插图的页,整页扫描成600DPI的彩图像;
2)书中的含有灰度插图的页,整页扫描成600DPI的灰度图像;
3)对于原书中的其他页,整页扫描成600DPI的黑白图;
4)图像文件以无损压缩TIF格式提供。
(2)图像文件的质量要求
1)图像清晰,版心居中,无倾斜,无污点,无颜失真现象;
2)同一本书的每一页图像版心大小要统一,图像尺寸要相同;
3)图像完整无残缺。
3.2 PDF文件
3.2.1 PDF文件规格
纸质书:将图像和文本洋葱炒肉制成双层PDF文件,图在上,文本在下。其中图像所使用的图像格式为JPG,精度为300DPI。同时制作单层纯图像PDF文件,图像精度为600DPI,可供按需印刷使用。
电子文件:制作矢量PDF文件,“印刷质量”(按Adobe PDF规格)和“标准”(按Adobe PDF规格)各一份。
3.2.2 PDF文件质量要求
3.2.2.1纸质书制作的cad图形界限PDF文件
(1)PDF文件的数据要完整,无缺页、重页,页码顺序颠倒等情况发生。
(2)双层PDF文件中所使用的图像要求压缩后符合JBIG2、JPEG2000标准的压缩比为7。文字使用黑白图,灰度图像使用灰度图,彩图像使用彩图。一页中既有文字也有图像的,做拼图处理。
(3)双层PDF文件的图像层和文字层的文字对位准确,保证反显区域与文字区域相差1/3字符以内。文字层的外文数字、标点、符号等均应采用半角。
(4)书签制作。
1)PDF文件制作书签,确保电子书的目录,内容和原书中目录一致。书签的功能是用户点
击书签的某一章节,电子书会自动显示为相应页。打开农业谚语PDF文件时,自动显示书签,书签只展开到第一级目录。
2)在图书的封面、封面后的折页、第一次出现书名的地方、版权页、封底前的折页、封底,添加书签“封面、前折页、书名页、内容提要、版权页、后折页、封底”,其它出现与章节平级的(如序,前言,后记等)内容,必须在图书PDF文件出现的地方按原书内容添加书签。
所有书签均按原书实际顺序排列。
(5)PDF文件初始放大率设置为“适合页面”,书签动作缩放比例设置为“承前缩放”。
(6)打开一本电子书阅览并对文字放大时,保证在放大到百分之二百的时候,字迹清晰,笔画连续,无断裂、缺块的现象,倾斜度不能超过0.5。
(7)每个双层PDF文件综合差错率小于万分之一。
(8)同时制作的单层纯图像PDF文件所使用图像为600DPI,除无文字层外其他要求与双层PDF文件相同。
3.2.2.2电子文件制作的PDF文件
(1)电子文件转换的PDF文件,应纠正内码错误(原文文字错误可以除外,特殊情况经协商,可以调整加工方式),确保所有文字内容能够被正确检索和拷贝,其中外文数字、标点、符号等均应采用半角。每个PDF文件的文本内容与电子数据一致。
(2)数据内容完整,无缺页、多页、重页、页码顺序颠倒等情况发生。
(3)书签制作。
1)PDF文件制作书签,确保电子书的目录,内容和原始数据中目录一致。书签的功能是用户点击书签的某一章节,电子书会自动显示为相应页。打开PDF文件时,自动显示书签,书签只展开到第一级目录。
2)在图书的封面、封面后的折页、第一次出现书名的地方、版权页、封底前的折页、封底,添加书签 “封面、前折页、书名页、内容提要、版权页、后折页、封底”,其它出现与章节平级的(如序,前言,后记等)内容,必须在图书PDF文件出现的地方按原书内容添加书签。
3)所有书签均按原书实际顺序。
(4)PDF文件初始放大率设置为“适合页面”,书签动作绽放比例设置为“承前缩放”。
(5)对于不完整的电子数据,内容补充完整后按照以上要求加工。对于无法补充完整的,经协商,可以调整加工方式。
(6)对于规程规范类图书,补扫的封面应该做文字层。
(7)电子文件转制的PDF文件,其CIP部分如果为图片格式,应补做文字层。
3.3 XML文件
本项目数字化加工,要提供符合数据库提取标准的XML格式文件。其中:工具书按照比较精细化的颗粒度要求拆分,一般要求拆分至条目;普通图书(包括科技书、论文集、规程规范等)拆分至章(节)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论