附件:地方资料数字化加工处理招标及技术要求
1、 投标供应商注册资金在50万元以上。
2、 投标供应商应提供至少两个从业人员资格证明文件。
二.地方资料数字化加工技术解决方案
通过对项目加工要求的仔细分析,本次地方资料数字化加工的内容主要为地方资料图书进行扫描加工,完成的数据应用于数字图书馆平台发布,具体详细实施方案如下:
生产流程
对图书馆地方资料进行数字化加工,其加工流程如下:
地方资料数据加工工艺流程
根据地方资料文件全文转换及版式还原的技术要求和工作特点制定如下工作流程:
地方资料数字化加工数据标准
图像
序号
制作标准
1
全部页面扫描成300DPI的彩色TIF图像
2
图像清晰,版心居中,无视觉倾斜,无污点,无颜色失真现象。
3
图像版心大小统一,图像尺寸相同,图像完整无缺损。
4
图片分页问题按实际页展现。
MARC文件
包含有元数据项目的图书索引信息,正确率须达到100%。
PDF文件
序号
制作标准
1
在PDF还原过程中,对原书版式进行一定的统一和规范处理,包括对鱼尾、版框、版心和书口的处理按照原书还原。
2
所有版面文字均用宋体字还原,文字的颜色一律为黑色。文字的位置按原书还原。双行小字和多行小字按原书版式和比例还原。
3
版面插图、牌记、印章、草书和行草序按照图片处理,信息必须在XML文件中体现。
4
贴字图均为二值图像,按原书位置做贴图处理, PDF文件采用100%显示比例时,贴字图与其他文字大小相当,对贴字图中的文字进行IDS描述。
5
PDF要完整,保证无缺页、重页,页码顺序颠倒的情况发生。
6
生成的电子文档格式是版式重构PDF,每页文件的大小不超过100K,图像清晰。
7
PDF文档保持原纸质文档简繁体属性。
8
PDF文档要符合相关的国际、国内、行业标准,文字错误率低于万分之三,生成版式重构的单层PDF。必须加上采购人版权水印。
技术元数据标准
针对需进行加工的纸质地方资料原始资料,建立基本属性对应的著录项目,并生成基本地方资料附属信息、目次信息等规范数据,同时为规范数据建立相应的代码识别体系,该代码识别体系将贯穿整个工程的信息交换和数据交换,避免出现信息和数据不一致的情况。结合计算元数据标准并通过智能检测模块可以有效的避免在数字化过程中可能出现的漏扫、重扫等情况。
针对需进行加工的地方资料,建立基本属性对应的著录项目,并生成规范数据,为各规范数据建立相应的代码识别体系,同时建立辅助信息标引库。本次加工的地方资料图书所需著录的字段如下表:
图书必备检索字段
书名
责任者
版本类型
出版责任
出版时间
版本形式
所属丛书
卷数
卷次
工程信息库
通过对地方资料纸质资料和文档进行归类整理,在技术元数据标准基础上,根据工程各环节所需要公用的基础信息,将地方资料的基础著录项目抽取成为资料内部特征,建立信息标引配置数据库和相关流水线工艺文档,制定项目评价标准和环节控制标准等。
工程信息库与方正业务流程管理系统挂接,工程信息库在整个工程实施中会围绕基础信息,随着数据流转不断增加相关的信息,通过方正业务流程管理系统,可以实时的掌握每一批次、每本
地方资料的生产进展和所处的生产环节,也能掌握到数据的状态、收发时间、生产责任人等相关信息。
管理元数据标准
序号
管理元数据标准
1
每本地方资料建立一个文件夹(示例:SZFZ2908),按照地方资料卷的顺序建立子文件夹(例如:卷),该卷的图片文件、PDF文件和XML文件都存放在此文件夹中按照流水累加编号(示例:SZFZ1-00000001)。文件夹命名须包含图书的完整编号和子文件夹流水号。
2
集外字表命名取每本地方资料后四位编号(示例:2098(国图外字表))。
3
字频统计列表名取每本地方资料后四位编号(示例:2098(字频统计))
4
总PDF文件与总XML文件与地方资料文件同名(示例:SZFZ2908(总PDF)、SZFZ2908(总XML文件))
5
地方资料子册PDF文件命名示例:
SZFZ1(第一册子PDF)
SZFZ2(第二册子PDF)
数字化工程管理、资料管理和工程信息预处理
为保障地方资料数字化加工过程的有效性,成立工程管理部门。该部门按照地方资料数字化工程的需求,全面负责具体工程的实施,包括生产工艺调整,工程调度,组织具体的数字化及标引著录等生产工作,进行环节控制,数据合成和测试,以及最终数据的提交。
全面负责工程进度和质量、考核和评价环节衔接、协调衔接问题,帮助环节内部整理影响进度和质量的因素,并出具各种进度和质量报告。
古籍数字化加工技术解决方案 来自淘豆网m.daumloan.com转载请标明出处.