四川省档案资料数字化标准.doc四川省档案资料数字化标准
本标准根据国家档案局《电子文件归档与管理规范》、《纸质档案数字化技术 规范》制定,适用于四川省各级档案馆(室)的数字化工作,其它单位可参照执 行。
第一章纸质档案数字化标准
1基本术语解释
。
2纸质档案数字化对普通黑色字迹清晰)的油印、铅印、胶印等印刷件或 复印件纸质档案进行数字化及应用的过程。
3数字图像表示景物图像的整数阵列。一个二维或更高维的采样并量化的 函数,由相同维数的连续图像产生。在矩阵或其他)网络上采样一连续函数,并 在采样点上将值最小化后的阵列。
合成的静态数字图像。
1. 5失真度对档案原件进行数字化转换后,在同等测试环境下,数字图像与 档案原件色彩、几何、压缩算法等差值。
1. 6可懂度表示数字图像向人或机器提供信息的能力。
1. 7图像压缩 清除图像冗余或对图像近似的任一种过程,其目的是对图像以 更紧凑的形式表示。
1. 8分辨率指单位长度内图像包含的点数或像素数。
1. 9 TIFF标记图像文件格式。一种基于标记的无损不丢失信息)压缩格式, 用于在应用程序之间和计算机平台之间交换文件。因为它存储的图像细微层次的 信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储 存。
1. 10 JPEG联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕 和打印显示,支持所有主要的计算机平台和Wb浏览器。JPBG格式文件小,影 像质量多数情况下均可接受。考虑储存空间及传输效率,原件为彩色的档案可选 此格式复制储存。
的级数,编辑图像时一般都使用到8位,即2 5 6级灰度。
1. 12黑白二值图像是与彩色及灰度相对应的一种模式,黑白图在表示图像时 只区分黑白二值,他把其它色彩根据其特性转换为黑白两种,因此形成只有两种 颜色的图像。
13 IZV压缩IZV压缩是一种比较复杂的压缩算法,其压缩效率也比较高。 它的基本原理为:IW巴每一个第一次出现的字符串用一个数值来编码,在还原 程序中再将这个数值还成原来的字符串。例如:用数值0x100代替字符串
aabccddeee ,每当出现该字符串时,都用0x100代替,这样就起到了压缩的作 用。⑵是无损压缩,因此它不会对图像质量造成损失。
2数字化基本流程
纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据 处理、信息存储、检索利用等工序。
1案卷整理
对需要扫描的案卷进行适当整理,做出标识。
2. 2目录建库
为数字化的档案检索而建立必要的目录数据库。
2. 3批量扫描
按照档案数字化具体任务的整体安排按计划分批次进行扫描。
2. 4数据处理
4. 1对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图 像进行纠偏、去污、拼接等技术处理。
4. 2对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、 添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
2 5信息存储
根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进 行保存。
2. 6检索利用
按用户需求提供检索利用。
3案卷整理
在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。
1分件
1. 1把同一案卷中的扫描和非扫描分开。
3. 1. 2在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图 像放在图像处理时进行重扫,替换指示页。
3. 1. 3填写《数据加工过程处理单》见附录对需要特殊处理的页,标识 清楚。
3. 2分页
对批量扫描前的档案进行页号、件号的标注。如在标注中与原档案中的 件数、页号不一致,应以此为准。
3. 3拆卷
去除档案中原来的装订物,以便后续扫描工作的进行。
4装卷
按档案保管要求恢复原装订。
4建目录库
1目录著录
根据DVT18确定档案著录项,并进行著录。
4. 2数据格式选择
所选定的数据格式通用,应能直接或间接与诲文件格式或通过 WL 文档进行数据交换。
3目录输入
将著录好的目录输入计算机内,建立机读目录数据库。
5批量扫描
1扫描方式
纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
1. 1页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文 字图像的档案文件,可采用连续色调图像扫描。
1. 2字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差 或带有图片的档案材料,可采用连续色调图像扫描。
5. 2分辨率
四川省档案资料数字化标准 来自淘豆网m.daumloan.com转载请标明出处.