[精品]纸质档案数字化成果存储格式探讨.doc台州市档案学会2010年年会交流论文纸质档案数字化成果存储格式探讨温岭市档案局叶学政纸质档案数字化,是指采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。目前,档案和电子文件登记备份工作正在全浙江省如火如荼地进行着,把纸质档案进行数字化,是登记备份工作的一项重要内容,它有利于保护库存档案实体安全,提高工作效率,降低档案利用成本等。简而言之,把纸质档案进行数字化,主要基于两种目的:一种是为了备份保护档案实体。纸质档案数字化就是对纸质档案进行数字备份,以降低弥补纸质档案因意外损毁造成的损失,对档案进行数字化管理,还可以减少因对档案原件频繁使用而造成的磨损,确保档案实体安全。另一种是为了发挥档案的利用价值,使档案信息资源能准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会或行业对档案利用的需求。从备份保护用途的角度考虑,纸质档案数字化注重数字化成果的图像品质,图像必须清晰、分辨率高,能够保持档案的原貌,但是图像品质越高,相对应的文件存储容量肯定也越大。从利用用途的角度考虑,纸质档案数字化注重数字化成果的利用效率,图像文件不宜过大,否则影响网络传输时间和调用速度。这两种不同的用途对档案数字化的要求有所不同,在实际操作中,我们可以对数字化成果采取两种不同的文件存储格式同时进行保存,一种备份用途,一种利用用途,备份用途的采用大文件存储,利用用途的采用小文件存储。备份用途的数字化成果存储格式的选择。备份用途的数字化成果要求高品质,但是品质越高,存储容量也越大,存储成本和维护费用也相应增加,因此,我们必须在图像品质和存储容量之间找一个折中点。国家行业标准《纸质档案数字化技术规范》指出:采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储;采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。国家标准定得不高,作为备份用途,一般应采用灰度模式或彩色模式进行档案数字化加工,以更真实地显示档案的原貌。备份用途的数字化成果,可以采用的文件存储格式主要有TIFF、JPEG和JPEG2000等,目前,用的最多的是TIFF和JPEG格式。TIFF是一种非失真的压缩格式,它广泛地应用于对图像质量要求较高的图像存储与转换,有多种压缩方案可供选择。省档案局就提倡采用单页(多页TIFF兼容性较差)LZW压缩的TIFF格式存储彩色模式扫描的数字化成果,LZW压缩是一种减小文件大小的无损技术,用这种格式存储的文件图像质量好,而且即使经过多次编辑和重新保存TIFF(LZW压缩)文件,图像数据也不会受到任何损失,对一些珍贵档案的数字化用这种格式进行存储是绝佳的选择。但是TIFF(LZW压缩)的缺点是存储容量大,笔者作了下测试,用300Dpi分辨率对多个A4幅面的纸质档案进行彩色扫描,采用单页TIFF(LZW压缩)文件保存,最大的TIFF文件存储容量16M,最小的也有1M,图像底色偏深的色彩丰富的TIFF文件存储容量偏大,图像底色偏白的色彩单调的TIFF文件存储容量偏小。笔者估算了一下,假如进行大批量的扫描,比如说扫描量有1000万页的话,按平均每页5M存储容量算,需要50T的存储空间,假如刻录成DVD光盘一式三份保存的话,,对如此多的备份光盘
[精品]纸质档案数字化成果存储格式探讨 来自淘豆网m.daumloan.com转载请标明出处.