数据库建设现状调研
王甜甜
(冶金工业信息标准研究院,北京100730)
摘要:概述了我国部分数据库加工建设机构(如重庆维普资讯有限公司、汉王科技股份有限公司等)的数据加工现状,以及他们在加工业务、加工流程、数据管理、数据加工技术等方面的情况,提出了作为国家科技图书文献中心成员单位之一冶金工业信息标准研究院在数据库建设方面的思路和建议。
关键词:图书馆;数据库建设;数据加工
0 前言
数字时代的快速发展带给图书馆的变化不仅仅是资源数字化和网络化,对图书馆原有的业务流程和工作方式也有巨大的冲击。然而,随着数字出版时代的到来,为了适应新形势下的文献数字化发展,更多地了解数据加工处理业务新的流程和方法,及时调整现有数据加工业务流程,确保数据库建设工作取得跨越式发展,针对此次任务展开对数据加工公司的调研工作。
1 调研的目的
通过对各大专业加工公司及院校的调研,了解和掌握数据加工的各个方面和重点环节,并结合本单位的数据库建设工作,更好地提高本地文献数据质量,规范加工流程,调整加工管理方式,与中心配合共同完成科技文献服务工作。
2 调研的结果
这些公司在数据加工规模、加工技术、加工流程管理、数据安全性和保密性管理、加工各项业务的统计分析,以及加工人员队伍的培训与管理等方面,确实处于,在加工管理和技术上各有特色,许多好的管理经验和先进的技术手段值得我们学习借鉴。对数据库建设工作有很好的启发,有待深层次的挖掘和探索。
重庆维普资讯有限公司
重庆维普资讯有限公司前身为中国科技情报所重庆分所数据库研究中心。作为中国数据库产业的开拓者,公司自1993年成立以来,一直致力于电子信息资源的研究、开发和应用。公司的业务范围包括数据库出版发行、电子期刊出版发行、网络信息服务、网络广告推广、文献资料数字化加工等多种个性化服务。目前的业务重点是技术开发、市场开拓。
1)数字加工业务。
主要针对已经获得使用权的中文期刊。目前国内出版的期刊,总共9900多种,维普加工侧重科技方面的中文期刊,有8000多种,还有部分国内出版的外语期刊。另加工维文、回文期刊,主要是图片保存。
2)加工业务流程。
期刊订购→期刊登到→打包(依中图法分类)→系统登记→加工厂(维望数据)→扫描→去污→文字录入→标引→质检(文摘部分校对)→返回维普,系统录入。
3)数据管理。
,ftp传输,时效控制20天(维普→维望→维普),现有数据大小30多TB,数据保存格式:双层pdf,数据存储五地备份,有本地服务器主机房、天津机房、重庆铁通、重庆联通、唐山机房。原始数据以光盘形式在维普备份。
4)数据加工技术。
自主开发的加工集成软件,扫描图像采用OCR识别,双层:PDF,jpeg支持全文阅读。
5)人员管理。
维普加工人员要求大专以上学历,工资与加工量、质量挂钩,采用计件方式核算。不同工序对人员的学历要求有差异。
汉王科技股份有限公司
汉王科技股份有限公司成立于1998年,是全球文字识别技术与智能交互产品的引领者,多年来,通过不断自主创新,在联机手写识别、光学字符识别(OCR)、数位绘画板等领域拥有多项具有自主知识产权的核心技术,综合技术水平在国内外均处于领先地位。
基于汉王获得国家科技进步二等奖的OCR核心技术,公
数据库建设现状调研 来自淘豆网m.daumloan.com转载请标明出处.