档案馆馆藏档案信息数字化的一些思考

发布 2019-08-16 18:57:15 阅读 9311

档案馆档案技术与保护部。

面对21世纪社会的信息化、网络化、数字化的提出,档案工作面临更多的机遇与挑战。一方面作为“信息资源之源”的档案信息将在信息社会中受到进一步重视,档案信息的价值将不断扩大,以存储并提供档案信息为目的的档案馆将被重新定位,档案工作一跃成为社会信息产业的基础,档案事业的社会地位日益提高。另一方面,社会信息需求的不断发展和信息技术的更新将对档案工作的质量提出更高的要求,档案工作如何适应新的社会环境,成为档案工作面临的大挑战。

档案信息数字化的必要性在于:

1.是档案信息需求发展的需要。

信息是信息时代的最重要的资源。信息和对信息的需求同时激增,导致信息服务和信息技术的空前发达。档案信息是社会信息中最可靠和最系统,最有价值的原生信息,它与社会活动的关系最密切。

2.是国家信息化工程建设的需要。

档案信息化资源建设是核心内容,大量档案信息的数字化和网络化将迅速全面的增加网络世界中中文信息资源的数量,为建设服务,展示中国文化和建设成就,使世界了解中国。

3.是档案工作自身的发展需要。

信息技术逐步改变档案工作的管理对象和可用手段,随着计算机技术网络技术的广泛应用在档案管理中的各个环节,纸质的文件越来越多的被数字化文件所代替。

对于档案信息数字化来讲,采取什么样的图像格式,运用什么样的数据压缩技术,是我们探索档案信息数字化规范与标准的关键问题。国际上有很多的图像文件格式,在国内也有一些公司专门的格式,我们如何选择呢?

对档案资料的扫描加工来说,我们处理的对象是历史上形成的大量纸质的档案资料,这些资料的特点是:

1. 1. 绝大多数是文字资料;

2. 2. 纸张大小不一;

3. 3. 一份资料可能有多页;

4. 4. 绝大多数只需要黑白图像;

所以,我们从文件格式的开放性,扩展性,适应性等考虑选择tif格式。其他如bmp,存储量大,不能翻页;gif,适用于彩色图像,不能翻页;jpg格式,适用于彩色图像,不能翻页;其他专用格式,则应用软件支持少,必须专用软件才能应用,且不便于系统的升级和平台的转换。

tif格式的优点主要是适合于广泛的应用程序,它与电脑结构、操作系统和图形处理的硬件无关,它可以处理黑白和灰度图形,允许使用者针对一个扫描器、监视器和打印机的特殊佳能而进行调整。tif具有防止错误发生的格式,因此,对于**之间的数据交换, tif常常是位元映射的最佳选择之一。

因此,tif是一种国际上非常流行的适于各种电脑和操作系统的图形文件格式,目前国际上流行的很多软件都支持tif格式。一般扫描器所配备的软件都直接或间接地用到tif图形文件格式,还有一些软件系统,例如: windows系统下的photostyler都把tif作为图形的存取格式, tif格式也可以转换为windows的bmp及jpg等其它格式。

未来的jpeg2000标准也兼容tif格式,现在的tif文件资料在将来也能继承和应用。另外在国家计算机光盘档案存储标准,文件格式也是采用tif格式(国家档案局颁布的档案电子文档标准,标准文号:档发[2001]6号)。

所以档案资料的扫描文件格式最好选择tif格式。

解决了图像标准规范的问题后,如何实施档案信息数字化就是我们日常工作不可忽略的管理问题。为了保证对档案信息数字化数据真实、可靠,图象信息清晰、准确,从管理入手,建立严格的数字化管理流程,确保数据的安全、可靠。截止到9月20日,我们已经完成进馆档案信息的数字化工作,共计4300 卷,近30万页。

馆藏档案信息数字化工作流程。