纸质档案数字化是档案信息化建设的一个重要组成部分,是档案信息化工作的重要基础环节。数字化业务外包是解决档案部门实际困难、加快加工工作进程的主要途径之一,也是档案信息资源建设中最容易发生安全问题的一个环节。这个环节如果安全管理失控,就会带来档案原件丢失或损坏、数字化档案信息内容不完整、不准确,成为一堆无法利用的数字垃圾,甚至造成档案中的国家机密被泄漏等严重事故。为确保在数字化外包工作过程中的档案及其数据的安全,我们对档案数字化工作的各环节进行了研究,制定了档案数字化工作流程的管理要求。 档案数字化工作是一个系统工程,应按照“统一规划、统筹安排、统一标准、相互配套”的原则进行,采用先进的“平台化”建设思想,避免重复投入、重复建设,充分考虑整体和局部的利益,坚持近期目标与远期目标相结合。档案数字化外包工作环节多,工序繁杂,劳动密集,涉及方方面面。基本环节主要包括:数字化外包任务的立项、成立档案数字化工作组织、制定档案数字化外包工作方案、编制预算、申请资金、服务采购、建立健全工作制度、场地和设备准备、数字化工作的人员的培训、调档清点交接、案卷文件检查和目录、页号纠错及破损修复、档案扫描、图像处理与检查、OCR识别(可选)、图像存储与文件命名、修正目录库、数据关联及检查、数据验收、数据移交进馆(室)、遗留信息和设备处理、数据备份、整体验收和归还档案实体等20个工作环节。 

1.数字化外包任务的立项 档案数字化外包项目的立项,是档案部门在对本馆馆藏充分调研、分析的基础上,根据相关要求、标准和,本单位人员与设备等具体情况编制的档案数字化项目建设方案。通常包括以下几个方面内容:一是档案数字化外包目标。二是项目详细工作内容。三是技术路线。四是预期成果。五是风险控制。六是项目工作进度安排。七是实施组织形式。八是项目实施预算表。档案数字化外包项目方案,一般由档案行业专家和学者组成方案论证小组,通过会议或实地考察等方式进行论证。通过调查收集相关资料及同领域相关经验,对本数字化外包的安全和保密性、质量要求、人员素质、馆藏等方面对档案数字化工作外包的利弊进行需求分析、工作流程分析、成本效益预算分析和论证等。对方案中不合理部分进行修改完善,最终输出项目论证报告书、安全影响报告和采购方式审批报告书等,形成综合分析报告,选择最优方案,由决策者最终确定。 2.成立档案数字化工作组织 确定进行数字化外包并获得部门领导审批后,应建立专门的档案数字化工作组织机构。根据确定的项目目标,明确划分分解目标,列出所要进行的工作内容,制定岗位职责标准与考核要求,使之成为有秩序、高效率、部门分工合理、协作密切的数字化外包管理组织体系,确定组织领导者、参与者,明确任务、责任与分工。 档案数字化组织机构建立应遵循的原则。一是职权分明,使每—项管理职能都能落实到一个执行机构,职责不要分散,不能实行多头领导,造成互相扯皮推诿。二是机构要互相协调、互相衔接,有利发挥组织整体功能,使组织内部既有分工,又有合作,协调一致,实现一个共同目标,档案部门与企业间应充分沟通以保证项目质量。三是实行统一领导,分级管理,集权与分权结合。要确定科学的管理幅度和管理层次。既要坚持必要的集中统一领导,使领导人指挥决策的实施有效而迅速,又要实行分级管理,调动各方面的积极性。 档案数字化组织机构的组成。档案机构一般由单位主管领导全面组织协调,由档案保管部门、档案保护部门、档案利用部门、信息技术部门及办公室等部门领导和相关人员参加构成。在人员组织过程中应按照多维度(工作能力、知识领域、年龄、工作经验等)标准进行人员筛选和岗位任免。主要任务包括制定外包方案、服务采购、建立标准制度、与企业之间沟通协调、数字化加工监督指导、质量检查验收等。 档案数字化组织机构的构成层次。管理组织结构中一般应有三个层次,即决策层、中间控制层和作业层。决策层:由项目总负责人及相关专家组成,要根据数字化外包项目目标和内容进行科学化、程序化决策, 研究审定重要工作方案,协调解决重要问题。中间控制层(协调层和执行层):由专业负责人和子项目负责人组成,具体负责规划的落实、目标控制及合同实施管理,属承上启下管理层次。作业层(操作层):由现场人员组成,负责具体的操作工作。数字化外包的组织机构相对复杂,涉及档案部门和企业两个不同机构,建设组织机构时要根据具体需求,和数字化目标及方案综合考虑,如图(因外包业务内容有所不同,档案部门与企业担负的职责与任务也有不同,仅供参考)。 
3.制定档案数字化外包工作方案 制定档案数字化外包工作方案,是数字化外包工作的基础,应具有较强的方向性、导向性,进行周密思考,从不同角度设计出多种工作方案以供参考。 4.编制预算、申请资金 根据档案数字化加工数量,所需设备与人员,充分考虑潜在的资金投入,参考市场价格编制合理的预算方案,向主管单位或部门提出项目申请,获取政策支持与资金支撑,启动数字化外包项目。 
5.服务采购 档案数字化外包加工服务的采购,可采取招标、议标和指定服务商等多种形式。制定项目说明。内容包括:投标人须知、项目总体质量要求、引用规范性文件、项目的内容及数量、工作环节与质量要求等内容。 组织招标,招标需成立专家组,根据档案数字化规模、馆藏实际情况、对企业的资质审查要求等各方面编制招标文件,制定技术指标、保密、安全、质检等方面要求的协议。对竞标企业进行严格的资格审查,招标过程应严格遵守《中华人民共和国招标投标法实施条例》。 通过各种渠道,充分了解承包公司状况,签订必要的协议。承包公司资质应从注册资金、经营效益、业务能力、业界评价等多方面进行考察。最终确定承包公司,签订合同。 
6.建立健全工作制度 为了做好档案数字化工作,必须制定符合实际的各种制度,使档案数字化工作有组织领导,有规章可循,保障档案数字化的质量和安全。在档案数字化外包工作中涉及的制度主要有三部分组成。一是档案数字化工作中要贯彻执行的国家相关法律、法规、标准规范;二是档案部门为管理本单位档案数字化工作制定的规章、规范、规定;三是承担档案数字化工作的承包公司,为保证项目顺利完成而制定的各项管理制度。 7.场地和设备准备 档案数字化的场地和设备要按3.3.5“档案数字化的技术要求”准备。 8.数字化工作的人员的培训 参与档案数字化工作的人员应具备一定的档案管理知识,掌握数字化工作技术,熟悉有关工作有关的标准、规范和要求,胜任数字化工作相关岗位的任务。特别是数字化工作项目负责人应当具有较高的档案管理及数字化的专业素质和技能,具备良好的组织能力,全面掌握与任务有关的标准、方法和技术要求,能够熟练运用与数字化有关的软硬件相关知识和技术,掌握档案管理知识。项目开始时,要对数字化工作人员进行上岗培训,培训内容应包括档案管理学知识;档案数字化相关标准、规范;档案数字化技术知识;本项目工作要求和管理制度等。 9.调档清点交接 档案馆工作人员按照数字化工作进度调取档案,认真进行清点,要具体统计到盒、卷、册、件、页,并要标准档案文件上的附件。做好交接记录。留存档案提取和入库提供准确的核对凭证。档案部门与承包公司双方应有专人负责调档和接收工作,每次调取的案卷数量应按照先前的工作计划和进程控制,双方交接人员应现场填写交接清单,交接单中应写清文件的名称、数量、页数、接收人姓名、接收日期等重要内容,并签字验证如需装箱长距离搬运,还应在箱体标明相关信息,并充分保障运输过程安全。 
10.案卷文件检查和目录、页号纠错及破损修复 档案数字化前处理工作,主要目的有5个:一是档案价值的有用性;二是文件的唯一性;三是著录标引的规范性;四是文件编目的有序性;五是案卷构成的完整性。 案卷整编。包括根据相关标准检查存在未编制卷内目录或漏编、错编现象要及时更正,未编张、页号或错编、漏编的要补编和更正,理顺文件排列顺序,拆除扫描对象装订线及加固件、平整页面、登记特殊页面等内容。 分件。档案分件的主要内容是将案卷拆分为自然件。拆卷时,一定要逐盒逐卷的拆,完成一盒之后再打开下一盒。关于同一事由的往来文件应分为不同的自然件,如请示与批复应分为两个自然件。分件时应保持文件的齐全、完整,文件处理单或领导(职能部门)签署意见单、正文及领导签发的定稿、附件、浮贴等不缺漏。 整平。档案进行有序的整理后,对折皱较大影响扫描的文件,还要进行整平。 修补。对破损严重、无法进行正常扫描的档案,要先进行修补、裱糊等修复处理。包括加固破损档案载体,对有空洞、残缺或折叠磨损的部位进行修补,稳定、恢复出现退变、扩散的档案字迹;迁移载体濒临灭失的档案信息,对珍贵档案进行去酸和复制处理等。 
11.档案扫描 扫描是档案数字化加工的中心环节,工作人员必须严格依据纸质档案扫描规范与工作步骤进行扫描。选择最优的扫描方式、色彩模式、分辨率,统一标准的文件格式及图像命名方式。并且将扫描过程中形成的元数据进行详细记录。要进行扫描登记。认真填写纸质档案数字化转换过程交接登记和工作流程表单,登记扫描人、扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。 12.图像处理与检查 扫描结束后,承包公司必须对存在问题的扫描图像进行技术处理和图像检查(质检合格率应为100%),按照《纸质档案数字化技术规范》(DA/T 31-2005)的要求进行图像处理,保证数字图像清晰、端正,应能准确反映档案原件的原始面貌。对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。发现文件漏扫时,应及时补扫并正确插入图像。发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。应在距页边最外延2至3毫米处裁剪数字图像,不得裁掉纸质档案原有页边,包括破损、歪斜页边。不得擅自修改档案信息,并填写相应工作表单进行记录。并要清除页面阴影及杂点、消除图像四周黑边。 13.OCR识别(可选) 对扫描获得的图像文件,可采用OCR识别的方式获取文本文件。图像经过优化处理后,针对不同的档案文件,在识别时,可通过人工干预的形式,对档案资料中表格、图片、文字进行版面分析,确保文字识别的正确率。 14.图像存储与文件命名 扫描获得的图像要按《纸质档案数字化技术规范》(DA/T 31-2005)要求确定文件格式。通常定位为TIFF(G4)格式或JPEG格式,也可存储为CEB、PDF或其他格式。 图像文件要按《纸质档案数字化技术规范》(DA/T 31-2005)的要求命名。档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。为了便于管理和数据挂接,图像文件命名的档号格式必须与其目录数据库中的档号格式相一致。 15.修正目录库 对于没有机读目录的档案,在进行数据关联之前还需要建立档案目录数据库。目录建库应按照《档案著录规则》(DA/T18)、《归档文件整理规则》的要求进行。所选定的数据格式应能直接或间接通过XML文档进行数据交换。 在档案著录时,推荐采取双机录入方式,即两个人为一组,一稿录入两次。两次录入的结果进行对比校对,然后人工对照系统软件检查的结果进行校对以及查看原档案文件校对,最后再进行人工二次抽查,确保录入准确率达到100%。 对目录数据质量检查,可采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。以确保著录项目完整、内容规范、准确。若发现不合格的数据必须进行修改或重录,并填写相应工作表单。 16.数据关联及检查 汇总挂接是将扫描获得的图像文件通过相应软件,与目录数据进行关联。挂接时要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系。 目录与全文对应检查。目录与全文挂接后,要认真核查目录数据的档号与对应图像数据的档号是否相同,目录数据中的页数与图像文件的页数是否一致,目录数据的数量(多少条)与图像数据的数量(多少个或多少组)是否一致,目录数据的内容与图像数据的内容是否一致。如不一致,目录数据库中文件页数要根据扫描前处理编的页数重新标记。 17.数据验收 为保证数字化加工质量、进度和实际使用需要,要及时分批次地对提交数据进行验收。档案部门人员可采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。 18.数据移交进馆(室) 数字化信息检查合格后,进行数据的进馆移交。进馆移交要做好核对、记录,确保数字化信息导入后齐全、完整、数据关联正确、浏览检索无差错。 19.遗留信息和设备处理 档案数字化任务完成后,承包公司应将自带的硬盘、移动存储介质以及无法确保数据可靠清除的设备移交档案部门保管或销毁,严禁擅自带走。 20.数据备份 为保证数据安全,数字化信息进馆之后,应实施多套备份和异地异质备份。备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。备份时也应进行数据检验,检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。数据备份后应在相应的备份介质上做好标签,以便查找和管理,并应认真填写纸质档案数字化备份管理登记表单。 21.整体验收和归还档案实体 档案数字化项目验收要按照合同规定执行,目验收前要归还全部实体档案。验收时要有各批次图像抽查验单收合格签字和档案还原验收合格签字。馆(室)领导在总体验收合格后的签字,并留5%的质保金。

以上文章转载中国档案学术网,仅供本公司学习查看,本文作者:山东省档案馆 孙洪鲁 |