临海市档案馆进馆单位纸质档案数字化成果移交标准(试行)
为规范临海市进馆单位纸质档案数字化成果的移交工作,根据中华人民共和国档案行业标准《纸质档案数字化规范》(DA/T31—2017)、《浙江省省直单位档案室电子目录数据库结构与交换格式》和《浙江省档案登记备份管理办法》,结合临海实际,特制定本标准。
1.适用范围
本标准适用于临海市进馆单位向临海市档案馆移交纸质档案数字化成果,档案登记备份工作也适用此标准。其中纸质档案数字化成果是指各单位将本单位产生的属于永久、定期30年(或长期)保存的纸质档案,以及30年以下保管期限但具有较高现行凭证价值的传统业务档案进行扫描后产生的数字图像,包括电子目录。
2.数字图像要求
2.1数字化对象的确定原则:需向市档案馆移交的档案,属于归档范围且应永久、定期30年(或长期)保存的应对文件正本与定稿(包括收发文处理单及留痕稿)一并扫描。
2.2扫描色彩模式:需向市档案馆移交的档案,应采用彩色模式进行扫描。
2.3扫描分辨率:需向市档案馆移交的档案,后期需进行OCR汉字识别的,扫描分辨率应选择≥300dpi。需要进行高精度仿真复制的档案,扫描分辨率建议≥600dpi。图纸类文件扫描分辨率建议选择≥200dpi。照片档案扫描分辨率建议选择≥400dpi。
2.4图像质量要求:图像偏斜度不得大于3度,画面清晰,图像方向正确,清洁度较高,图像进行去污处理时应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹,不存在漏扫、重扫、多扫现象。图像排序不得出现颠倒、缺页、重页或错页等情况,要求档号、扫描无漏页及图像完整性等准确率达到100%。
2.5图像存储格式:需向市档案馆移交的档案,纸质档案扫描采用TIFF格式存储,照片档案扫描采用JPEG格式存储,图像压缩率的选择可根据实际应用的需求(在条件允许下尽量提高图像质量为原则)而定。纸质档案扫描后需对文件正本进行OCR识别,转换成双层PDF文件,图纸类等不需OCR识别的可转换成单层PDF文件。PDF文件用于提供网络查询用。
2.6图像文件的命名:图像文件以纸质档案目录数据库为依据,将每一份图像文件的名称以相应档案目录数据库中该份文件的档号来命名。通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
2.7图像文件的命名格式
2.7.1命名格式(一)
对按卷整理的纸质档案进行扫描,其图像文件命名由相应档号来命名,档号的结构一般为:全宗号-目录号(或分类号)-案卷号-件号,如J001-001-001-001.pdf表示,数据结构见下表:
字段名称 | 字段类型 | 字段长度 |
全宗号 | 字符 | 4 |
目录号(或分类号) | 字符 | 3 |
案卷号 | 字符 | 3 |
件号 | 字符 | 3 |
2.7.2命名格式(二)
对按件整理的纸质档案的扫描,其图像文件命名由相应档号来命名,档号的结构一般为:全宗号-档案门类代码·年度-保管期限-机构(问题)代码-件号,如J109-WS·2018-BGS-D30-0010.pdf表示,数据结构见下表:
字段名称 | 字段类型 | 字段长度 | 字段值 |
全宗号 | 字符 | 4 | |
档案门类代码·年度 | 字符 | 7 | |
保管期限 | 字符 | 4 | Y、D30、D10 |
组织机构或问题 | 字符 | 10 | |
件号 | 字符 | 4 |
全宗号:档案馆给立档单位编制的代号,用四位代码标识,其中第一位用汉语拼音字母标识全宗属性,建国后档案用“J”;后三位用阿拉伯数字标识某一属类全宗的顺序号。如“J002”表示建国后2号全宗。
档案门类代码·年度:档案门类代码由2位汉语拼音首字母标识,如“WS”代表文书。年度为文件形成年度,以4位阿拉伯数字标注公元纪年,如“2018”表示2018年。
保管期限:保管期限分为永久、定期30年、定期10年,分别以代码“Y”、“D30”、“D10”标识。
机构(问题)代码:机构(问题)代码采用3位汉语拼音字母或阿拉伯数字标识,如办公室代码“BGS”等。归档文件未按照机构(问题)分类的,应省略机构(问题)代码。
件号:件号是单件归档文件在分类方案最低一级类目内的排列顺序号,用4位阿拉伯数字标识,不足4位的,前面用“0”补足,如“0026”。
3.目录数据要求
3.1目录数据格式选择
目录建库应选择通用的数据格式,向市档案馆移交时应转换为DBF或XLS格式。
3.2目录数据要求
3.2.1按卷整理的档案
1、案卷级
序号 | 字段名称 | 字段长度 | 备 注 |
1 | 档号 | 22 | 全宗号-目录号(或分类号)-案卷号,其中全宗号用J加三位阿拉伯数字表示,J表示建国后,目录号和案卷号用三位阿拉伯数字表示。 |
2 | 责任者 | 100 | 指产生档案的单位及内部组织机构 |
3 | 题名 | 254 | 即案卷标题 |
4 | 文件起始时间 | 6 | 用6位阿拉伯数字表示年月,如:199601 |
5 | 文件终止时间 | 6 | 用6位阿拉伯数字表示年月,如:199612 |
6 | 卷内文件份数 | 3 | |
7 | 保管期限 | 4 | 永久、长期、短期、30年、10年 |
8 | 备注 | 150 |
2、文件级
序号 | 字段名称 | 字段长度 | 备 注 |
1 | 档号 | 22 | 全宗号-目录号(或分类号)-案卷号-件号,其中全宗号用J加三位阿拉伯数字表示,J表示建国后档案,目录号和案卷号用三位阿拉伯数字表示。 |
2 | 页(张)号 | 3 | |
3 | 文号 | 25 | 不要漏掉发文字号与发文年度,如台档[1995]10号,文件编号的括号原文可能采用各种符号,在这里一律采用“[ ]”著录 |
4 | 责任者 | 100 | 指文件制发机关 |
5 | 题名 | 254 | 按实抄写,自拟题名加[ ] |
6 | 成文日期 | 8 | 文件形成日期,一般用8位阿拉伯数字表示,如:19990102 |
7 | 页数 | 4 | 指案卷内一份文件的页数 |
8 | 密级 | 4 | 公开、内部、秘密、机密、绝密 |
9 | 保管期限 | 4 | 永久、长期、短期、30年、10年 |
10 | 开放审核情况 | 20 | 到期开放、到期审核、移交即开放 |
11 | 附件 | 254 | |
12 | 备注 | 150 |
3.2.2 按件整理的档案
1、归档文件目录数据库结构
序号 | 字段名 | 字段长度 | 备 注 |
1 | 档号 | 22 | 全宗号-档案门类代码·年度-保管期限-机构(问题)代码-件号,如 J109-WS·2018-BGS-D30-0010 或J103-WS·2018-D30-0010 |
2 | 年度 | 4 | 指文件归档的年度 |
3 | 件号 | 4 | 用四位阿拉伯数字标识如0001 |
4 | 责任者 | 100 | 指发文单位,如有多个责任者时,责任者之间以“;”号隔开 |
5 | 文号 | 50 | 不要漏掉发文字号与发文年度,如临档[1995]10号,文件编号的括号原文可能采用各种符号,在这里一律采用“[ ]”著录 |
6 | 题名 | 254 | 按实抄写,自拟题名加[ ] |
7 | 成文日期 | 8 | 文件形成日期,一般用8位阿拉伯数字表示,如20100205 |
8 | 页数 | 4 | |
9 | 保管期限 | 4 | 永久、30年、10年 |
10 | 开放审核情况 | 20 | 到期开放、到期审核、移交即开放 |
11 | 附件 | 254 | |
12 | 密级 | 4 | 公开、内部、秘密、机密、绝密 |
13 | 备注 | 150 |
3.3目录数据质量检查
核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应按要求进行修改或重录。
4.数据验收要求
4.1目录数据验收
以全宗的一个年度为单位,随机抽查5%的数据,对条目数量及其著录项目内容的准确性进行逐条检查。其中,档号的合格率要求达到100%,其他项目抽检合格率要求达到95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数×100%。
4.2图像数据验收
以全宗的一个年度为单位,随机抽查5%的条目数据相对应的图像数据,对图像数量及其图像内容的准确性进行检查。图像应符合本标准中所规定的分辨率、文件格式及色彩模式。图像文件的命名必须与条目档号相一致,一致率要100%;扫描图像完整性要求100%正确,完整性包括不准缺页、漏页。图像的倾斜度、清晰度、整洁度等技术指标,要求抽检合格率达到95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数×100%。
5.数据移交要求
5.1数据说明
数据说明是指说明本次移交数据的一个说明性文件,包括扫描模式、分辨率、存储格式、图像质量质检情况、目录数据检查情况、数据总存储容量、扫描页数、件数等说明。
5.2数据整理
以一张DVD光盘的容量为单位,将TIFF文件和PDF文件分别按年度进行分包。如一个年度的数字化成果不超过一张DVD光盘的容量,则将这个年度的数字化成果放在一个文件夹内,文件夹命名为××单位××年度××(类)档案数字化成果,如“临海市档案馆2019年度文书档案数字化成果”,文件夹内再按保管期限分类,如“永久、30年”;如一个年度的数字化成果超过一张DVD光盘的容量,则先按保管期限、再按件号进行分包,分包后在文件夹命名时体现包内数据的范围。
5.3数据封装
将分包后的图像进行压缩打包,刻录光盘,数据说明文件和电子目录放在首张光盘中,TIFF文件和PDF文件分不同光盘刻录。数据不含密级数据。封装时应同时生成数字摘要。
5.4刻录光盘要求
选用一次写光盘,并且应选用质量好的品牌光盘,如JVC国际档案级光盘、知名品牌单盒装光盘等。刻录前应对光盘进行材质检测,并以8倍速或不超过8倍速进行刻录,以确保数据刻录的质量。
归档光盘数据刻录完成后应设置成禁止写操作的状态,不能再对光盘数据进行增减。
移交的光盘按照《档案数字化光盘标识规范》(DA/T52-2014)的要求进行标识。
5.5填写材料
各单位在移交纸质档案数字化成果时应填写《纸质档案数字化成果交接文据》(见附件1)一式两份,由双方签章确认,其中一份由移交单位保存,一份由市档案馆留存。
各单位在开展档案登记备份工作时应填写《电子文件和数字档案备份情况表》(见附件2,含明细表、数据检验表),并报送一式两份,由双方签章确认,其中一份由移交单位保存,一份由市档案馆留存。
5.6报送与移交
各单位应在纸质档案移交进馆时同时报送纸质档案数字化成果。
各单位应在每年的11月底之前完成档案登记备份工作。
附件1
纸质档案数字化成果交接文据
移交单位名称 | 接收单位名称 | |||||
光盘数量(张) | 档案所属年度 | |||||
档案类别 | 机读目录数量(条) | 目录数据格式 | 数字文件数量(件) | 数字文件格式 | 起止档号 | 保管 期限 |
合计 | ||||||
检 查 情 况 | 检查项目 | 移交单位检查情况 | 接收单位检查情况 | |||
载体外观检查 | ||||||
病毒检查 | ||||||
可读性检查 | ||||||
目录数据检查 | ||||||
图像数据检查 | ||||||
其他检查 | ||||||
移交说明 | ||||||
接收意见 | ||||||
移交单位(印章) 负责人: 经办人: 移交日期: 年 月 日 | 接收单位(印章) 负责人: 经办人: 移交日期: 年 月 日 |
档案备份情况表
报送批次编号:J276-2020-001-001(示例)
填 报 单 位 | |||||||
经 办 部 门 | 填报 日期 | 涉密 情况 | |||||
情 况 说 明 | 移交 光盘一式共 张,其中TIFF格式 张( GB),PDF格式 张( GB)。 件 、共 页 本次共报送 份备份载体 个备份文件包。 谨申明:我单位备份数据根据省政府令306号《浙江省档案登记备份管理办法》要求报送,内容真实、完整。 | ||||||
档案备份载体(包)自检情况 | |||||||
经办人 | 检查人 | ||||||
单位领导 审批意见 | (单位盖章) 年 月 日 | ||||||
主管机关 审批意见 | (主管机关盖章) 年 月 日 |
注:“涉密情况”是指备份数据是否涉及国家秘密、工作秘密或个人隐私。“主管机关审批意见”栏只针对二三级单位。本表一式两份报送同级档案登记备份中心。
报送批次编号:全宗号-报送年度-数据类别-报送批次编号,其中数据类别001标识数字化成果、002标识电子档案、003标识电子业务数据,报送批次编号用3位数标识。
档案备份情况明细表
单位名称(盖章):
载体(包)编 号 | 备份形成时间 | 内容说明 | 数字摘要 | 载体形式 | 实际容量(MB) |
J276-2020-001-001-0001(示例) | |||||
注:“数字摘要”是指对备份载体(包)用MD5、SHA1等摘要算法生成的唯一性摘要信息(或摘要文件),用于标识该备份载体(数据包)的真实性、可靠性,填写时应注明摘要算法。“载体形式”指档案备份数据载体形式,包括:光盘、磁带、移动硬盘或在线报送等。本表一式两份报送同级登记备份中心。
载体(包)编号:全宗号-报送年度-数据类别-报送批次编号-光盘(包)编号,其中数据类别001标识数字化成果、002标识电子档案、003标识电子业务数据,报送批次编号用3位数标识,光盘(包)编号用4位数标识。
档案备份数据检验表
报送单位 | |||
报送批次编号 | |||
材料审核情况 | |||
技术检测情 况 | 载体外观 | ||
病毒检验 | |||
可靠性检验 | |||
完整性检验 | |||
规范性检验(电子业务档案除外) | |||
技术方法与相关软件、说明资料检验(包括是否有加密、电子签名等) | |||
处理意见 | (经办人签名) | ||
受理单位意 见 | (盖章) 年 月 日 |
注:本表一式两份,一份由受理单位保存备查,一份反馈给报送单位。