1、CADAL质检过程,CADAL管理中心质检管理小组,Contents,一 :质检流程,质检流程,2,3,4,5,质检基本流程,二:抽样模型,抽样模型,电子书的质检主要分两个部分,机器质检人工质检其中机器质检为100%质检,这里说的抽样模型是相对于人工质检来说的. 质检系统抽样采用的是GBT 2828.2-2008国家标准.标准抽取样本数量、加工单位质检的人工质检历史通过率、资源类型权重计算获得实际抽检样本数量,GBT2828.2-2008,抽样模型公式,(样本数量/历史通过率)*类型权重 样本数:根据允许缺陷率查表得 历史通过率:根据历史质检情况计算 类型权重:不同类型资源有不同权重,抽样模型
2、,历史通过率低 本次抽到质检的数量多例如:本次抽样查的为100,历史通过率为85%,那么本次实际抽样结果是(100/0.85)*1=117(本),历史通过率高 本次抽到质检的数量少例如:本次抽样查样本的为100,历史通过率为95%,那么本次实际抽样结果是(100/0.95)*1=105(本),GBT2828.2-2008抽样结果,三:质检内容,质检内容机器质检内容. 人工质检内容.,机器质检内容1:是否缺少必备文件 检查oebbrowser.html,dc.xml,a.opf,Catalog.xml 2:文件格式检查 检查文件dc.xml,a.opf,Catalog.xml 格式是否合法.3:
3、必备目录检查 检查资源目录结构是否正确,包含meta、ptiff,中文格式的otiff,英文格式的html目录,机器质检内容,全文检查 检查ptiff和otiff中文件个数是否一致非法文件检查 检查是否包含0kb文件无效文件检查 在目录meta中是否存在多余文件元数据检查 检查dc.xml文件中,标引字段的必备项。如目前检查的必备字段暂定为: 题名,语种,格式,类型(会根据不用资源类型确定不同的必备项),人工质检内容,元数据内容是否正确,包括dc.xml,a.opf中数据是否正确. 图片质量检查,包括图像的清晰度,图片是倾斜,图像是有有涂改痕迹等等.,正确的dc.xml,1.检查必填字段有没填
4、2.检查必填字段填入的数据是否符合规范,四:通过率统计,通过率统计,根据质检通过率的处理,一个批次通过率包括机器质检通过率和人工质检通过率.,质量预警的处理,同一单位连续2次收到质量预警同一单位累计3次收到质量预警 管理中心将暂时停止接受此单位加工的资源,并要求重新进行资源加工培训,实时通过率实时通过率包括机器质检通过率和人工质检通过率. 当发现当前通过率低于90%时,Cadal管理中心人员会联系该加工单位,询问当前质检电子书的一个情况,使加工单位能及时了结正在质检的电子书情况.,历史通过率历史通过率包括机器质检通过率和人工质检通过率. 历史人工通过率作为抽样模型的一个基数据.即通过GBT2828.2-2008抽样模型后除以历史人工通过率。历史通过率越低,该抽样模型抽取到的质检数量就越多,批次质检结果,每个批次完成质检,都会产生如下格式的质检结果报表包含:1 批次质检结果2 批次不合格资源及错误清单3 批次合格资源清单 详见附件,Cadal质检管理小组,Thank You !,