·资源服务动态

CADAL项目二期数字化加工质量统计分析

 

  在CADAL项目二期资源建设中,CADAL管理中心组织50所高校进行资源的数字化加工且完成170.3万册/件。根据最终的质量检查统计分析,无论是委托公司加工,还是选择自主加工,数字化质量千差万别。下面就CADAL项目二期各单位加工的数据质量进行分析并汇总常见问题,以便今后工作参考。

  在对加工质量统计分析前,先简单介绍质检流程和表中几项指标。 CADAL 管理中心质检流程简单概述为:

  • 各加工单位向管理中心提交数据;
  • 质检组对数据机检,机检合格率超过 98% 以上进入人工检查;
  • 人检达不到 90% 以上的或者达到 90% 以上但质检组不能修改的一律返回;
  • 质检组对于通过的数据进行终检,最终入库。

  人检合格率和返工率是反映单位整体加工质量的指标,同时还受资源类型、加工数量影响,比如英文图书比中文图书目录录入错误率高、在同等加工质量前提下加工数量越多返工率越高等等。

  二期建设中有13所高校选择自主加工,加工资源20.8万册,其中上海师范大学加工的音视频和内蒙古大学加工的蒙古文为特殊资源,在此不作分析。在11所高校中,加工数量排在前三位的分别是华中科技大学图书馆9.8万册、宁波大学图书馆1.1万册和北京大学图书馆1.0万册;返工率为0的且人检合格率在90%以上的单位有五家,分别是东南大学图书馆、大连图书馆、中国农业大学图书馆、北方民族大学图书馆、井冈山大学图书馆。

  综合分析在提交数量5000册以上的高校中,东南大学图书馆,宁波大学图书馆以及清华大学图书馆加工的质量较好。华中科技大学图书馆错误率较高,北京大学图书馆因首次人工质检不合格返工一次,返工率较高。详见附表一。

  此外,有37所高校选择了15家公司进行数字化加工,共完成149.5万册图书。在15家公司中,加工数量排在前三位的分别是深圳点通数据有限公司69.7万册 , 杭州中元数据科技有限公司52.8万册 , 成都瀛飞数据科技有限公司5.3万册。

  加工数量在1万册以上返工率低且人检合格率在90%以上的单位分别是北京怡境先卓数字科技有限公司、杭州中元数据科技有限公司、方正国际软件有限公司。深圳点通公司加工了40多万册英文图书,错误率较高。详见附表一

  同时,CADAL项目管理中心质检组对质检过程中发现的错误类型进行了统计,出现问题较多的依次是目录录入错误、目录链接错误以及元数据错误等,详见附表二

  数据质量统计.pdf

  错误类型统计.pdf

 


Copyright 2010 Administration Center for China Academic Digital Associative Library