1、基于文献出版统计分析的藏书质量控制摘要对“核心出版社”与“核心书目”以及“核心作者”的概念进行界定,对引文分析法及引文分析工具的优势与不足进行分析,提出基于 google scholar 进行引文分析,并结合布氏定律的测定方法。并以 2002-2005 年国内经济类图书的出版为例,以实证研究方式阐述测定过程,通过对其学科领域文献出版情况进行统计,从而获得经济类“核心书目” 、 “核心出版社”以及“核心作者” ,在此基础上提出经济类图书的采购及质量评价策略。 关键词核心出版社核心书目 1 前言 图书馆藏书质量控制主要包括两大系统,即文献采访决策系统和藏书质量评价系统,两大系统是既联系、又互动的有
2、机统一体。文献采访决策系统是保证入藏文献质量的前提和基础,是馆藏建设者通过对本馆文献需求、馆藏结构以及文献出版信息等方面进行充分调查研究的基础上,经过定性和定量分析、判断和综合,形成采购策略,并运用有效方法,实施文献采购的一系列过程;藏书质量评价系统是对藏书建设能否按既定的原则、方针和规划实施的评价反馈,是对藏书结构和采访决策适时进行完善、调整的重要依据。 关于“核心出版社”及将其作为文献采访决策时考虑的一个重要参量在国内早有研究,其依据的主要理论就是出版社是评价文献质量的一个重要参考因素。截止到 2005 年底,我国共有出版社 573 家,其中中央级 220 家,地方级 353 家。出版社的
3、规模、出版优势领域各不相同,其出版文献的质量也大相径庭。相对而言,高水平、专业性的出版社所出版的文献质量一般也比较高。对于相同主题、内容相近的图书,高校图书馆应选择高水平的学科专业出版社所出的图书;利用“核心书目”对图书馆藏书质量进行分析评价在国内也早有研究,并得到了一定程度的应用;而对于将“核心作者”作为选择学科类文献的依据,在国内也有先例,例如复旦大学图书馆根据一定的方法,建立了学科领域“核心作者”库,对于处于“核心作者”库的专家、学者的著作在学科图书采购中会优先选择。因此,如果高校图书馆根据自身所采购文献的学科特点,参考出版特色及水平,通过一定的文献计量学方法测定某学科领域的“核心出版社
4、” 、 “核心书目”以及“核心作者” ,一是可以据以调整本学科领域学术文献的采购策略,在实际工作中有的放矢,提高学科文献的采购质量;二是将“核心书目”与馆藏书目进行对比,以对本馆藏书质量进行评价和分析,然后根据分析结果对藏书进行复选和补遗,以提高文献的保障率,达到对藏书质量进行有效控制的目标。 2 概念的界定 关于“核心出版社”的概念,早在 1991 年,吴力群在关于“核心出版社”的探讨一文中首次提出:“核心出版社”就是出版某一类图书的质量可靠、历史悠久、知名度高、流通广泛的出版社;2003 年,钟建法在“核心出版社”采购的理论和方法一文中将“核心出版社”定义为某一学科领域图书出版中起主要作用
5、的出版社,其出版量大、质量高,有较高的利用率和较大的读者影响力,能较好地把握学科发展状况,并及时编辑出版反映本学科最新研究成果及前沿研究状况和发展趋势的图书;2006 年,何琳、喻文在核心出版社及其在图书采访中的应用一文中,借鉴核心期刊概念对核心出版社的概念有了更深入的研究:广泛性,一是体现在出版数量上,必须达到一定的出版量,二是体现在使用广泛、影响大;学科性,关于某一学科领域;学术性,主要体现在出版图书的学术水平和创新的程度上。通过将以上几种定义进行对比可以看出:图书馆界对核心出版社的认识,是随着其在图书馆中的应用不断深入的,钟建法和何琳对核心出版社的概念描述比较准确和全面,尤其是何琳将核心
6、期刊的定义引申到对核心出版社的定义中,更具全面性和科学性。 综合以上分析, “核心出版社”应该具有以下几方面特性: 2.1 信息密度高 核心出版社出版的文献基本上浓缩了本学科的学术精华,且在文献内容上涉及的学科范围也较全面,在本学科领域内具有重要的不可替代的作用。 2.2 内容较新颖 核心出版社出版的文献具有一定的新颖性、独创性,能追踪本学科(专业)研究的前沿阵地,反映本学科研究的最新进展。 2.3 学术价值高 核心出版社出版的文献在学术界有很大的影响,具有较高的评价或者较高的被引频率。 “核心作者”在文献计量学中,就是指某学科领域里在学术上比较活跃的作者。借鉴“核心出版社”概念的界定, “核
7、心作者”应具有两大特性:一是创作的著作在学术界具有一定的影响力或较高的学术价值;二是达到一定的学术著作出版量。 “书目核对法”是图书馆对藏书质量进行测评时应用较为广泛的方法之一,其原理就是将被评价的馆藏与标准书目、核心书目或权威性的馆藏目录逐一进行核对,以评价馆藏文献收藏的完备程度。由此可见,“核心书目”其实就是代表本学科最新研究成果及前沿研究状况和发展趋势,对本学科领域具有较大影响或推动作用的学术著作,即“核心书目”中的学术著作应具有较高的学术价值。 3 测定方法 “核心出版社” 、 “核心作者”和“核心书目”三者都强调了出版著作本身的学术价值,因此要对其进行科学测定,首先就需要对学术著作的
8、价值进行评价。而学术著作之间的引证关系在某种程度上可以揭示出研究活动的继承与发展,显示研究课题甚至学科的发展历程。因此,很早以前就有许多学者试图通过引文分析来达到评价学术著作价值的目的。引文分析虽然在评价文献的学术价值时会受到易获得性、虚假引用、自引和否定引用等因素的影响和干扰,影响引文分析评价的准确性,但是由于其基本上具有客观反馈性、广泛适用性等特点,通过定量分析弥补了人为定性评价的缺陷,在理论上仍然不失为一种国际通用的文献计量评价方法。尤其是近年来,随着引文数据库的建成,其可操作性也大大加强,使引文分析法得到了更为广泛的应用。然而,目前引文分析法的应用主要集中在学术论文方面,而在图书文献方
9、面应用得比较少,主要是因为引文数据库涉及的主要对象大多是学术论文,而对图书的引文情况缺乏相应的测量工具。GoogleScholar 的出现为通过引文分析法来考查某学科图书的被引或引用情况提供了可能。 2006 年,Coogle Scholar 扩展至中文学术文献领域,它不但可以帮助用户查找中文方面的学术资料,而且还可以作为引文库,帮助用户查证某位专家的某种文献被引用的情况。虽然,作为一种新出现的引文分析工具,相对传统测量工具来说,Google Scholar 还是具有比较大的局限性,如引文的质量不够高,不够稳定、权威等,但是,由于在 Google Scholar 中得到的引用文献既包括传统学术
10、期刊、学术图书,也包括 Web网页、预印本和电子期刊等,所以它不仅能反映学术文献之间的引用关系,也能广泛反映学术文献、Web 网页、预印本、电子文献之间的引用关系。因此 Coogle Schol-ar 对引用情况的覆盖率远远高于传统测量工具,这是 Google Scholar 成为引文分析工具的最大优势。 4 实证分析 4.1 统计样本 由于全国总书目是国内具有代表性的权威书目,出版社覆盖全国各地,基本上能反映我国经济类文献的出版情况,本文试选取 20022005 年全国总书目中的经济类书目作为统计样本。由于主要是查证经济类学术研究图书的被引情况,因此对统计样本进行初选,排除以下5 类经济类图
11、书:教材、教学参考书(影印版除外);培训及资格考试用书;经济学基础知识、操作实务、普及读本、创业及励志类图书;工具用书以及连续性的论文集、评论、年度报告;地方(地区)经济类图书。 4.2 测定过程 4.2.1 经济类“核心书目”利用 Google Scholar 在 2008 年 8 月,对统计样本中 22152 种经济类图书逐一进行被引频率查证,被引文献总量为 14511 种(即被引频次1),其中 2002 年是 3612 种,2003 年是 3633种、2004 年是 3708 种,2005 年是 3558 种,从查证结果看被引频次差异非常大,如图 1 所示: 被引频次越高,越说明学术研究
12、成果具有较高的利用价值,对本学科领域发展具有较高影响和推动作用,因此通过 Google Scholar 查证文献被引频次,可以对文献的学术价值做出比较客观、科学的测定,问题的关键就是选取被引频次多少次以上的经济类文献作为本学科领域的“核心书目” 。通过表 1 可以看出,被引频次在 5 次及以上的经济类文献占到被引文献总量的 43.9,占到四年经济学出版总量的 14.4,以被引频次4 次作为确定核心书目的标准,可以在一定程度上避免因引用动机等因素给利用引文分析法确定核心书目的权威性和准确性带来的影响。同时考虑到文献的被引频率与文献的出版时间关系密切,本文建议可以根据文献出版时间不同进行核心书目的
13、选取,如经济类“核心书目”以被引频次 5 次为基数进行选取,如 2002 年选择被引 5 次及以上的经济类文献,2003 年选取被引 4 次及以上的经济类文献以此类推,结果如表 1 所示: 4.2.2 经济类“核心作者” 学科领域的“核心作者”出版的图书往往具有一定学术质量保证。通过对图 1 的结果进行分析,以被引频次5 次作为确定图书具有一定学术质量的标准。考虑到“核心作者”应该具有一定的出版量,因此,以四年中出版学术著作种数3 种作标准进行选择。综合以上两个指标进行统计,可以得到如表 2 所示的“核心作者”: 4.2.3 经济类“核心出版社”将出版社按被引频率1 的学术文献种数多少降序排列
14、,如表 3 所示: 表 3 由于结合了引文分析,在一定程度上考虑到了文献的学术价值,但排序结果还是偏向于出版量大的出版社,而经济类文献出版总量相对较低的出版社则有可能会被排除在“核心区”之外,因而是不合理的。例如,商务印书馆,其四年出版的 136 种经济类文献中,具有学术引用关系的有 95 种,学术著作比例非常高,达到 70,并且具有比较高的平均引用频率。 因此本文将四年出版量在 90 种以上的出版社(考虑到核心出版社必须具有一定的文献出版量,本文以四年出版总量经济文献出版社数为基数进行统计)按学术文献比例降序排列,结果如表 4 所示: 首先,通过表 3 可知:20022005 年出版的具有学
15、术引用价值的14511 种著作中,其中 90 家出版社出版的总量有 11916 种,达到学术著作总量的 82,并且这 90 家出版社出版的经济文献占四年来经济类出版物总量的 72,基本上符合“二八定律” ,即 20的出版社的学术著作占到了出版总量的 80。因此,本文利用布拉德福区域分析定律对 20出版社进行进一步的划分,以便得到一个更加集中的区域。 根据布氏定律,我们将以上 90 家出版社分别分成三个区,使这三个区中出版社出版学术著作的种数呈下列关系: n1:n2:n3=1:a:a2 其中,a 为布氏常数,取 a=2,则出版社及文献分布为:处于第一区的出版社仅 13 家,但其出版的学术文献占学
16、术文献总量的 42.4;出版的经济文献总量占到四年出版总量的 31.8,因此有理由认为这一区域内的 13 家出版社为经济学领域“核心出版社” ,如表 5 所示: 然后,再对表 4 进行分析:103 家出版社四年出版的经济类文献量占四年总量的 80以上,学术文献总量占到 83,可以说是经济领域比较重要的出版社,同样依据布氏定律,可知排在前面的 13 家出版社也可以被认为是经济学领域的“核心出版社” 。 综合以上分析,本文测定的“核心出版社”共 21 家,分别是:经济科学出版社、中国财政经济出版社、机械工业出版社、中国人民大学出版社、清华大学出版社、中国经济出版社、经济管理出版社、中国金融出版社、
17、上海财经大学出版社、社会科学文献出版社、北京大学出版社、中信出版社、电子工业出版社、商务印书馆、三联书店、中国社会科学出版社、中国发展出版社、人民出版社、复旦大学出版社、中国计划出版社、上海人民出版社。 4.3 经济类藏书质量控制策略 一般来说,综合性的高校图书馆可以通过被引频次以 5 为基数的方式,确定学科领域图书的“核心书目” ,而对于经济类专业图书馆或其他类型图书馆来说,可以依据本校学科专业设置及学科发展情况,通过对表 2 中文献学科类别的选择或对出版文献引用频次的确定,选择符合本馆采购策略的“核心书目” 。通过“核心书目”的确定,一可以对馆藏某学科领域文献的采购质量做出评价;二是可以对
18、本学科领域文献进行复选或补充。而对于本校重点建设学科和新增专业,图书馆同样也可以通过分析专业基础课程、专业应用课程和公共基础课程的设置,应用上述方式测定其专业领域的“核心书目” ,然后与本馆已配置书目进行比对,复选出缺藏图书,形成学科缺藏书目,以备采访补缺。 考虑到经济学是一门理论与实际应用相结合的学科,学科范围比较广泛,而“核心出版社”出版的经济类文献无论在出版数量上还是出版品质上都比较高,内容涉及广泛,不仅包括应用技术类图书,还包括大量理论研究类、国外优秀经济类原版教材以及考试培训类用书,对于图书馆来说可以满足不同层次、不同学科的读者的利用需求。因此在经济类文献采购中,图书馆可以根据经济学
19、专业设置,对“核心出版社”出版的文献进行“网罗式”采购,除一部分不属本馆收藏范围或内容太过浅显的图书外,尽量收集齐全。为了避免书商书目不全而造成的漏采,对于“核心出版社”图书的采购最好采取直接和出版社合作的方式,如果出版社合作条件不成熟,也可向出版社索要书目,然后由书商代购。处于第二区的 26 家出版社,对专业高校图书馆来说,也应列为重点收集对象,可通过与出版社直接合作方式进行采购,但是对综合性高校图书馆来说,可以视专业设置和学科发展情况,通过书商征订目录有针对性地精挑细选。其余出版社,即外围出版社,因其数量较多,出版总量和其中有学术价值文献比例相对较低,对于其出版的应用技能类及实务操作类、考试培训类等图书,由于“核心出版社”这类型图书的出版量相对较大,采购到的图书已经能够满足读者需要,而且内容也是大同小异,可以考虑不再采购;对于其出版的理论研究类著作,需要对图书内容进行认真分析,然后精心筛选,保证采购的图书“全而不滥” ,具有一定学术价值。当然由于这部分出版社出版的经济类图书出版量及出版图书的