1、1关于“人均图书消费量”的内涵分析摘 要:文章从统计学范畴分析了“我国人均图书消费量”统计数据引发争议的原因,认为统计方法选择、指标设计、数据采集等统计生产过程中的不足造成数据局限性以及数据的使用不当和误读导致认知误区。指出任何统计数据的产生都跟统计方法的选择和数据获取途径与处理路径有关,而对真相的掌握则需要理性与专业精神。同时提出改进的思路与方法以及借鉴美国“人均信息消费量”相关统计的思考。 关键词:人均图书消费量 统计 解释 中图分类号: G250.252 文献标识码: 文章编号: 1003-69(11)50021-04 Statistical Interpretation and Thi
2、nking about “Per Capita Consumption of Books“ Liu Junhua (Xian University of Finance and Economics, Xian, Shanxi, 710100) Abstract:This paper analyzes from the angle of statistics the reason of the controversy raised about “Per capita consumption of books“. It points out that misunderstanding may be
3、 caused by either limit in statistical method chosen, index design and data collection or misinterpretation of statistical data. The paper further elaborates that rationality and 2professional spirit are essential for the acquisition of the truth, since statistical data is always determined by the s
4、tatistical method chosen and the way of data collection. In reference to the American study of “per capita consumption of information“,method of improvement is proposed as well. Key words:per capita consumption of books; statistics; interpretation number: G250.252 Document code: A Article ID: 1003-6
5、938(201)05-0021-04 2011 年 4 月 8 日人民日报一则出版大国的尴尬:人均图书消费量 20 年徘徊不前的报道引发社会关注,文中提到:“1990 年我国人均图书消费量(扣除教材、教辅,下同)为 5.2 册,2009 年这一数字为5.6 册,20 年过去人均购书量只增加不到 0.5 册” 。 1 引发关注的焦点在于文中“我国人均图书消费量”的统计数据,这则报道经“凤凰卫视”和众多网络、电台及平面媒体转载后引发社会强烈反响,所有这些是从社会新闻角度对“我国人均图书消费量”统计数据的基本认知反应,而对于统计数据的正确理解不仅需持理性态度更应具备专业精神,只有这样才能对数据的解读
6、和运用做出正确判断。 一般而言对统计数据的理解必须结合相应的辅助信息,包括统计指标的定义和数据来源及统计方法,从发布数据的角度而言都应该对此做出说明以免数据误读,这则报道中除了统计数据外笔者并没有获取到与3之相关的其它信息,包括统计调查过程、样本分布、计算方法等,笔者也试图通过国家统计局和新闻出版署获取此方面信息然均未果。而“人均图书消费量”数据被媒体与社会解读的盲区也恰恰在此,因此笔者想从统计学的角度对这一数据和现象进行分析。 1 “人均图书消费量”统计指标的定义与内涵 1.1 指标概念界定 在统计学范畴内分析数据的前提是明确统计指标的定义和内涵。关于报道中的“人均图书消费量” ,笔者从广东
7、省新闻出版局网站获知,“人均图书消费量”是指一年内我国出版图书总量与年末总人口的比值。2 看上去有点人均图书 GDP 的意思,原本这一指标用来判定我国图书出版业的生产与消费基本情况并没问题,而误会的发生在于新闻报道中将“人均图书消费量”与“人均购书量”联系起来,进一步将其引申到“人均读书量” ,并以此来推断国民读书情况,因而产生“大国的尴尬”和“民族的汗颜” 。思维的逻辑在于从“人均图书消费量”20 年基本没变的数据得出“全民读书风气不盛”的结论。姑且不去分析其结论是否正确,就统计指标而言这是三个有关联却不同的概念。如果说“人均图书消费量”和“人均购书量”在消费统计层面具有部分交叉的话,而“人
8、均读书量”则与其有本质的区别和差异,否则按照这种逻辑,图书销售商将会成为读书最多的人。 1.2 指标内涵分析 “人均图书消费量”在目前环境下,由于受市场分化、技术以及统计体制等因素影响,与此更权威的统计数据还没看到。就这个指标本身4而言 20 年前后其内涵发生了很大改变,但是从报道来看文中该指标内涵应该是一致的,否则两者不具备可比性。从报道中可以看出“人均图书消费量”显然是指纸质出版图书消费量,然而在目前信息化趋势下,图书消费包含纸质图书消费和非纸质图书消费,单就纸质图书消费而言在除去教育类消费后其总体趋势是基本稳定甚至有点相对萎缩。至于在非纸质图书消费方面,信息化带来的电子阅读或者数字阅读却
9、正在强劲增长,2011 年 5 月 20 日美科技网站 Computer World 报道,亚马逊电子书销售量已经超过其纸质书销售量3 ,显然这种成长性趋势不容忽视,然而这一部分图书消费并未包含在“人均图书消费”的数据之内。即使如此按其文中逻辑也不能判定纸质图书的阅读必然下降,纵然受此影响纸质图书的阅读也许会下降,但也并不意味着国民读书总体状况的下降,毕竟图书消费非刚性需求,图书阅读是一种理性的思维活动,图书消费意识和习惯具有某种社会稳定性,更何况纸质图书是耐用品,体现在统计数据中的 1 本书的消费量也许会达到 100 人次的阅读量。 1.3 认知误区解析 从统计指标内涵而言,用“人均图书消费
10、量”来反映目前的图书消费状况在指标内涵方面就存在缺陷,再用其来判断国民读书情况逻辑上就不严密。在这个前提下即使有一天我国“人均图书消费量”有了很大的提高,也不意味着国人突然都读书了,这种内涵的指标最多说明我国是纸质图书生产大国,决不能证明我们是真正的图书消费大国和阅读大国。如果以此作为判定国民读书情况的唯一指标,那么这个指标和数据还有待商榷。 5因此在统计学范畴内以报道中的指标定义与内涵,用“人均图书消费量”来推断和判定国民读书情况只能是一个基本的不恰当参照,这就正如国民经济统计中用人均 GDP 来衡量国民收入水平一样,目前正在采用的“平均工资”尚不能反映真实的国民收入状况,用人均 GDP 去
11、判断只能差的更远。同样“人均图书消费量”的统计意义在于 20 年前后纸质图书生产与消费的宏观比较,而不适于用它来解读目前人们的图书消费和读书情况,这里边的误区在于指标概念、内涵的差异,虽然“图书消费”和“国民读书”两者之间存在某种逻辑上的相关,但两者之间决不存在对等或者替代关系。 2 “人均图书消费量”指标的统计学性质分析 就指标性质而言, “人均图书消费量”在统计学范畴内它是一个平均指标,使用平均指标不仅要理解平均的含义和统计方法更要明白其局限性。首先平均指标的统计学含义在于超宏观的简单数据比较,从中得出趋势性特征。但是平均指标由于其数据来源样本的差异性特征在统计平均中被消弭,直接导致数据内
12、涵与样本分布个体形态比较上反差较大,特别在样本自身的数据分布特征差异强烈的情况下,统计平均指标一般只具有时序内的宏观纵向比较价值,而并不具备实践上微观个体横向参照性。其次使用平均指标还存在计算方法的选择问题。平均指标的计算方法包括算术平均、调和平均、几何平均、众数、中位数,但各自特点不同应用范围也不同。只有根据统计对象的具体特点和不同情况选择合适的计算方法,才能实现平均指标的统计价值。而报道中“人均图书消费量”的计算方法显然只是最基本的算术平均,并没有选择与图书消费6和阅读形态分布更相近的“众数或中位数” 。最后就是平均指标自身的局限性,关于这一点中国人民大学统计学院高敏雪教授在接受采访时曾经
13、说过,虽然平均数来自于众多样本个体的平均数据,但它会掩盖一些差异,从统计学角度讲,这是任何平均数统计都会存在的问题4 。从这一点可以看出对平均统计数据局限性的认识是数据解读的一个基本前提。因此从指标性质角度而言“人均图书消费量”的统计价值仅限于反映我国纸质图书的生产、消费宏观基本情况,却不能反映图书消费客观准确情况,更不能反映国民读书真实情况,就算改以“人均图书阅读量”作为统计指标来反映国民读书全貌依然比较困难,举个简单例子就是 1个博士 1 年读 10 本书,9 个民工 1 年读 0 本书,平均后人均读 1 本书每年,数据反映的状态是 10 人每人 1 年读 1 本书,而现实是只有 1 人在
14、读书,这就是指标的局限性所在。从这个角度而言,将“人均图书消费量”解读为“人均购书量”在目前语境下就有明显不足,若再解读到“人均读书量”就有点勉强了,所以“人均图书消费量”统计数据被误读的原因之二在于统计平均指标局限性所致。 3 统计方法与指标选择机理 统计学中指标选择应根据调查对象形态的样本分布特征而定,平均指标的选择机理是只有在同质现象中才能使用,如果统计样本来自不同性质的对象与个体,则不能简单使用平均指标。在目前图书的生产消费形态和阅读方式均已发生了深刻变化的前提下,纸质图书与数字图书正处于趋势转型的临界状态,简单的使用平均指标已经不能反映图书阅读7与消费最新发展形态。如选择平均指标,不
15、论是“人均图书消费量”还是“人均读书量”要解决统计数据的客观性问题,就必须在现有指标的基础上要么作更详尽的分类统计,从而获取典型性特征数据,在方法选择上可以考虑使用加权而非算术平均,只有增加反映信息化中图书消费与阅读新因素的变异指标,将平均指标与变异指标结合使用,才能从客观上把握图书消费、阅读的基本分布特征,并在对其总体态势把握的前提下,采用合适的指标数据处理方法,从而得出客观的统计数据,也只有以此作为认识判断统计对象的主要依据,才能得出科学结论5 。而在这方面与此相关的另一份统计数据同样引人关注,2011 年 4 月 22 日中国新闻出版研究院组织的第八次全国国民阅读调查结果显示,2010
16、年我国 1870 周岁国民各媒介综合阅读率达 77.1%,比 2009 年增加了 5.1 个百分点,其中数字化阅读方式比 2009 年增长 33.3%, 6 这组数据不论是数据本身还是指标选择与统计过程和统计方法的说明都给人以与前报道不同的认知度,虽然这项统计给出 2010 年“人均读书量”数据只有4.25 本,而其所表明的国民阅读情况却并不悲观甚至是积极的发展态势。显然不同的指标和统计方法选择以及所能获取的不同数据来源是二者的重要差异,前者是出版行业在生产数据基础上与人口数据的简单平均而后者是专项的统计调查数据。所以任何统计结论的得出都跟统计方法的选择和数据获取途径有关,不同的统计方法和不同
17、的数据处理路径必然会导致不同的统计结果。 4 关于国民读书情况统计的思考 在目前的信息化环境下用“人均图书消费量”去判断国民读书情况8就跟现在用每个人写信的统计数据去判断人与人之间的沟通联系状态一样,假如 20 年前平均每个人写 10 封信每年,而现在平均写 1 封信,并不能判定现在人与人之间的交流和沟通活动减少了,而事实恰恰相反,今天人与人之间的沟通与 20 年前相比是更加频繁和密切了。人们之所以写信少了是因为有了比写信更便捷的信息技术与方式。而今天的读书就跟写信一样,正在发生着从形式到内涵的信息化转变,以前读书必须具备的复杂特定条件现在都简化了,基本上人们可以随时随地读自己喜欢的书,特别是
18、在经历数字化成长的年轻一代步入社会主流,他们的信息化生活方式正在改变图书消费、阅读的历史分布形态,因此数据公信力的关键还在于统计过程与客观现状的密切衔接。 从某种意义而言“人均图书消费量”引起热议甚至争议反而是一件好事,不论是社会新闻从道德层面呼吁多读书的角度来观察这一数据产生“民族的汗颜”也罢,或者从产业营销角度而言的“大国的尴尬”也罢,就数据本身来说在统计学范畴和社会新闻视角下产生不同认知是可以理解的。但是学术不同于新闻,新闻强调道德感,学术侧重严谨性,而客观、真实、科学都是二者共同的元素,所以问题的本质在于对真相的掌握。因此就统计学而言有必要继续进行专业的统计与研究,就此给出一份客观数据
19、,而图书馆学研究方面则应当对信息化趋势下国民读书真相给公众一个更真实科学的解释。毕竟 20 年间的中国发生了巨大的变化,这种变化不仅让每个人去体验,也需要数字去证实。 因此关于国民读书情况的认知仅通过“人均图书消费量”的推断是远远不够的,还有待于专业统计设计与调查,其统计过程必须覆盖目前9的国民阅读现状,在界定读书量的同时还必须兼顾国民阅读率的问题,只有两者结合才能准确掌握国民阅读态势变化;而另一方面信息化深度发展背景下单以“人均图书消费量”作为评判文化国力的参照指标也值得思考,是否应该考虑代之以更全面系统的指标,在这方面美国的相关做法值得参考,他们在统计图书相关数据之外增加“人均信息消费量”
20、的统计7 ,而这一指标更适合今天的信息化发展现状,我想美国学者的这种研究视角与统计方法值得借鉴。 5 结语 近几年由统计平均数引发的争议还真不少,从 2009 年的“平均工资”到最近“城镇居民人均居住月支出”数据,产生争议的主要原因一方面在于统计指标设计、方法选择、数据采集等统计数据生产过程中的不足以及由此造成的数据局限性,问题的实质在于政府统计滞后于社会实践发展尚不能满足社会对统计的进一步需求;而另一方面则在于数据的不当使用和误读。由此产生数据与感觉和真相的碰撞,试想用一个存在缺陷的数据让公众去认知和解读不恰当的对象会产生多少误区,而二者的结合将导致认识进一步远离真相。 因此用一个 20 年
21、没有变化的统计指标“人均图书消费量”去判断 20年间从形式到内涵均发生了深刻改变的“国民读书情况”在新闻中本身就是一个误会,而用一个趋势正在相对萎缩的图书消费部分数据让公众从道德层面去判断和证明关于国民读书总体情况的良好期望更是一个错误。古人有“书非借而不能读也”的感悟,在信息化融合的今天也许“书非买亦可读也”并不是一件不可能的事情。此外在某种意义上读书10与图书消费是不同的领域,前者属于理性的学习活动,后者属于产业范畴内的商业活动,虽然“只有爱读书的民族才有光明的未来” ,但道德期望与客观现实是不同层面的东西,因此对数据的感性认知与真相掌握也是另外一种逻辑,而在良好期望与纷繁现实之间面对着这
22、一切还需要足够的理性和专业精神,也只有这种理性与专业精神才能引领认知走近真相。 参考文献: 张贺.出版大国的尴尬:人均图书消费量 20 年徘徊不前N.人民日报,2011-04-08(17). 广东省新闻出版局.国家统计局数据显示我国去年人均消费图书不足 6 册EB/OL.2003-03-13.http:/ 83.html. 编译/七七.亚马逊称其平台上电子图书销量首次超过纸质书EB/OL.2011-05-20.http:/ 马艳梅.如何让统计平均数更加贴近社会公众的切身感受J.决策&信息,2008, (7):149-150. 张献民.统计平均数的统计学机理研究与应用J.统计与信息论坛,2006, (9):46-47. 吴娜.第八次全国国民阅读调查研究成果告诉我们国人阅