1、地方政府农业部门网站与农业发展的关联度分析摘 要:信息化的发展为农业的持续发展提供了新的契机。以我国七省中 102个城市为研究样本建立回归模型,探究地方政府农业部门网站的建设质量与地方农业发展的相关关系,基于总体样本及东部、中部和西部不同的经济区域分别进行回归。研究结果表明,地方农业部门网站建设质量与人均农业总产值正相关。就总体样本和东部区域而言,人均农业总产值每提高 100,网站评估因子将提高 0.21分和 0.26分。而且,这种关联在按照人均农业总产值水平进行分组归类后更为显著,拟合优度达到 75%,再剔除一些农业产值较高的资源性城市和网页数出现异常值的城市之后,拟合优度可达 81%,这一
2、计量结果定量地证实了地方农业部门网站与地方农业发展之间的关联度。 关键词:农业部门网站;网站建设质量;农业发展水平;回归分析 中图分类号:F320 文献标识码:A 文章编号:1003-3890(2015)06-0083-08 一、研究背景 互联网技术的出现和飞速发展使信息的传播变得更加迅捷,也极大地提高了信息对社会的影响。根据 CCNIK发布的2014 年度中国互联网络发展状况统计报告 ,截至 2014年 12月,中国互联网普及率为47.9%,其中农村网民规模不断扩大,占比达 27.5%,规模达 1.78亿。同时, “.CN”域名年增长 2.4%,达到 1 109万1。在我国网民和网站都大幅增
3、长的情况下,农业信息化的发展状况日益为现代农业所关注和运用。为保障和促进现代农业的进一步发展,中央一号文件多次将农业信息化建设作为新农村建设的重要内容之一;十二五纲要提出了“发展农业信息技术,提高农业生产经营信息化水平”的具体任务,从而将通过信息化的途径促进农业的发展上升为国家战略规划的重要内容之一。农业信息化对于解决“三农”问题,促进农民增收、农业增长、农村稳定都有着积极深远的影响。 农业网站正是重要的农业信息服务平台之一。现在,全国各级政府农业部门网站已发展到一定规模和数量,上至省(区、市)农业行政主管部门,下至地级、县级农业部门均建立了农业信息网站,一些乡镇也有农村信息服务站。与此同时,
4、与农业紧密相关的各类行业网站、科教媒体网站和企业网站大量兴起。中国涉农网站具有数量大、品类全、结构完整的特点,这些网站在满足农民信息需求、推进农业信息化方面发挥了巨大作用。网站内容通常包括三农新闻、政策法规发布与解读、行政审批与在线服务、市场行情分析预测、农业技术知识与农民就业信息等,基本上涉及到了农业、农民、农村的各个方面。 对于还处在农业经济增长方式转型时期的国家来说,科技与信息使得传统的产品供求模式和生产目标发生改变,信息化的发展为农业可持续发展提供了新的契机。目前在农村人口占 46%的我国,信息化仍未充分发挥对农业经济增长的作用。提高农业信息化水平,加强对政府农业部门网站的建设,使农民
5、及时获得准确的政策、市场与技术信息,将非常有助于发展农业生产,降低各项农业生产经营成本,优化资源要素配置,促进农产品的流通,使农业生产经营过程的种植、生产及销售各个流程更为紧密地衔接,促进农业经济增长。从而达到提高农民收入,改善农民生活水平的目的。 综上所述,农业信息化对农业经济发展的促进有着举重若轻的作用,建设政府农业部门网站是提高农业信息化水平的重要渠道之一,因此我们有理由推测当地农业部门网站的发展水平与当地的农业经济发展水平是相互关联的,从而对这种关联进行经济学分析是十分必要的。 综合国内外网站的评价研究,学者们已提出的衡量方法有网站自动评价法、网络可用性评测法、网站链接分析法、网站框架
6、评价法和对应分析法等。由于各种评价方法的角度和侧重点不同,得出的结论也不尽相同。 1997 年 Peter2为了分析一定时期内相对关注的网站平均被引情况,首次提出网络影响因子(Web Impact Factor,以下简称 WIF) ,这被认为是网络信息计量学诞生的里程碑。 WIF 的概念源于引文分析的测度指标期刊影响因子3。此后,众多学者指出,WIF 体现了信息资源在信息交流中被人民所重视的程度,如田红梅 等都在针对不同类型网站的评估研究过程中使用了 WIF,而且大部分结果均表明,WIF 对评价网站质量和网站影响力有重要价值。 杨涛3在各种大学评价指标体系中进行比较和研究时,发现以网页总数为分
7、母的网络影响因子的整体表现要优于其他各种的网络影响因子,而且 WIF与各种大学的评价指标体系最为相关。段宇锋4基于网站被链接频次的方法,以网络影响因子作为评价的依据,对美国商学院网站进行了研究,所得结果认为 WIF对评价网站质量和测定核心网站具有重要价值,可以用来作为评估网站的依据。 田红梅5基于链接分析,将 WIF运用于对学术性核心网站的评价,发现 WIF可以用来分析在一定的时期内相对关注的网页情况。通常,影响因子越大,网站的学术影响力就越大,质量就越高。因此,网络影响因子从信息的利用角度,体现了信息资源在信息交流中被人们所重视的程度。王宏鑫6通过对公共图书馆网站的研究,发现 WIF在各自网
8、络指标中可信程度最高。 沙勇忠7在利用网络链接分析及网络影响因子对中国省级政府网站的影响力进行评价时,用 WIF与各省市自治区信息化水平总指数进行相关分析,结果表明二者具有明显的相关关系。可见,网络影响因子对评价省级政府网站具有重要的意义,WIF 具有很强的评价能力。而宴尔伽8通过对省会城市政府网站的研究,发现 WIF与政府网站排名是具有相关性的。 王知津9提出了以链接分析为核心的评价指标,其中包含:网页数,即该网站内所包含的网页总数;总链接数:用搜索引擎搜索到的与某网站存在链接的网页总数;外部链接数:用搜索引擎在该网站外搜索到的与该网站存在链接的网页数。网络影响因子=总链接数/网页数。他认为
9、网络影响因子越大,网站的学术影响力就越大,质量就越高。 以上研究中均采用网络影响因子对网站进行评价。如果一个网站相比其他网站重要程度更高,那么在网站规模相当的时候,其被链接和推荐引用的次数也应当比较高。利用这种方法来评价一个网站,比单纯的定性分析也更具有说服力。 一个网站所拥有的网页数越多,信息含量越大,这在一定程度上反应了网站的规模。而处于 WIF定义中的分子“总链接数” ,则反映研究对象的被认可程度。在网络环境中,指向目标网站的每一个链接,都被认为是对目标网站的一次投票,效果类似于对传统文献的引用。而网站自身所拥有的网页多属于导航性质的链接,主要用于网站内部的信息组织,而与网站影响力无关。
10、所以,用搜索引擎搜索到的该网站存在链接的网页总数除以该网站所拥有的网页数,能够有效地消除网站自身规模的影响,能够反映网站网页被链接的平均水平,即网站的平均影响力大小。 考虑到网站评价的科学合理性原则和实用可行性原则,本文最终决定基于网络链接分析对农业部门网站进行质量评估。所谓链接分析法,就是运用网络数据库、数据分析软件等工具,利用统计学、拓扑学和情报学方法,对网站的网络链接自身属性、链接对象、链接网络等进行分析,以便揭示其数量特征和内在规律。在链接分析中,上述不少学者是利用 WIF对网站评价进行测度,大部分认为 WIF对网站评价有重要意义,故本文最终选取 WIF对我国部分地区农业部门网站的建设
11、质量进行评价。基于农业部门网站的链接分析结果,我们研究其与农业发展之间所存在的可能的相关关系。具体方法是用网络影响因子作为衡量网站建设的评估得分,用当地的人均农业总产值来衡量农业发展水平,最后对农业部门网站的建设质量和地方农业发展水平的关联度进行实证分析。 二、数据选取与模型选择 从科学角度说,我们的研究应该选择农业产值比较大的省份。根据从 2003年到 2013年中国统计年鉴中提供的数据,农业产值排在前列的省份有山东省、河南省、河北省、江苏省、四川省、湖北省和湖南省。考虑到样本规模需要适度又充分,本文选取了这七省内的下辖市(名单取自各省统计年鉴)作为研究对象,城市总数为 102个。其中有山东
12、省 17市、河北省 11市、河南省 18市、江苏省 13市、四川省 18市、湖南省 13市和湖北省 12市。 中国软件测评中心每年颁布的中国政府网站绩效评估报告中对国家部委网站、省级(副省级)政府网站、区县级政府网站进行了质量评估。但遗憾的是,该报告中缺乏对各地区具体部门网站的评估。目前国际上较有影响的网站评价机构有 Amazon公司的 Alexa、Forrester Research公司等,这些机构均能提供专业性网站评价服务。但同样,由于这些第三方评价机构收录网站个数有限,以及取样的网站规模(这些机构所收录网站通常规模较大)所限,无法从这些较科学、成熟的评价体系中直接获取样本网站的评估结果。
13、因此,本文将进行独立评估。 评估网络影响因子所需要的网络链接的数据都来自于搜索引擎,因此,搜索引擎的选择在网络链接的测度中起着非常重要的作用。目前能够提供中文网站链接情况的搜索引擎有:AltaVista、Alltheweb、Northlight、Google。其中 Northlight服务需要付费,AltaVista 在国内不能使用,考虑到可行性的问题,我们选取了Google搜索引擎。以新浪网()为例,利用 Google测其链接数的具体检索式为: 利用上述检索式,我们对这 102个城市的农业局网站(或由农业局承办的农业信息网)在 Google中进行了检索。分别得到了各市农业部门网站的网页数、总
14、链接数。通过计算二者比值可得该网站的网络影响因子,并用此变量作为衡量农业部门网站建设质量的评估得分。为保证数据的稳定性和科学性,本文对样本进行了筛选。首先,由于不同行政级别的城市之间差异较大,本文将各省的省会城市剔除;其次,考虑人口规模。因为我国共有约 300个地级市,农村人口占到 6亿。单从取样的102个地级市来说,城市人口规模从 100万跨度到 1 000万都有,为了保证样本数据的连贯性和可比性,我们将劳动人口在 250万人以下的城市样本剔除。其中包括东营市、莱芜市、鹤壁市、三门峡市、自贡市、雅安市、鄂州市和张家界市;最后,还剔除了网站在 2014年末改版、无法打开页面、或网页信息不全等情
15、况下的样本,其中包括东台市、乐山市(两市均无政府官方农业部门网站) ,宿迁市、保定市(此两市农委网站数据无法从 Google获取) ,济源市(该网站的 robots.txt文件存在限制指令,数据无法从搜索引擎获取)和广元市(该市于 2014年底前后改版)。所以 102个样本中,实际有效的数据为 81个。山东省 14市、河北省8市、河南省 14市、江苏省 11市、四川省 13市、湖北省 10市和湖南省11市。 在选取度量地区农业发展水平的变量时,本文采取的是当地的人均农业产值,在原农业产值的基础上除以当地总人口所得。采用人均农业产值而非农业总产值的目的是消除由于不同地区人口规模差异带来的影响。相
16、关数据如表 2所示: 我国各个地区由于自然条件、地域文化以及政策导向的不同,经济发展水平既有差异又各具特色。整体上可划分为东部、西部和中部三大经济地区。而在本文取样的七省中,河北省、山东省和江苏省属于东部地区,河南省、湖北省和湖南属于中部地区,四川省则属于西部地区。 本文采用线性回归的方法研究政府农业部门网站建设质量与当地农业经济发展水平之间的相关性,运用统计数据做实证检验,构造一元回归模型如下: Mi=C+C1Gi+ 其中 Mi表示 i城市农业部门网站的网络影响因子,我们用此变量作为衡量该网站建设水平的评估得分;Gi 为 i城市 2014年人均农业产值, 为随机误差项。利用 eviews软件
17、,通过对上式进行回归分析,我们可以建立农业部门网站建设质量和地方人均农业产值间的线性关系。首先,基于原始数据,取七省全部 81个城市的样本进行计量回归。然后再根据东、中、西部三大地区分别进行回归分析。 三、基于原始数据的回归分析 使用 eviews软件对原始 81个城市的网络影响因子及各地人均农业产值数据进行回归,回归结果如表 3所示。 从表 3可得,回归系数均为正。从总体上的实证结果来看,各地的农业部门网站建设与该地区的人均农业产值呈现出正相关的联系。结果定量地验证了农业部门网站与地方农业经济发展水平存在促进作用的理论。从 t检验中的 P值为 0.000可知,原假设是显著的,即农业部门网站质
18、量的回归系数不为 0,总体回归通过检验。根据数据制出关于网站建设质量与人均农业产值的散点图,如图 1所示。 尽管从拟合结果来看,两个变量整体上存在着正向的联系,但上述方程的拟合优度 R2仅为 30%,说明回归直线对观测值的拟合程度较差,这一线性方程不能很好地描述二者之间的关联度。从回归系数来看,所得的回归系数值为 0.002 126,其经济含义为人均农业产值每提高 100会导致农业部门网站评估得分提高 0.21分,在样本总量 81个城市中,符合这一趋势的城市比例约为 30%。 东部地区各市回归结果所得的系数也为正,且每个 t检验结果也均表明检验通过,回归系数是显著的,不为 0。与全部样本回归的
19、结果相比,东部地区所得的回归系数值更大,人均农业产值每提高 100时,网站评估得分将提高 0.26分左右,拟合程度也更好,从 30%增至 38%。东部地区 34市的农业部门网站建设质量与人均农业产值的散点分布与回归如图2所示。 从散点图上的分布来看,这两个变量的确存在着正向相关的关系,但是回归分析得到的线性方程拟合程度较差,尚不能很好地描述农业部门网站建设质量与当地人均农业产值水平之间的相关性,这与总体样本的回归结果是相同的。 然而中部地区和西部地区的回归结果则有一些差异。两地区 t检验的 P值分别为 0.006 5和 0.691 4,西部地区未通过显著性检验,这表明回归系数有较大的可能为零。
20、此外,两个地区的拟合优度较总体和东部地区更低,分别为 0.20和 0.01。所以我们无法证实在这两个经济区域中,农业部门网站建设质量与地方农业经济发展水平之间存在显著的线性相关关系。中部地区和西部地区的农业部门网站绩效评估得分与人均农业产值的散点分布图如图 3和图 4所示。从西部地区的回归结果和分布图来看,我们无法直接得出二者存在显著的正相关关系,而且西部地区的相关性明显要低于中部地区。 四、基于分层归类的回归分析 不论是对七省中的总体样本进行回归分析,还是将东中西部三个地区的样本分别回归,所得的线性方程对实际数据的拟合程度都比较低,这说明以上计量结果还不足以证明农业部门网站建设与当地农业经济
21、发展水平的关联度存在着促进关系。但是从散点图的趋势线中不难看出,二者之间确实存在着一定的正向联系。为了更好地描述和证实二者的关联度,本文基于以上分析结果,借鉴前人的分层分析方法,通过将样本点分布的分散性降低来研究变量间的相关性。 对总体 81个样本做以下处理:首先将城市按照人均农业产值降序排列,以每 9个城市为一组,然后分别计算出每一组的平均农业部门网站评估得分与平均人均农业产值。再利用(1)式,将数据带入方程式中回归。同样的,我们也对东部、中部的样本做这样的处理,但是考虑到分区域样本量较小,对东部地区和中部地区以每 5个城市为一单位进行分组。由于西部地区只包括四川一个省的数据,分组的话样本量过小,故未对西部地区做分组处理。所得结果如表 4所示: 从表 4可以发现,在各地区分组之后,回归系数的变化并不明显,但是拟合优度均有显著幅度的提高。以总体样本为例,分组前的拟合优