关于网站基本流量统计与分析的综述[文献综述].doc

上传人:一*** 文档编号:80283 上传时间:2018-06-30 格式:DOC 页数:6 大小:116.62KB
下载 相关 举报
关于网站基本流量统计与分析的综述[文献综述].doc_第1页
第1页 / 共6页
关于网站基本流量统计与分析的综述[文献综述].doc_第2页
第2页 / 共6页
关于网站基本流量统计与分析的综述[文献综述].doc_第3页
第3页 / 共6页
关于网站基本流量统计与分析的综述[文献综述].doc_第4页
第4页 / 共6页
关于网站基本流量统计与分析的综述[文献综述].doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、 1 本科毕业论文 文献综述 通信工程 关于网站基本流量统计与分析的综述 摘要 : 本文从网站流量统计分析的含义,主要功能,分析指标方面进行分析,然后重点介绍了网站流量统计的 2 种实现方式。 关键字 : 网站访问统计; 日志分析; 脚本 一、引言 随着网站内容的不断增加和流量的不断增大,如何对网站的访问统计做出详细的分析,了解网民对网站各栏目的关注度,进而为网站的发展和经营管理提供充分的依据已经成为必然,设计一套稳定、高效的网站访问统计系统也是每个网站所必需的。 1 二、网站流量统计分析的含义 在网络营销学科中,网站流 量泛指网站的访问量可用个网站一段时间内访问者的数量、访问者所浏览的网页的

2、点击率和平均停留时间等指标来描述。因此,网站流量统计分析是指在获得网站流量相关数据的情况下,通过对这些数据进行进一步的统计和分析,以便从中发现访问者访问网站的规律或网站内容存在的问题,从而为制定新的网络营销策。 2 三、网站流量统计分析的主要功能 在实际应用中,网站流量统计分析是企业用来了解客户分布的一种技术。目前,它所分析的内容和项目已不限于访问流量的分析还包括访问者的地域分布、访问者用户名的特征等,是企业开展网络直接调研的重 要工具之一。 网站流量分析软件的主要功能包括: (1)网站中各网页每日的总访问量,如点击率和传送数据总量的统计。 (2)关于访问者特征的统计,如访问者的地域分布、在网

3、站上的停留的时间等。 (3)网站上最受欢迎的频道、文档、图片等的统计。 (4)与网站相关的搜索引擎、交换链接、域名特征等的统计。 3 四、常用的网站流量统计分析指标 网站流量统计分析的基础是获取网站流量的基础数据,这些数据大致可以分为四类,每2 类又包含若干数量的统计指标。 (1)关于网站流量的统计指标 网站流量 统计指标用来对网站总体访问量进行统计主要指标包括: 网站中各网页每日的总访问者数量; 网站中各网页每日的独立访问者数量: 网站每日或每周服务器传送的数据总量 (用字节数衡量 ): 网站每日或每月总点击率、独立访问者数量或被请求链接的次数等。 (2)关于访问者特征的统计指标 访问者特征

4、指标主要反映访问者的地域分布、在网站上停留的时间、访问了哪些页面等,要的统计指标包括: 访问者的 IP 地址、访问时间以及进入的网页名称: 访问者在网站中停留的时间: 访问者使用浏览器的名称和版本; 访问者使用的操作系统名称和版本; 访问者点击率最高的网页等。 (3)关于网站内容的统计指标 网站内容的统计指标主要是用点击率、下载次数等反映网站中哪些内容是最受访问者欢迎的,具体包括以下统计指标: 网站中点击率最高的网页、文件名和路径名等; 网站中下载率最高程序名、文件名、文件类型等; 站内搜索中查询率最高的关键词或关键词组合; 网站中访问者退出率最高的网页; 网站中链接出错率最高的网页 等。 (

5、4)关于网站相关外部链接的统计指标 网站相关外部链接的统计指标主要反映与网站建立交换链接的网站、搜索引擎等对网站访问量所作出的贡献,这砦指标包括: 访问者进入网站某个网页之前的外部链接的地址: 访问者进入网站之前的最多的外部网站的名称; 访问者在网站登录的搜索引擎中查询率最高的关键字或关键字组合: 访问者通过外部网站下载最多的本网站的程序名称等。 4 3 网站流量统计分析可通过在服务器端安装专用软件来实现目前主要有两种软件的运行方式: ( 1)企业自购软件 来进行网站访问流量统计分析; ( 2)委托相关专业网站机构来进行网站流量统计分析。 第一种方法须配备相关的专业软件和技术人才,成本较高,但

6、应用相对比较灵活:第二种方法为利用相关机构的专业化服务,成本较低但应用模式相对单一。 5 五、 网站的访问统计实现方式 网站流量分析过程中最重要的是网站流量数据的获取。通过某种方式获得网站的访问记录,包括访问量、独立用户数量、总用户数量、页面浏览数、用户地理方位等等一系列对网站运行分析具有指导性意义的数据记录。分析数据就是采用某种算法对采集的数据记录进行综合分析,从而从 数据上把握网站运行的状态进而制定下一步运营策略。 6 目前,获取数据主要有两种方法:日志分析法和脚本嵌入法。下面简单介绍一下这两种方法: 第一种是采用基于 Web 方式的脚本嵌入式的数据获取分析方法。这种方法是在需要统计的网站

7、页面上嵌人一段 iavascript 代码,该代码的作用就是向统计分析服务器发送各种统计数据,包括访问者的各种信息。在服务器端一般具有处理程序来实时存储和处理 iavascfipt代理程序发送过来的数据。大多数分析系统都是采用数据库来存储流量计数据使用 Web的方式向网站管理者提供网站运行 报告,形成一整套流量分析系统平台(如图 1)。 图 1 流量统计平台工作原理图 脚本嵌入法具有很多优点,同时也有不足之处。它的优点有: Web 页面 Cookie 统计服务器 Cookie 读取 SQL 处理 数据库 4 ( 1)数据全面 ( 2)实时远程查看 ( 3)数据管理方便 7 缺点有: (1)嵌入

8、的 js 脚本可能会增加一部分 Web 服务器负担。 (2)要有一台专门做分析服务的服务器,增加运营成本。 1 第二种是日志分析,它是网站流量分析最简易、最普遍的方法之一,日志分析的方式仅仅需要对日志文件内容进 行数据挖掘工作。所以不受时间地点的限制也不会对服务器的稳定运行造成任何影响。目前有众多日志分析软件能够提供 Web 流量的数据挖掘和分析工作。比较著名的有: Webtrends、 AWStats、 Webalizer。不过日志分析方式也存在着一些不足:首先,日志分析仅仅局限于对 Web 服务器软件提供的 Web 运行日志文件进行分析,尽管可以通过日志配置的方式来增加一些重要的数据指标但

9、 Web 服务器日志提供的数据指标项目毕竟有限,使得在用户访问细节方面很难深入,通常都只是对现有数据进行简单的汇总这种模式化的分析结果难以与网 络营销策略结合起来。第二,对于大型网站来讲,日志分析并不方便。可能会耗费分析机的大量 CPU 资源数据汇总的速度也受到 13 志文件大小的影响。长期数据汇总的结果还要占用大量硬盘空间。第三 13 志分析难以实现实时的分析,网站管理员必须把日志数据下载到另外一台分析服务器上进行分析,这样数据的时效性受到了一定的影响。 综合 2 种方式以及各种因素,考虑到实际需求对统计结果并非要求即时得出,日志分析的方式成为我们的首选。 假设读者使用 Windows 的

10、IIS 架设网站。下面具体分析日志文件的内部结构。图列出了某 网站某天的 13 志文件的前若干行。其中前 3 行标明了 IIS 的版本及记录 13 志的时间,第4 行列出了要记录的内容的表头字段,比如日期 (date)、时间 (time)、网站名 (s sitename)、用户 IP(c ip)等,这前 4 行都以“ #”开头。暂且称做标题行。随后的行则是每次访问的具体记录内容,不以“ #”号开头暂且称为内容行。 IIS 引擎每隔一段时间会重复生成标题行,然后再生成内容行。对于统计来说。最主要的信息莫过于用户 IP 也就是 (c ip)项了,程序的目标就是从网站日志中抽取出这些 IP 信息进行

11、统计分析。 5 图 2 IIS 日志文件结构 了解 IIS 日志的基本情况后。为了统计的方便,可以做这样的设定:一个用户访问网站时会在较短的时间内依次打开网站的多个页面把这样的一系列行为定义为对网站的一次访问,也就是说,在日志文件中,对连续的若干结果行来说,如果 c ip 项为同一 IP,那么计为对网站的一次访问,当发现一个与上一结果行不同的 c ip 项时,则计为对网站的一次新访问。程序依此读入从 N 天前到统计日前一天的所有日志文件,最后得到每天的【 IP】一【访问次数】的对应表 ,标识出每天某个 IP 访问了网站多少次。根据对 IIS El 志文件的命名规则和对其内容的分析。可以得到统计

12、某一天内网站访问情况的程序算法如下述步骤所示: (1)根据日期生成该天的日志文件名 exyymmdd (2)按行读取该文件的下一行,直到读到文件末尾,分析结束。 (3)判断该行是否以“ #”开头,如是,则不用分析该行,直接返回步骤 (2),如否,则进入步骤 (4)。 (4)抽取该行的用户 ip(c ip)项,与上一行的 e-ip 项比较,如果是同一 IP 则不再分析该行,转步骤 (2),如是不同的 IP,则进入步骤 (5)。 (5)在已记录的 IP 中查找该 IP,如果找到,将该 IP 的访问计数加 1;如没有找到,则新6 生成该 IP 的记录,并将其访问计数设置成 l。转步骤 (2)。 最后

13、用 C#实现上文描述的算法,并将得到的结果以表格的形式输出成一个 HTML 文件 8 9 10 六、总结 随着信息化进程的不断推进,互联网也为企业的产品展示和技术推广提供了更加广阔便捷的沟通平台。如何从网页浏览的数据信息中分离出为网站管理者所用的访客信息也成为了网站建设过程中考虑的重要问题之一。所以了解网站流量统计与分析很有必 要,而掌握网站的访问统计实现方式对以后个人发展很有好处。 参考文献 1 赵佩峰 .基于 .Net 的网站访问统计系统的设计 J.中国科技信息 ,2006.( 7): 212. 2 姜旭平 .网络营销 M.北京:清华大学出版社 ,2003 5 焦蓉梅浅谈网站流量统计分析法 J科技信息, 2007, (6): 518 6 蔡巍,王飞龙政务网站的性能测试与流量分析 J厦门大学学报, 2004, v01 43(增刊 ): 336 339 7 李耸, 房明 . 基于 Web 的网站流量统计系统的设计 J.电 脑知识与技术, 2008,1(5):875 8 李斌 . 巧用 S 日志实现网站访问统计功能 J.电脑编程技巧与维护, 2010, (5): 8 9 黄嘉辉 C# NET 网络程序设计 M北京:科学出版社 2004. 10 Tom Archer C#技术内幕 M北京:清华大学出版社 2002.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 文献综述

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。