|
学习网站日志分析,首先简单地从基础概念开始,然后了解工作原理,再来进行简单的分析。
网站日志是什么
(纠结,是不是应该称服务器日志)网站日志是什么?简单通俗一点,就是记录网站上的哪些页面在哪个时间段被哪个用户访问的日志。分析网站日志是网站分析的基础,虽然现在网站分析工具很多,但网站日志分析还是要好好学习。
网站日志的原理
网站用户在自己的电脑上打开浏览器进行访问我们的网站,通过浏览器访问网站一个页面,网站服务器接收到用户发出来的请求,根据这个请求做出相应的结果传输到用户的浏览器端,再由浏览器进行重新地展示给用户。那么这个过程就被网站的服务器记录在网站日志中。网站服务器会给每个访问网站用户的浏览器上带有一个独立ID号的cookie(对cookie有兴趣的,可以在自己的IE浏览器上装个HttpWatch插件进行跟踪自己浏览器上的cookie信息),那么服务器通过独立ID号的cookie来判断是否是同一个访问者。
网站日志分析
服务器日志上记录很多用户行为的字段(具体字段名请查看:网站日志字段详情)
下面使用一条日志来简单的进行解读:
图片地址:http://s8.sinaimg.cn/orignal/9aafbf4btc7c91f44a137&690
在2012年4月19日下午16点03分01秒,ip地址是123.125.71.81的百度蜘蛛成功抓取了网站robots文件,花了15毫秒下载了网站robots文件574b字节数。
网站日志解读就是这么简单!
网站日志缺点
根据网站日志的原理可知,网站日志记录的是网站服务器上进行的一系列行为,那么假如用户的请求没有经过服务器的话,服务器日志就不会记录到这条记录了。所以网站日志的第一个缺点就是:
1、用户访问缓存页面的时候,服务器日志是记录不到此次访问的数据的。
什么是缓存页面?有时候没连上网还是能打开一些页面,比如:之前SEO研究中心的SEO培训论坛经常被受到攻击打不开,经常使用我们论坛的用户会发现论坛的首页还是可以打开的。这就是因为我们电脑的浏览器会储存网站页面的缓存内容,这样就减少了对服务器的压力,不需要每一次访问都要从服务器上下载页面。
但是打开这种缓存页面的话,是并不经过网站的服务器的,所以在网站日志中是记录不到这种访问数据。
2、网站日志中记录访问者的数据太少
在日志中,我们只能都看见访问者的ip地址,这对于研究网站流量细分化,是有很大的局限。
3、网站日志原始数据繁琐
对于中小型的网站来说,网站日志的大小还是能够接受的,但是稍微大点的网站,那么网站日志往往会达到几百兆甚至1G之多,对于这种超级网站日志来说,进行数据的统计、分类整理、分析的话,这个工作量就是非常大了。
来源:www.hagdjy.com www.sqkcjz.com www.zimoshuijing.com www.china-moban.net 站长推荐!
|
|