找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 711|回复: 0

[转载] 网站日志分析需从哪些方面入手?

[复制链接]
发表于 2013-1-26 15:49:40 | 显示全部楼层 |阅读模式 来自 中国–四川–成都
  (一)蜘蛛访问的次数、停留时间以及抓取的数量。
  从小标题中的三个小编提到的数据我们可以了解到下面几点信息:
  1、平均每次抓取页面数=总抓取量/访问次数
  2、单页抓取停留=每次停留/每次抓取
  3、平均每次停留时间=总停留时间/访问次数
  以上三点载自百度百科。
  从这些数据中我们可以很好的看出百度蜘蛛在我们网站上的活跃度、是否亲和,以及我们网站内容抓取的深度等等有效的数据。当我们网站中总的访问频次、蜘 蛛停留的时间,以及网站抓取程度的是否高,从这些都是可以看出我们网站是否受到蜘蛛的喜爱。并且在我们单页面的蜘蛛停留时间的长短也可以看出我们的文章页 面是否受蜘蛛的喜爱。
  小提示:如果你想要长期发展一个网站的话,小编建议各位定期的整理出网站数据报表,这样对我们网站的发展也会有着很好的帮助。
  (二)网站目录蜘蛛抓取的统计。
  通过网站日志的分析,可以很好的看出我们的哪些目录比较受蜘蛛的喜爱,蜘蛛经常抓取收录,并且给予的排名权重状况。并且我们可以通过这些数据能够发现 很多问题,对于我们想要突出的栏目可以通过内部结构来进行指向,从而有效的增加栏目的权重和蜘蛛抓取的程度。对于那些我们不希望蜘蛛抓取的页面,也可以进 行屏蔽。
  (三)网站页面的抓取。
  通过日常的日志分析统计中,我们可以看出哪些网站页面比较受蜘蛛的喜爱,并且可以了解到蜘蛛在这些页面的抓取行为,例如说蜘蛛是否抓取了一些没有被收 录价值的页面,或者重复的抓取了一些页面等,大家都知道这样会影响到我们网站其他页面的权重传递的。就比如说小编的网站皮肤栏目通常就要比名字栏目抓取的 勤快,收录健康程度也较好,所以小编现在定期在名字栏目的文章中添加进入一些图片,不仅仅美观还有效的提升了名字栏目文章的收录,所以通过分析,我们可以 屏蔽蜘蛛抓取这些没有价值的页面,也有效的提高了我们其他页面权重的传递,并且学习蜘蛛比较喜爱的页面优点来补充其他页面的不足。
  (四)了解蜘蛛是否访问我们的页面以及访问页面的状态代码。
  很多朋友的网站主页快照经常不正常,网站发布的文章也经常不收录,面对这样的情况我们都会想蜘蛛有没有到我们的网站抓取。这时候我们也可以通过网站日 志来看是否有蜘蛛IP的记录就可以了解蜘蛛是否来爬行我们的网站,从而判断是否是我们网站质量的原因导致不收录。并且也可以看出蜘蛛访问我们网站页面的状 态代码,例如说301、503、403等,当出现这样情况的时候,我们尽早做处理,以免成为网站降权的隐患。
  (五)了解蜘蛛抓取的时间段。
  通过日常日志分析总结中,你会很奇妙的发现一件事,那就是蜘蛛会在每天的一个特定时间内在网站爬行抓取的很活跃,当我们了解到这样的情况,我们就可以再特定的时间去更新网站内容,这个可以更加有效的让蜘蛛抓取我们网站内容,从而达到一个秒收的效果。
  总结:如果一个网站想要长久发展的话,站长们一定要学会分析网站日志,从而了解网站每天的健康状况,并且发现异常情况的时候即使改正,这样不仅仅对网 站有很大的帮助,还有效的防止网站因为这些异常引发的降权、被K等现象。

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-11-18 20:01 , Processed in 0.042336 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表