找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 3418|回复: 1

[分享] 网站日志分析:不同ip段的百度蜘蛛,各有什么含义

[复制链接]
发表于 2013-8-5 11:53:48 | 显示全部楼层 |阅读模式 来自 中国–河南–鹤壁
第一、   小编从服务器上面下载了8-2网站日志
第二、   打开网站日志



    通过上图,我们可以看出,这里面很乱看得有点累,而且很难分析到底有哪些ip访问了我们的站点,哪些页面被蜘蛛捉取了。竟然很乱,那么我们可以简单的处理,让难变易。小编这里是通过txt格式转换成xls。这样我们就可以一行一列的进行分析。转换后,我们可以通过案列进行分列,这样就可以一列一列的详细的按规律来显示出来。


    通过上图,我们就可以清晰明了的分析客户ip来源了,具体哪些文章页面、哪个栏目被收录,我们都可以一眼明了,甚至还可也看出网站被爬取的状态。但从这里还是不能清晰的汇总出到底有哪几个ip段访问我们的站点。至此,我们还要通过execl的数据筛选功能进行ip段类似的进行汇总,例如,220.181.108.121和220.181.108.78等c段之前都是一样的话,那么我们就可以通过c段相同的汇总在一起。具体操作,选择数据-自动筛选-自定义-包含-填写要归类一起的ip段。


    从这里,我们就可以直接的看出有哪些ip类型访问了我们的站点,那么我们就要了解这些ip类型是好还是坏。
作为站长要知道哪些ip段是好,哪些ip段是不好,这样就可以尽量的避免站点问题的持续衍生下去。通常的ip段解读
一 220.181.108.*ip段的百度蜘蛛(提权蜘蛛):
这个ip段访问你的站点,那么说明你的站点目前很健康,一天访问次数越多,说明百度蜘蛛对你的站点非常的友好。一经抓取的页面,被释放的时间非常短。
二 123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛):
这个ip段访问你的站点,那么说明你的文章质量不高,伪原创或者采集的相对比较高。虽然抓取了,可不会立马释放,释放时间比较久。出现越多者不好吧!
三 123.125.68.*ip段的百度蜘蛛(考察蜘蛛):
这ip段访问你的站点,一般是对于新站比较频繁,这ip段是考核蜘蛛,若对于老站经常出现这ip段的话,那么你的站点就有可能被降权,出现这情况,因立马对站点做修正处理。
四 117.28.255.*ip段的百度蜘蛛(假冒蜘蛛):
这只其实是一只假的百度蜘蛛,至于他是什么蜘蛛我们也无从得知.。但我们有一个方法可以判断真假百度蜘蛛:
点击桌面的“开始”图标-在搜索栏输入“CMD”-输入“nslookup”,

    输入后点击确定,然后再功能框里面输入ip地址,ip地址只能手动输入,不能黏贴。
    出现下图所示为真实百度蜘蛛:

    出现下图所示为真实冒牌蜘蛛:


    从上两图我们可以看出如果该ip地址是真的百度蜘蛛的话,那该就会显示“baidu”标识,如果没有看到“baidu”字样的服务器名就是假的百度ip。
五 222.77.187.* ip段的百度蜘蛛:
这个ip段访问,说明你经常使用chinaz工具,这个ip段是chinaz模拟百度蜘蛛来访问我们站点的结果。
网站日志分析,是作为一个站长每天必做的事情,对网站日志的分析要十二分的重视,切勿爱分析分析一下,不爱分析就都不管了。分析网站日志是一个站点长远发展的必经之路。

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

发表于 2013-8-5 11:58:56 | 显示全部楼层 来自 中国–四川–成都
文章开始的时候说:“通过上图,我们可以看出” 可是没看到图

评分

参与人数 1金币 +5 收起 理由
抢楼评分专号 + 5 很幸运,你获得了抢楼奖励!

查看全部评分

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2025-1-12 03:02 , Processed in 0.047380 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表