找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 884|回复: 2

[软文] 巧用EXCEL数据**表分析IIS日志

[复制链接]
发表于 2012-8-22 11:29:10 | 显示全部楼层 |阅读模式 来自 中国–辽宁–大连
本帖最后由 完美晓宇 于 2013-5-17 15:33 编辑

下面说个比较简单且非常实用的方法,通过EXCEL的一些简单的公式做出想得到的一系列数据,例如时间间隔,爬行页面,返回状态码,网址参数,蜘蛛类型,蜘蛛 IP 等,通过以上数据可 以进行对网站的问题的排查,更正。
首先必须有自己的 服务器 或者能够查看IIS日志的权限,通过 FTP 将iis日志文件从空间中 下载 到本地服务器获取IIS日志的方式:打开IIS,点击要查询网站>右键>属性>网站选项卡>属性>即可看到如图 如果是空间的话有些空间服务上会将日志文件放在网站根目录的。如果没有的话可以向服务商索取。
然后根据路径进行查找相应的文件夹然,可以看到文件夹下有很多.log文件就是日志文件,然后通过FTP下载到本地。
如果文件过大操作起来可能不方面,可以使用UltraEdit打开,筛查你想得到的数据(具体自己下载一个研究下)。文件不是很大可以使用记事本直接打开后复制到EXCEL。
然后将前4行删除,选择A列,点击excel数据>分列>分割符号
1 2 下一页
下一步>其他>输入空格>下一步>完成。这样第一步就完成了。
然后选择A1列>右键>插入 然后将C,D,E,I列删除。在第一行分别输入:日期,时间, 网页 ,参数,端口,IP,蜘蛛,状态码 另外说明一下参数,参数这个是动态网页面问号(?)后面的部分。 http ://www.***.org/jiaju/chufang /5309_3. html 这个路径后面的参数值为3,那么组合之后真是的URL就是http://www.***.org/jiaju/chufang /5309_3. html ?3 因此说明蜘蛛还是可以分辨参数的,有些网站投放广告后面经常都会带上参数进行统计,但经过抓取后参数都会被去除的。所以尽量不要在内容页使用此类的URL。
选中G列>数据>筛选>点击G列箭头>文本筛选>包含
输入baidupider 点击确定。即可看到所有百度蜘蛛访问的数据,这样的话大致的数据已经呈现出来了,如果查看 google 在筛选时候输入googlebot就可以了。随后制作一个简单的数据**表便于分析。 一次顺序:插入>数据**表>数据**表>确定 在右侧按先后顺序勾选网页,蜘蛛,时间。然后点击蜘蛛后面的小三角,
点击标签筛选>包含>输入baidupider。既可以筛选出最终要看的网页的spider爬行时间详细数据,当然可以按照其他组合进行筛选各类数据,就不演示了。






发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

发表于 2012-8-22 13:07:02 | 显示全部楼层 来自 中国–上海–上海
楼主有才   还可以这样分析啊 不错不错

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

发表于 2012-8-22 13:52:57 | 显示全部楼层 来自 中国–广东–中山
还可以这样分析啊

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

▶专业解决各类DiscuzX疑难杂症、discuz版本升级 、网站搬家 和 云服务器销售!▶有偿服务QQ 860855665 更多精品应用
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )|网站地图

GMT+8, 2026-1-19 03:35 , Processed in 0.039902 second(s), 13 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表