找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1178|回复: 2

[软文] 网站频繁出现304状态码及抓取蜘蛛次数较少的原因分析

  [复制链接]
发表于 2013-6-20 11:02:03 | 显示全部楼层 |阅读模式 来自 江苏省苏州市

碰到蜘蛛抓取返回码老是304状态,且抓取的次数越来越少的问题。搜索引擎为了自身的用户体验,会想尽办法来提高检索调

用率、准确性、新鲜度,这将导致引擎不得不把主要的精力放在拥有优质内容源的网站上。惟其如此,搜索结果的质量才能更

加符合搜索者的体验。

由此我们联想到:搜索引擎爬虫会更加青睐内容源更新频繁的网站。通过特定时间内对网站抓取返回的状态码来调节对该网站

的抓取频繁。若网站在一定时间内一直处于[304:没有变化]的状态,那么引擎爬虫可能会降低对网站的抓取次数。相反,若网

站变化的频率非常之快,每次抓取都能获取新版本,那么日积月累,爬虫的回访率也会提高。

无论是抓取少还是304,这都是一种现象,并不是问题的原因,假设网站返回的都是200,就能达到提升排名带来流量的目的么

?相比之下更应该思考产生304的原因是什么?改304对网站目标能够有什么样的效果?不能忽视整体的目标而强调过程的细节

,为了200而去解决304。

304状态是如何产生?

服务器为了提高网站访问速度,对之前访问的部分页面制定缓存机制,当客户端在此对这些页面进行请求,服务器会根据缓存

内容判断页面与之前是否相同,若相同便直接返回304,此时客户端调用缓存内容,不必进行二次下载,可以说304从某种角度

起到了减少服务器带宽并提高蜘蛛爬行效率的作用。

304状态产生原因?

1、页面更新周期长或不更新
2、纯静态页面或强制生成静态html

304状态处理思路?

1、先对产生304页面进行细分,到底是哪类页面返回了304?这些页面是否应该返回304?
2这些页面生成的方式是怎样的?是否有更新机制?更新机制是否符合蜘蛛对网站的抓取频率?
3、页面更新区域的位置是否合理?是否位于该页面主要内容的承载区域?

也对此情况做了分析:

304状态码出现过多会造成以下问题:

1、网站快照停止
2、收录减少
3、权重下降

那么如何减少304返回码呢?

据我所知,首先内容更新方面要迎合百度蜘蛛,分析日志,把蜘蛛到访的时间记录下来,可以大致得出蜘蛛到访的频率,然后

以此为依据,更新文章:一定是原创+转载,不能纯采集。转载也需要最新最好的优质资源。让蜘蛛这个点过来能有吃的。从

而返回更多 200 正常码。

其次呢,最好增加个互动版块,现在大网站基本已经都做了这方面,比如评论、留言等,大网站更新起来变化可能会很小,但

是有了这些互动,用户会在上面发些内容,网站会有很多新的东西。就会把最新回复以及问题放在重要位置。

评分

参与人数 1金币 -75 收起 理由
天外飘仙 -75 非探讨性质

查看全部评分

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

发表于 2013-6-20 15:21:16 | 显示全部楼层 来自 四川省成都市
学习了,楼主分享的真好

评分

参与人数 1金币 +5 收起 理由
抢楼评分专号 + 5 很幸运,你获得了抢楼奖励!

查看全部评分

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

发表于 2013-6-20 21:03:16 | 显示全部楼层 来自 江苏省
享的真好

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-5-5 01:12 , Processed in 0.062396 second(s), 16 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表