找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 381|回复: 1

[杂谈] 百度和谷歌蜘蛛爬行有什么规律

[复制链接]
发表于 2015-2-7 16:33:14 | 显示全部楼层 |阅读模式 来自 中国–河北–石家庄–辛集市
蜘蛛是搜索引擎为抓取网站页面研发的一个程序,当前,最受大家欢迎的搜索引擎莫过于百度与Google了,我们对网站进行日常维护、优化时,经常要关注网站的收录量,因为收录的多寡会对关键词的排名产生一定影响,而收录页面的数量则要依靠蜘蛛爬行来完成。蜘蛛爬行有什么规律呢?
蜘蛛进入一个网站不会将这里的首页内页、内容页等“边边角角”一次爬行完毕,而更喜欢分阶段进行,每个时间段可能爬行的页面不见得相同,但有一点是没问题的,即:每次都会从首页作为“起爬线”。然后计算出每次在网站的活动时间以及逗留的长短。
如果我们手上是刚上线的新站,需要过一段时间才能被收录。因为,搜索引擎要经过反复的计算、“权衡”,确认页面有收录的必要,然后网页才会被慢慢被放出来。一般情况下,新站的快照、收录页面会晚一个星期才会被放出来。
那是不是域名时间越长,越受搜索引擎的“待见”呢?
确实如此,只要网站不存在过度优化、死链较多等情形。有不少网站刚把首页做完,就匆忙上线,这样一来,首页上的很多链接都是死链,蜘蛛从首页往内页爬的时候吃了“闭门羹”,就像是朋友每次都来登门拜访,却被我们拒之门外,势必引起对方的反感,时间一久,搜索引擎可能会放弃爬行。
通常来说,一个网站成功上线,百度、Google会给它3~6个月的考核期,顺利通过考核之后,搜索引擎就会认定这是一个长期的网站,这时,网站开始步入了一个稳定期,蜘蛛也会不时来光顾一下。
还有这么一种情况,比如:
古玩网(),编辑每天都坚持更新文章,由于程序的原因,后来添加的文章不能在首页自动更新,也就是说,首页的栏目显示的依然是最早更新的那些文章的标题、更新时间。
首页的内容是“死”的、无法自动更新,这么一来,百度蜘蛛通常会认定为该网站没有更新而放弃去内页爬行,结果该网站的收录迟迟不见涨,快照也非常滞后,比如:首页显示的最新的那篇文章是2013年3月16日,快照也是这个日期。
因此,我们的网站每天更新之后一定要生成首页,像上面这个网站的情况,最好找技术人员进行调整,使得首页能够自动更新,让百度知道它没有白来。
值得强调的是,Google显然更有耐性,即使出现了以上这种情况,还是会从不自觉的从首页往内页爬,这也是我们经常会看到很多网站的Google收录多于百度的一大因素。
做好网站优化,一定要懂得如何与搜索引擎更好的相处。SEO是围绕搜索引擎展开的,因此,在人家地盘儿上混,得按人家的规矩来。
本文信息来源免费发布信息网 http://www.nei-mao.com/


发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

发表于 2015-2-9 10:42:36 | 显示全部楼层 来自 中国–四川–德阳
顶起来,有点复杂需要慢慢消化.......

评分

参与人数 1金币 +3 收起 理由
抢楼评分专号 + 3 很幸运,你获得了抢楼奖励!

查看全部评分

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

▶专业解决各类DiscuzX疑难杂症、discuz版本升级 、网站搬家 和 云服务器销售!▶有偿服务QQ 860855665 更多精品应用
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2025-2-4 10:39 , Processed in 0.053243 second(s), 12 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表