找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 494|回复: 0

[杂谈] 共享百度蜘蛛捉取原理

[复制链接]
发表于 2013-1-3 16:07:33 | 显示全部楼层 |阅读模式 来自 中国–四川–成都
      先来介绍一下百度收录吧。网站中包含了许许多多的网页吧,在网络上“有贡献”的页面,就会被百度收录了,收录的是它的网络地址而已,被百度收录了,假如收 录的威望很多,那你有可能出现在百度搜索的头条上,而头条永远是备受关注的,正因为这个位置谁都想争,随之便产生了SEO(搜索引擎优化)了。

  百度蜘蛛捉取“就用到这个东东了。再跟大家说一下“百度蜘蛛”吧,当然不是我们日常所见的真实蜘蛛了,简单来说它是一个计算机程序代码,爬行的过程就 是实现算法的过程(至于说法,不能简单地理解为日常的算术过程吧,它的意义相当于一个活动的策划流程方案),最近好像百度更改了搜索算法吧,但具体怎么改 还是让大家慢慢去了解的吧。

  一般情况下网页抓取抓到40%是属于正常范围了,60%算很好的,100%是不可能的,当然抓取的越多越好啦。我在学习了解的过程中,偶遇了一篇介绍 蜘蛛爬行的安全性的文章哇,里面介绍到了百度蜘蛛一般会优先选择遍历那些网站的,会自动躲开那些网络漏洞的,免得自己陷进去嘛,这个挺吸引我的,弱弱记得 这篇文章里介绍说的:优先游静态网站,因为**站里可能存在死循环吧,这样蜘蛛进去就出不来了啦,不过一般蜘蛛搜索的过程会先检测网站的安全性,发现这 些毁灭性的动作时,就会避开。我想这点值得大家考虑一下在建立**站的过程中,一定要严谨自己的程序代码,免得造成网站漏洞啦,好了说完了。。

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-11-22 20:40 , Processed in 0.041929 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表