找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 440|回复: 0

[软文] 网站的优化中要学会用好robots文件

[复制链接]
发表于 2020-7-10 16:59:51 | 显示全部楼层 |阅读模式 来自 中国–江苏–徐州–新沂市
网站的优化中要学会用好robots文件
搜索引擎蜘蛛在访问网站之前,都会先访问网站根目录下的robots.txt文件。搜索引擎蜘蛛不会去抓取robots.txt文件中禁止爬行的文件或目录。

robots.txt是搜索引擎爬取协议,也就是说你可以通过这个文件告诉搜索引擎,哪些目录不要爬去,一个友情链接出售网站的源码中包含了很多系统文件,而这些文件是不需要展示给用户看的,自然也不需要展示给搜索引擎看,如果你不进行引导,会让搜索引擎的蜘蛛把精力浪费在那些系统文件上,造成资源浪费。

当网站有些页面不希望被引擎抓取到,避免不必要的流量浪费,就可以通过robot.txt文件来完成。只要在该文件下输入相关代码,便可以指定哪些页面可以抓取哪些页面不可以抓取。这也是一种优化URL结果的方法。

只针对于用户的页面,对于搜索引擎来说没有价值的页面,比如一些咨询的页面,注册的页面网站推广外链等等,这些页面收不收录对于排名没有任何影响,我们可以用robots.txt文件进行屏蔽。

有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还可以采取直接屏蔽图片后缀名的方式。

死链过多,对查找引擎优化来说,是丧命的。不能不导致站长的高度注重。在网站的开展过程中,目录的删去和调整是不可避免的,若是你的网站当时目录不存在了,那有必要对此目录进行robots屏蔽,并回来正确的404过错页面。

写robots.txt要注意的地方:
1. 第一个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。
2. 斜杠:/ 代表整个网站
3. 如果“/”后面多了一个空格,则屏蔽整个网站
4. 不要禁止正常的内容
5. 生效时间是几天到两个月

有一个误解是:你必须制定一个robots标签。实际上:robots指定了索引与跟踪链接两项权限,如果你不写robots标签,那么就会默认为,允许搜索引擎索引该页面与跟踪该页面链接。只有当你需要改变两项权限其中的一项时,才十分有必要去添加。


发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

▶专业解决各类DiscuzX疑难杂症、discuz版本升级 、网站搬家 和 云服务器销售!▶有偿服务QQ 860855665 更多精品应用
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )|网站地图

GMT+8, 2026-3-12 01:47 , Processed in 0.037557 second(s), 15 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表