|
蜘蛛,机器人和爬虫是你的朋友。假如要进行SEO,你不只需要喜欢它们,同时你真的需要特地地把它们吸引到你的网站上来。
SEO中,蜘蛛,机器人和爬虫大体上讲的是统一种东西,但是别过分担忧--它们都没有腿和触角。所以,让我们同一用“爬虫”这个词来称呼它们。请牢记,有时你需要吸引这些机器人,或者把你的网站伪装成“蜘蛛诱饵”。这都属于统一个原则。
那么,什么是爬虫,为什么我们要把它请到我的网站上来呢?
爬虫是一种程序,或者是一段自动化的脚本,它在网上不停辛勤奔跑到各个URL上去。爬虫通过它们浏览的网页上面的链接从一个URL爬到另一个URL
当然,网页会变化。有时,网页和网站的变化周期非常短。除此之外,新的网站和网页随时都在快速泛起。这也是为什么爬虫始终都在那里不停的爬行,一遍又一遍的浏览网页,并且建立和更新搜索引擎的索引信息。
搜索引擎引库里面的内容是爬虫浏览网页时看到的内容。爬虫所看到的内容可能和一般的访问者看到的大相径庭。假如你想查看爬虫看到的某个网页的内容是什么,你可以使用IE浏览器来访问它,然后按下全选,并浏览复制下来的内容。或者,你可以借助baidu,点击搜索结果下面的“网页快照”链接,就可以看到爬虫最近对这个网页做的快照了。
首先也是最重要的一点是,爬虫将它们爬过的每个页面的字和词组合起来。它们索引文本和链接。当你在搜索框中输入一个搜索词时,搜索引擎尽量精确地找出和搜索词组最匹配的网页。
所以,任何SEO工作的第一步的重要部门都是让爬虫更轻易发现和爬行你的网站。假如你的网站没有被爬虫爬过,它们也就不会建立关于你的网站的搜索引擎索引。假如网页没有在索引当中,搜索者也不会在搜索引擎中找到它,认为搜索引擎以为哪个页面根本就不存在。
|
|