|
搜索引擎是指由蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经由预处理,用在搜索输入枢纽词后,搜索引擎排序程序从数据库中挑选出符合搜索枢纽词要求的页面。蜘蛛的爬行、页面的收录及排序都是自动处理。
一.爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。
蜘蛛是搜索引擎用来爬行和访问页面的程序,它会跟踪页面上的链接,从一个页面爬到下一个页面,因为带宽资源、时间的限制,蜘蛛不会也不可能爬完每一个页面。SEOer要想让更多页面被收录,就要想方想法吸引蜘蛛。
可以通过以下几种方式吸引蜘蛛的关注:青岛早教中央、
1.进步网站权重:权重越高,网站上的页面被抓取的深度也会越深,因此将有更多页面被收录
2.页面更新度:常常更新,蜘蛛会更频繁的访问
3.外链:增加曝光机会
4.与首页点击的间隔:离首页越近,被蜘蛛爬行的机率越高?
二.预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
三.排名:用户输入枢纽词后,排名程序调用索引库数据,计算相关性,然后按一定格局天生搜索结果页面。
计算相关性是排名过程中最重要的一步,影响相关性的因素包括:
1. 枢纽词常用程度
2. 词频及密度
3. 枢纽词位置及形式
4. 枢纽词位置
5. 链接分析及页面权重?
在整个搜索引擎的工作原理中,权重、收录、相关性、更新这个几个词泛起的频率会比较高。那么它们之间到底是怎么的联系呢??
权重的作用:权重意味着权势巨子度高、内容可靠,获得更好的排名,紧密亲密的相关性。两个与产品紧密亲密相关的网站,会由于权重不同而进行排序,权重高天然会更受正视,获得较好的排名。?
了解搜索擎蜘蛛的爬行原理,尽量使蜘蛛抓得快而全面。让搜索引擎收录充分,才能带大量长尾枢纽词,使得网站得到更多的流量。?
更新:现在的搜索引擎技术可以在几天之内更新更要的内容,权重高的网站上的新页面可以在几个小时甚至几分钟内就会被收录。权重低的网站的新页面可能几个月都不被收录更新。?
|
|