|
|
有些企业和网站对一些网站陷阱不了解,在做网站时总是坚持自己的一些想法,为了美观或者一些其他的原因来做网站设计。其实有些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。今天就和大家讨论一下一些必须要避免的不利于蜘蛛爬行的蜘蛛陷阱。
1.Flash
有的网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎抓取的HTML代码只有一个连向Flash文件的链接,没有其他文字内容。搜索引擎是无法读取Flash文件中的文字内容和链接的。这种文字整个就是一个Flash网站,可能视觉效果做得精彩异常,可惜搜索引擎看不到,不能索引出任何文字信息,也就无从判断相关性。
有的网站喜欢在首页放一个Flash动画片头(Flash Intro),用户访问网站看完片头后被转向到真正的HTML版本的文字网站首页。搜索引擎不能读取Flash,一般也没办法从Flash Intro跟踪到HTML版本页面。
2.Session ID
有些网站使用Session ID(会话ID)跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的用户,URL中会加上一个不同的Session ID,这样搜索引擎每次来访问时所得到的同一个页面的URL将不一样,后面带着一个不一样的Session ID。这也算最常见的蜘蛛陷阱之一。
3.各种跳转
搜索引擎对很多形式的跳转都比较敏感,如302转向、JavaScript跳转、Flash跳转、Meta Refresh跳转。
有些网站研究访问首页时会被自动转向到某个目录下的页面。如果是按用户地理位置转向至最合适的目录,那倒情有可原。但大部分这种首页转向看不出任何理由和目的,这样的转向能避免则避免。
4.框架结构
使用框架结构设计页面,在网站诞生初期曾经挺流行,因为对网站的页面更新维护有一定方便性。不过现在的网站已经很少使用框架了,不利于搜索引擎抓取是框架越来越不流行的重要原因之一。
5.动态URL
动态URL指的是数据库驱动的网站所生产的、带有问话、等号及参数的网址。一般来说动态URL不利于搜索引擎蜘蛛爬行,应该尽量避免。
6.JavaScript链接
由于JavaScript可以创造出很多吸引人的视觉效果,有效网站喜欢使用JavaScript脚本生产导航系统。这也是比较严重的蜘蛛陷阱之一。
7.要求登录
有些网站内容放在需要用户登录之后才能看到的会员区域,这部分内容搜索引擎无关看到。蜘蛛不能填写用户名、密码,也不会注册。
8.强制使用Cookies
有些网站为了实现某种功能,如记住用户登录信息、跟踪用户访问路径等,强制用户使用Cookies,用户浏览器如果没有启用Cookies,页面显示不正常。搜索引擎站长就相当于一个禁用了Cookies的浏览器,强制使用Cookies只能造成搜索引擎站长无法正常访问。
通过一起进行讨论,为了企业网站便于搜索引擎收录,在做企业网站时,有些格式,某些形式该避免的就避免,以达到进行网站优化的最终的目的,获得排名。
|
|