|
发表于 2012-11-22 15:17:09
|
显示全部楼层
|阅读模式
来自 中国–辽宁–大连
首先一个站点内页要被搜索引挚收录,首先需要蜘蛛可以爬行到这些页面才能完成索引工作。那么对于站点只收录了首页,如果不是被K或被降权的话,那就是内页不利于蜘蛛爬行的问题了。比如内页存在过多的图片、FLASH或者是内页中的大部分版块都是利用JS代码来调用的,亦或者是内页大部分都是调用其他站点的内容,如此一来,自然蜘蛛也不会抓取到这些内容了。还有如果内页的代码过于冗余,如多余的空格、回车符、重复的DIV标签、JS代码溢出等等,这些都是让蜘蛛无法完整爬行内页的影响因素。所以,在站点只收录首页而不收录内页时,咱们需要好好检查一下内页是否利于蜘蛛爬行,可以通过相关工具进行蜘蛛爬行模拟来测试页面是否利于蜘蛛爬行。
其次站点的无效链接不但是导致站点只被收录首页的祸首,同时也会让站点对搜索引挚的友好形象越来越“坏”。当蜘蛛爬行进入站点时,它需要网站内部所有的超链接可正常访问才能正常抓取所爬行经过的页面内容。那么当蜘蛛爬行到站点的某个无效链接时,因为这些链接所指向的页面根本无内容可取,甚至是打不开页面,自然而然蜘蛛也就无法做到正常的去爬行下去了。毕竟无效链接很容易让蜘蛛爬行进入死胡同。因此如果站点内部无效链接过多时,那么站点只收录首页的原因可能就在于此了,使用301重定向和404错误页面引导,让蜘蛛即使爬行到无效链接时也一样可以顺畅的继续深入转向别的页面,这样才不会因为无效链接而影响到站点页面不被爬行进而不被收录。所以说,在站点上线一段时间还只被收录了首页的时候,站长需要做的一个工作就是检查自己站点是否存在无效链接,能否用最快的时间把这些无效链接通通都做好屏蔽、引导的处理。
最后内容是一个网站的灵魂和根基,是站点收录多少的决定性因素。当你的站点内容全部都是采集又采集而来的内容时,你还想收录有多高呢?一般而言,站点内页不被收录的原因其实是很多站长都知道的,那就是内容被搜索引挚判为质量低,对用户产生的价值无。一般新站如果上线之后站点内容来源主要是通过采集而来的,这样的内容毕竟在网络上存在的过多重复内容,又因为自己是无权重、无排名、无流量的三无站点,自然而然得到的照顾也是非常少的。特别是一些站长为了填满网站首页而去采集一些与站点根本就没有相关性的,如做网站建设的采集一些笑话或者娱乐新闻类的内容,这样的内容本身就不具备与站点产生相关性,因此,当你的站点只被收录了首页,那么可以检查一下内容的质量度,如果是采集而来的,不用检查也知道内容的质量不会高到哪里去。笔者比较推荐提升站点收录量的途径就是尽量多更新一些原创优质的内容,这才是让网站内页也被收录的关键因素。
|
|