无数的SEOer辛辛苦苦原创的文章经常排在采集他文章的博客之后,这不得不说是一个悲剧。到目前为止,本人认为搜索引擎判断文章是否原创的标准已经运用的有以下几点:网站上的链接、蜘蛛抓取时间、网站的权重。 文章中的链接:这个应该是判断原创标准最主要的一点了吧。如果你的文章结尾有一句:文章转载于某某SEO博客,或者网站中某些关键词上有链向该关键词的链接,那么判断你的文章是转载该博客的应该会比较准的。 你的文章是十年前蜘蛛就来抓过了,我的一篇一模一样的文章十年后才来抓,当然你的文章是原创的了。但是如果抓取时间距离较短的话就难以判断了,因为权重高的博客蜘蛛来的更勤,我的文章五天前就发表了蜘蛛不来抓,结果你转载了我的文章几分钟后就抓取了,这时如果搜索引擎认为你的文章是原创的而我的是抄袭的。 搜索引擎认为一个高权重、高PR的博客文章原创的可能性更大一些。这对新站是个十足的坏消息。谷歌在处理这个问题的时候还是比较好的,我的原创文章的页面一旦被收录,即使被门户网站转载,搜文章名字的时候,我也会排在它前边。这证明谷歌还是能够比较正确的判断哪个是原创的。做百度排名的站长必须面对一个很悲剧的现实:如果你的网站是新站,再加上你文章写的相当好,一旦被高权重的站转载,那么你已经收录的页面很有可能被删除。 不过先不说技术问题,光是判断标准就够令人抓狂的了。毕搜索引擎只能根据人的命令来运行,如果人的思维尚无法做出绝对正确的判断标准,那么搜索引擎也是没法完美的解决这个问题。
|