找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 780|回复: 0

[杂谈] 谈几点对360搜索的印象

[复制链接]
发表于 2012-9-4 11:29:24 | 显示全部楼层 |阅读模式 来自 中国–河北
首先,目前360搜索的结果质量相当高,越是常用词,搜索质量越高,长尾词则质量下降。如果确如360自己所言,360搜索是他们自己的技术,那相当不容易。要知道,搜索引擎是个需要积累的、高技术含量的东西。这里说的积累,不仅是人才(这个倒可以短时间解决),还有算法的修改评测和数据的累积。尤其是数据的累积,这个几乎无法短时间弥补。如果360搜索在没有历史数据累积的情况下达到目前水平,那是相当惊人地牛X的。看看百度、Google之外的其它搜索引擎的质量就知道这有多难了,包括Bing,以微软在人才、资金上的投入,又做了那么多年的搜索,到现在也没怎么样。
不过呢,360搜索是否真的是他们自己的技术,我有高度疑问。除了上面说的难度问题,还有一些对排名结果的观察。根据我关注的一部分关键词的排名对比和历史记录数据,360搜索的结果很像百度结果最后排名调整前的数据,而且是一段时间以前的。
这里可能需要说明一下“最后排名调整”指的是什么。搜索引擎收到查询词,在数据库中按正常算法找到应该排前1000名(Google)或前760名(百度)的URL后,并不是马上直接显示出来,而是要在这1000个或760个结果中再最后调整一下排名,包括某些过滤算法的加入、这些URL之间链接关系的再计算等等。所以,我们有时候会在百度第76页看到一些很熟悉的、曾经风光过、现在被某种形式惩罚的网站。也不一定总是第76页,经常也出现在最后几页,比如seowhy.com的首页现在就在第75页。这些网站既然被降权或惩罚了,干脆找不到不是更合适嘛?为什么放到第76页去?原因很可能就是这是返回结果之后再最后调整的结果。
这种水平的高度相似,如果解释为巧合,或排名算法的相似,我比较难以相信。在数据量很大的情况下,算法的任何微小差异都将导致结果的明显差别。
而且,在360正式推出之前,好像没人听说过有什么360蜘蛛。这个姑且不说了,可以解释为匿名蜘蛛,虽然匿名爬行网站是相当不尊重站长的行为。
我当然不能肯定360结果就是,或者很大程度上是,百度最后调整前的数据。外人无法肯定。我只能说很像。
网上有人觉得360搜索是整合了百度和Google结果后再调整排名,我倒不觉得。整合其它搜索引擎数据的所谓“元搜索引擎”一直存在,如现在居然还活着的dogpile。不过360搜索能实时这么做的可能性很低,百度、Google怎么可能允许呢,360真这么做的话早就被屏蔽了(换IP也一样能屏蔽)。
那么360怎么会有百度的数据呢?真的建个关键词库然后去抓取百度搜索结果?怎么想怎么不可能啊,那太雷人了。百思不得其解,哪位知道指点我一下。又或者是我的幻觉?360真的完全是自己的技术?

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-11-26 02:59 , Processed in 0.043366 second(s), 10 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表