找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 742|回复: 0

[转载] 从网站关键词剖析看百度算法

[复制链接]
发表于 2012-10-1 23:33:16 | 显示全部楼层 |阅读模式 来自 中国–广东–广州
我们都晓得网站关键词剖析在算法中起着继往开来的效用。百度在还没调试算法之前所用的网站关键词剖析是最大般配法:正向般配法,反向般配法和双向般配法。譬如输入小学生作文(用GG):他瓜分为:小学生/作文(看快照)。百度框计算没出来,算法没调试之前。瓜分与GG同样。自打百度发布了框计算,他的算法也做了巨大的调试。涵盖关键字剖析,超链接剖析,域名,收录等。首先他对关键字剖析做了巨大的变更。我们都晓得百度技术大会中所谓框计算就是:用户输入内容-》百度框判断内容是归属算数,购物,股票,外汇仍然我们常理的网站关键词。当我们在百度输入1+1.5的时分百度会直接给出谜底。当我们输参股票代码的时分百度会直接给出股票走势图。这一切的一切都是百度所谓增长用户体验。实则说白点就是:百度的网站关键词剖析的算法变了,成为了:“基于明白的分词办法”那啥子叫基于明白的分词办法呢?
其基本思想在分词时分同时施行句法,语义剖析。模拟人对句子的明白过程。因为汉语语言知识庞大与复杂。这种分词法实行起来是十分的艰难。以百度如今的状态只能申说这种系统居于尝试阶段。因为只有这种分词算法能力达到用户最想要的结果真正的增长用户体验。但百度用这种办法增长了用户体验吗?
只能说增长一局部,但疏忽了根本。一局部就是适才所谓。输入算数自个儿给出谜底等等。疏忽了根本在那呢?就是之前的网站关键词般配法。如今百度弄不清方向了,当我们搜索寻常网站关键词(不涵盖算数,股票,购物等网站关键词)的时分如:小学生作文为例。第一页名次的都是老站。而且老站的主站一个,子目次一个。有时还有一点博客的文章。10个位置,重复了3个站。新站呢?基本在第二页。这申说了啥子?申说了百度管你田七二十一老站排前,新站第二页去。(老站排面前的端由是啥子呢?不晓得大家有没有想过。)当我们输入:“小学生作文大全”的时分,百度给出的结果都是网络购物关于“小学生作文大全”卷帙的信息。试问一下:有若干人输入“小学生作文大全”为了就是买书?这恰恰又减低了用户体验。
说道用户体验只得说下SOSO。腾讯搜搜一直都是很低调的。在百度增长用户体验的这些算法。Soso客岁就实行并用于实践中,那时SOSO仍然用GG的搜索接口。体验度比百度还好。如今SOSO独立了。无须GG的接口。它在搜索寻常网站关键词时分就做到达重复性这个问题。10位置。给了主站位置基本很少给子目次一个位置。相形之下SOSO用户体验比百度强一点儿。
百度这算法能否再变更呢?能否变更为之前的算法。仍然接续他所谓尝试中的用户体验呢?我们拭目以待。
本文由广东移动网上营业厅网http://www.24khours.com/提供 转载请注明出处

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-9-21 09:13 , Processed in 0.047717 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表