找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 998|回复: 0

[杂谈] 网站内容采集之感悟一二三

[复制链接]
发表于 2012-10-22 10:34:26 | 显示全部楼层 |阅读模式 来自 中国–北京–北京–东城区
本帖最后由 搞基不解释、 于 2012-10-22 10:35 编辑

每个站长都深知网站内容为王,内容至上的道理,可以毫不夸张的说一个网站的内容是网站的根基,是网站的灵魂,内容空洞、一无用处内容的网站在搜索引擎数据库中没有立足的位置。而现实是从一个网站上线开始信息填充到网站中、后期的逐渐壮大网站的羽翼逐渐丰满,网站的信息增加成了每个站长必不可少,又很头疼的事,采集软件的出现可以说解决了很多站长苦恼,很多站长心里都知道原创好,但是现实的局限性往往还是或多或少的使用采集软件进行文章的更新,百度6月风暴的动荡出发点之一也就是打击采集站,这也使得很多使用过采集的站遭到重创。今天牛人小鱼就网站的信息的采集感悟一二三。   我们都知道搜索引擎本身对网站的收录就是一个网站采集的过程,搜素引擎采集网站内容的更好目的就是为了更好的服务于搜索用户,它对一篇文章的被采集度并不是大家说的100%反对,就拿一篇新闻稿来说如果只有一个网站发表就谈不上信息的传播,只有新闻稿被另一个网站采集、复制、发表这样才能形成一个新闻的传播过程,这中间搜索引擎起着击鼓传花的作用,它把一篇文章在不同发表的网站信息收录起来,形成一个新闻的传播链,从而展示个搜搜用户。但是搜索引擎对信息采集是有限制的,那就是传播网站的数量和网站的重要性,也就是我们俗称的权重,在这个我对网站的采集希望做到以下几点:
   1、新站上线,切忌采集,道理很简单你的资格不够,网站练最基本的权重都没有,在搜索引擎的规格中没有传播服务信息的必要,所以这就造成了很多新站久久不收录的原因。站长们还是苦练内容写原创吧。
   2、网站有个基本的权重后,站长还是原创为主,人工采集为主,采集的文章最好在搜索引擎框里面搜索一下,如果搜索结果有几十个相同的文章,这种信息页是没有必要填充的文章。如果搜索结果只有10个左右,这种文章站长好好的进行伪原创还是可以填充到网站上的。
   3、网站的权重到了一定比例的时候,随着网站的话语权的进一步提高,每天的原创保持一篇,其他都采用人工采集,进行伪原创加工就足以应付网站每天的更新、收录了。
   4、网站牛气冲天,到了腾讯、新浪、网易的话,这时候网站的话语权不是一般的高了,这时候简直可以说你是搜索引擎的VIP客户了,网站每天的信息的发布就是搜索引擎信息传播链中一个不可或缺的环节了。这时候网站有成千上万的页面,每天信息的采集成为了一个必不可少的工作。
   总之,网站的信息采集要根据网站的权重和信息在搜索引擎中的已传播数量决定,新站的信息是个每个网站打基础的时候,基础务实是非常有必要的,只有基础牢固了,才能才每天、每星期、每月的百度更新中占得先机。

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-11-22 11:40 , Processed in 0.039920 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表