为何文章采集器在“飓风算法”时代依然横行?

Square
一大波人工智能孔乙己正在袭来……文章采集器在飓风算法下命运如何拭目以待!
一大波人工智能孔乙己正在袭来……文章采集器在飓风算法下命运如何拭目以待!

“飓风算法”也出来有一阵子了,2017年7月7日被推出的吧?有时候我在想,这东西出来到底有用吗?为何依然有很多文章采集器依然横行在互联网?我最近也认识了几个技术人员,他们手头都有自己的网站,并且大多数的网站的内容都是通过从互联网中海量内容进行采集而成,在此之下,我不禁好奇,为何百度飓风算法对他们没有丝毫影响?他们的网站都是几乎百分百抄袭的啊。

难道说是我too young too simple?在印象当中,不管是什么事情,我们很多时候都循规蹈矩着做人,按部就班地走在光明大道上,但依然不时会怀疑自己到底是否值得坚持到底。我们总觉得自己不够聪明,别人走着捷径依然安然无事。还是说自己对于搜索引擎依然想得太简单太美好?那些叛逆的人似乎知道搜索引擎的底线,只要不触碰它们底线就行。就像文章采集器一样,明知不可为,却反其道而行之。他们是否衡量过“飓风算法”的底线在哪里?

不管怎么说,本人不太喜欢这些投机取巧的行为,如果搜索引擎优化的工作也可以这样通过机械化的方式来完成的话,我不明白seo这个职业还有什么意义所在?与其每天担惊受怕网站被惩罚被K,倒不如趁早改走光明大道,多想想怎么将网站的用户体验做好,为用户提供价值,这样的网站才能成为吾所向往的骄傲。

什么是“飓风算法”?

什么是“飓风算法”?
什么是“飓风算法”?

百度百科:

“百度搜索推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。”

“飓风算法”是百度今年推出不久的新算法之一,主要针对的就是严重采集文章的网站。通过实际情况发现,假如网站内容为部分采集,得到百度惩罚的可能性相对较低。

什么是文章采集器?

其实文章采集器就和网络小说界的抄袭事件所采用的手法差不多,主要通过多篇别处的高质量文章各取一段内容,然后整合成一篇自己的文章,根据自己给的关键词取个标题,这样一篇文章即可“写”成。更有甚者,直接将文章原封不动地搬来,连标题都不改。

用百度搜索“文章采集”有很多类似的采集器
用百度搜索“文章采集”有很多类似的采集器

用百度一搜“文章采集”这个关键词即可发现好多这样的付费工具依然横行并快乐着。其中最为出名的当属“火车头采集器”这样一款文章采集程序,笔者早前也曾有所耳闻,在“文章采集器”这样的搜索结果下第一位竞价排名结果,也就是参加了百度的付费推广。

文章采集器这个工具也并非一无是处,除了优化网站外,竞价站、个人用途都可以随你。但从道德层面来讲,偷取别人的劳动成果都是不道德的行为。

2016百度竞价魏则西事件
2016百度竞价魏则西事件

百度只认钱不认人是出了名的,就如同去年的魏则西事件一样,当时医疗网站数不胜数,很多公立医院都大摇大摆地在网上招摇撞骗,而医疗行业也是最有钱的一个行业,医疗也是百度竞价推广中的一个大户,水深!不过我们今天并非要讨论百度或者魏则西,要讨论的是我们的主题文章采集器。既然百度在“飓风算法”中明确声明了文章采集的行为属于黑色行为,为何依然背地里拿着火车头采集器的竞价推广费用干着违背自己原则的事情?难道百度真的只认钱不认人吗?

不管是怎么一回事,正如前面所说,也许文章采集器的用途甚广,并非只有商业用途,也不局限于网站等与搜索引擎挂钩的平台。所以百度在这方面也无可厚非。因为文章采集器仅仅只是一个工具而已,工具主要也因人而异,用在好人手里就是利器,用在坏人手里就是伤天害理的帮凶,罪恶之本非工具,而是人性使然。

不过,为何卖文章采集器的“火车头采集器”却不将此应用于自身网站?

本人有这疑惑很久了,身为卖文章采集器的网站自身却并没有运用自身产品进行内容收集。对此,我很是疑惑。一个卖瓜的黄婆,再自卖自夸,不喜欢吃自己的瓜,又怎能让别人相信自己的瓜够甜呢?生活中的很多事情都有着这样的逻辑矛盾,我们却往往乐于接受自己想要知道的利益点,无暇顾及这些并不天衣无缝的破绽。

这年头好像人人都不甘于碌碌无为地奉献自己的青春,风华正茂,恨世界过于冷酷,才华并不能获得同等的价格回报。我们不再像上一年代的人那样安于现状、挥霍青春,所以每个人都在等待机会。当初将人生规划得好好的,一旦学到了技术,有了资本,就可以不再寄人篱下,自己开始自己的创业故事。就如同我在文章开头提到的几位刚认识的技术大咖,手里网站一打又一打,都是全自动采集文章生成的内容,只要将网站建好,既可以放手不管了。至于他们说网站已经开始盈利了,我却难以苟同。赚1元也是盈利,赚1000也是盈利,是可持续性地盈利还是只是昙花一现?资本想要变成可以源源不断地为自己盈利的资产的前提是它是可持续性的,源源不断的,投机取巧钻空子早晚会被突如其来的政策所击垮,昙花一现的资产又何以称得上资产?

其中一位仁兄曾兴高采烈地给我看他一个比较成功的网站,是一个金融类的网站。百度权重3,站内内容都是靠自动采集而来。但是后来我发现他这个网站在360却连一个首页都没被收录,而网站已经运营了七八年之久。而且经过本人博客之前的实践经验,不难发现,360比较注重一个网站的原创度。因为我的博客文章一般都会除了在自己博客以外,还会在百家号等平台进行发布转载,但在360搜索却只能搜到自己博客的页面,其他要么没被收录,要么就是排名靠后。

对网站不管不问,任其自生自灭,没有精神投入,却奢想可以有朝一日靠其混口饭吃,这就是所谓的出路吗?

他的网站给我的第一印象就是不靠谱,尤其是作为金融类的网站。他说他的网站每天有几千个ip的流量。对此我是抱着将信将疑的态度。我就想看看他这网站到底能拖到几时可以狗带。人的眼光还是应该放远点为好,眼光太短只能勉强维持现状,未来的瓶颈期也是必然的。各位seo的同仁们,你们觉得呢?

熊掌号与原创保护的出现是否是互联网内容大战的开端?
熊掌号与原创保护的出现是否是互联网内容大战的开端?

就如本人之前一篇文章《熊掌号是什么?与百家号有什么区别?》所言,熊掌号伴随着原创保护功能的上线也许就是一场内容大战之前的警告,搜索引擎早晚要对自身内容进行大扫除,去其糟粕取其精华。现代自媒体当道的天下,早已不是以前web1.0时代可以同日而语,什么都缺,就是不缺内容。按照万事发展的规律,所有的事情都是先求量变,再求质变。就和马斯洛需求理论同样的道理,随着物质需求的满足,之后越到金字塔的顶层越是更深层次的精神需求。量是刚需,质则是在物质丰富时代下的刚需。

如今的我们害怕在将来的某一天会被AI人工智能抢走饭碗,但并不知道这些都是自己一直以来的咎由自取,干着千篇一律的事情,企图就此安稳度过余生。采集文章这样的事情既然电脑可以做,人工智能也就可以百分百做到,因为这本来就是数据处理的事情而已;建网站现在是程序员的事情,在以后也很有可能十有八九被人工智能甚至是小小的傻瓜式建站程序即可取代,我们可以简单地像制作ppt一样去制作我们的网站,由用户自由定制。但唯有自己的见解是人工智能可能无法拥有的,人之所以是这个星球上最高等的生物,就是因为我们有超凡脱俗的大脑和了不起的思维,现在的你懒于思考,将来的你也许连个机器人都不如。

假如百度不清除这些重复内容,那么将来你的饭碗完全可以被一个第三方软件所取代。一条龙服务:建站、更新内容(采集文章)、seo。但这很显然行不通,你可以轻易建成一个网站,别人也可以,拿什么去和别人竞争?不进则退,总是有千千万万的人排着队地去挤掉你。核心价值早已经不复存在。

当然,现阶段如果将这种自动采集文章的网站作为辅助站群还是可行的,但个人觉得不可过于依赖此种方法。再者,这也对劳动者造成了很大的伤害,切莫变成彻头彻尾的利己主义者。据我这二十多年的经验总结,发现人真的没什么捷径可走,爱投机取巧的人都属于一种无知的表现,对事物原理处于一知半解的状态;而一旦了解当中要害后,才发现真的是千不该万不该,悔不当初。坚持是成功最快的捷径,但走着走着就在半途迷失了方向,忘了自己到底在坚持什么。

在“飓风算法”时代,我们且行且看文章采集器究竟可以横行几时?

相信能够看到这里的人都是与我有缘的站长们,欢迎来和我博客拿着灼热的铁换友链,可以加我qq:491361451详聊。

百度“清风算法”让标题党再无立足之地

seo是什么意思?新手必看

个人微信公众号
个人微信公众号

声明:文章为拿着灼热的铁个人博客(公众号:lattestory520)原创,未经允许,禁止转载!

Comment

3 Replies to “为何文章采集器在“飓风算法”时代依然横行?”

  1. 文章采集器就应该禁止采用,百度也真的是挺搞笑的,自己又推出飓风算法抵制文章采集,另一方面又在给文章采集器做竞价推广。不过还好,现在有了熊掌号以及原创数据提交,文章采集器对我们这些兢兢业业的站长也就不成什么大的威胁了。至于飓风算法,我们还是走一步看一步吧,自己更新好自己的原创就行。

发表评论

电子邮件地址不会被公开。 必填项已用*标注