您当前的位置:科技评论网资讯正文

爬虫暴力抓取、搜索结果抄袭,头条搜索疑被“赶鸭子上架”?

放大字体  缩小字体 2020-02-29 17:27:39  阅读量:292582

  近日,据多家媒体报道,经过长达半年时间的测试,字节跳动终于推出了“头条搜索”独立App,然而理想而丰满,现实很骨感。和甚嚣尘上的“头条搜索”上线消息相伴而生的,是不断曝出的用户搜索体验差、搜索结果抄袭百度、出现侮辱革命英烈内容、头条爬虫“流氓”抓取中小网站等一系列负面信息,总之,在用户最为看重的搜索内容质量上,头条搜索还远远没有“及格”。如今,这些问题仍未解决,“头条搜索”独立App匆忙上线,大有“赶鸭子上架”意味。

  派爬虫暴力抓取中小网站,头条搜索想“一口吃个胖子”?

  不久前,就有站长在网上发文吐槽表示,字节跳动为了快速发展搜索业务派出爬虫四处暴力抓取网站内容,部分配置较低的网站已经直接瘫痪,给中小网站主们造成了很大的损失和困扰,严重影响了网站正常的用户访问。

  该站长表示,今年7月份,他突然发现公司的网站经常性打不开,网页加载极其缓慢,有时甚至直接瘫痪。经过一系列排查后,在服务器日志上发现了bytespider爬虫的痕迹。该爬虫抓取的频率每天达几百万次,高则上千万次,服务器带宽负载飙至100%,而且该爬虫在抓取时完全不遵守网站的robots协议。

  从字节跳动开始做搜索之后,其实网络上就一直有站长抱怨头条搜索爬虫抓取过于暴力的声音,遭受字节跳动的搜索爬虫暴力抓取的不是个例,很多小网站都深受其害。

  头条搜索为了快速崛起,践踏robots君子协议让自己家爬虫四处暴力抓取,实为其急功近利的写照。

  搜索引擎的索引数据都是靠点滴积累起来的,百度、360、谷歌等走到今天都经历了多年沉淀。头条搜索之所以走这种“歪门邪道”,很可能是产品急着上线,需要快速扩充内容库,但是同时也暴露了其作为搜索结果的优质内容匮乏的硬伤。

  搜索结果抄袭百度、现侮辱英烈文章,头条搜索内容堪忧

  4月26日,今日头条因涉嫌大量窃取百度“TOP1” 搜索产品结果,被百度以不正当竞争为由起诉到北京市海淀区人民法院。

  百度方面提出了“立即停止侵权,赔偿相关经济损失及合理支出共计人民币9000万元,并连续30天在其APP及网站首页道歉”的诉讼诉求。

  从百度起诉的内容看,今日头条侵权证据确凿。百度向法院出示的一份证据中显示,在今日头条搜索“螃蟹和西红柿吃会中毒吗”,首个搜索结果中的图片上赫然打着百度LOGO水印;而搜索“1立方厘米水等于多少升”,首条搜索结果中,嵌入了“抄自百度”的字眼……

  今日头条的做法不仅违反了商业的道德,还扰乱了公平竞争的秩序,更暴露了其优质内容匮乏的窘境。

  频繁出现的侮辱英烈低俗内容也为头条搜索蒙上阴影。

  去年11月,今日头条被网信办约谈。起因是革命英烈方志敏长孙方华清发现,在今日头条首页搜索栏输入“方志敏”等关键词时,检索到了大量侮辱性文章,后正式向江西省公安厅报案,并要求协调首都相关主管部门严肃处理此事。

  这是继抖音诋毁革命英烈之后,今日头条又一次触及法律与道德底线。屡禁屡犯,不仅仅是对我国相关法律法规如《英雄烈士保护法》的藐视,亦是其内容审核的严重缺位。内容生态尚掌控不好,又怎么要求其处理信息庞杂的搜索引擎呢?

  从搜索结果上来看,做搜索引擎对内容有极高的要求,头条搜索目前良莠不齐的内容,指向的是初级的用户体验,显然难以留住早已被成熟产品“惯坏”的用户。

  从产品基因角度看,用户对于今日头条的使用习惯是在算法推荐之下浏览内容,获取信息的方式停留于被动层面,而搜索具有主动性,很难迎合今日头条原有生态环境,用户体验上难免“不伦不类”。

  困难重重,却难挡字节跳动进军搜索的野心。然而在一个个独立App将“信息鸿沟”日益拉大的今天,要做好全网搜索谈何容易?外看搜索巨头根基稳固、用户体验要求极高,内察自身优质内容匮乏、基因截然相反,赶鸭子上架的“头条搜索”App恐怕很难脱颖而出。


“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!