您当前的位置:科技评论网资讯正文

疫情之下从头审视查找数据的价值

放大字体  缩小字体 2020-03-08 12:15:44  阅读量:4547 作者:责任编辑NO。邓安翔0215

编者按:本文来自微信公众号热点微评(ID:redianweiping),作者:王新喜,36氪经授权发布。

一场席卷而来的疫情让国人的春节假期变得漫长而又焦虑,疫情叠加春节让人们有了更多时间安静下来深度思考。而从互联网领域来看,抗疫之后,曾经的“搜索”价值重回视线。

多样化的信息获取方式,极大丰富了用户行为习惯。而疫情之下,用户从被动的信息阅览开始投入到主动的搜索中。而搜索背后呈现的民生真实诉求,也让搜索和民意呈现出一种“共振”现象。

疫情之下,搜索与民意的共振

回看疫情初期,再一次上演了谣言是如何借助大众恐慌心理快速扩散的。

比如疫情发生没多久,就传出“抽烟的人不易感染”、“盐水漱口、熏醋能预防感染”、“政府安排飞机撒药” 等谣言,后随着复工开学时间临近,有关各地封城、封路、限行的消息也纷至沓来,最近又传出“服用降压药会加速新冠病毒复制”等言论,防不胜防。

疫情之下民众对权威信息有更高诉求,民众也因此开始放弃了被动式接受信息投喂,而是一次又一次通过搜索去主动求证信息的真实性。用户对“新型冠状病毒”相关的主动搜索量出现激增,根据多个方面数据显示,疫情期间百度日均搜索、浏览达10亿人次。

事实上,随着疫情席卷全球,当前疫情之下,谷歌搜索同样呈现出与疫情相关的关键词搜索趋势,谷歌当前最热门的10个关键词分别是冠状病毒、来苏尔消毒液(Lysol)、易腐烂食品(Perishable foods)、社交距离(Social distancing)、取消行程(Cancel trip)、索拉诺县(Solano County)、食肉(Carnivorous)、狗冠状病毒(Dog coronavirus)、胡须(Beards)、电影《传染病》(Contagion)。

此外,与疫情相关的词语“生存论”、食肉动物、狗冠状病毒等,在谷歌搜索的热度量也出现了增长;在出行安全方面,取消行程、安全的社交距离、安全线、人与人间的接触距离等,成为了人们搜索的话题。此外,谷歌的购物搜索结果页面还显示了洗手液、防护服、口罩等声称可以抵御新型冠状病毒的产品。谷歌对此表示,“基于广告商出价和相关性的结合,例如您当前的搜索关键词和您的活动。”

这正在某种程度上印证,在用户搜索行为背后,搜索数据佐证了舆论风向的价值与对民意变化的洞察力。

在国内,电视媒体也偏向对搜索大数据的引用。

近日央视《新闻1+1》就连续两期引用百度搜索大数据,报道了疫情下的武汉人民生活情况,从数据来看,2月下旬武汉市民对自制美食的搜索量上涨了1590%,榨菜关键词的搜索峰值平均上涨了1088%。

在各大企业陆续复工后,央视财经、北京卫视、广东卫视、西安卫视等都聚焦到了企业复工搜索大数据的报道。

电视台的报道核心价值体现在对民意与民生关注的问题一种探测能力。百度搜索数据被电视台屡次引用,可以说,搜索大数据与民众最直接的防疫需求与舆情变化、用户心理紧密相关,它同时具备时效性、重要性与接近性三大特征。正因如此,这些搜索大数据的新闻价值性也在极大的凸显。

而我们从百度的搜索指数来看,也能够正常的看到数据趋势和民意变化的一种同步和共振。

比如疫情爆发的初始阶段,野味成为第一搜索热词。跟着时间推移,“口罩”、“酒精”等搜索增多,而疫区“心理疏导”、“咽喉痛”搜索量激增74倍。随着复工开学临近,“远程办公”、“在线教育”、“复工”等关键词指数暴涨。

从电视新闻媒体报道时间线中,几乎都是围绕着用户搜索关键词的阶段性变化转移报道焦点。搜索关键词与当下的民意舆论几乎有着一致的共振现象——百度搜索指数呈现的每一次索的热度曲线,都几乎精准揭示了线下民众的需求与关注。

能够说是它是疫情下社会心态、社会问题、舆论动态的承载器与晴雨表。

搜索为何能反应真实民意?

众多互联网平台都在关注疫情,为何只有搜索能探测民意与舆论走向?当然,这其中最主要的原因还在于,搜索大数据能收集到海量的、具备分析价值的真实用户的意愿与行为。

关于真实客户的真实需求,有句话是“客户不是要买电钻,而是要买墙上的那个洞。”我们从啤酒与尿布的搭配的销售故事到口红效应(因经济萧条而导致口红大卖),我们都能看到大数据的威力。

这本质上是平台通过用户行为精准挖掘探测到了其真实需求。但对应到疫情下的新闻资讯平台,短视频平台以及社会化媒体,网民“众声喧哗”的背后,泥沙俱下,大量无用的社交信息充斥,聒噪中夹杂着水军与机器的操纵,信息过载成为常态,它并不能真实的反应客户的真实需求与获得真实民意反馈。

而相对社交媒体等平台的聒噪,搜索的背后是大量的用户主动求证行为,用户此时在搜什么,反应了用户在想什么,这些数据反映了人们的关切点,能更准确、及时地反应用户真实意愿。与此同时,百度能够最终靠搜索+信息流的模式以及百度指数等有效的大数据处理和分析手段将有价值的信息从不断增长的海量数据中提取出来。

另一方面是信息与知识的土壤厚度不一样。值得一提的是,百度在2019年进行一场全面的信息与知识的“升维。

在过去15年,百度在包括知道、百科、文库等知识内容方面积累了超10亿条优质内容。百度百科、百度文库和百度知道这三大产品和中国科协、中国抗癌协会、人民日报数字传播、国家哲学社会科学文献中心等 7000 多家权威机构建立合作,并先后投资果壳、凯叔讲故事、知乎等头部优质垂类内容,百度自身的内容体系——贴吧、知道、百科、百家号、爱奇艺、好看视频等内容与资讯渠道全面打通对接到搜索。

信息的厚度决定了样本的丰富程度与全面性、权威性,可以对事件的成因机制与动态脉络做更好的把控。比如百度针对搜索关键词在对事件脉络、谣言鉴别等做梳理之外,也能对病毒解释、病因、就医、治疗、产业防疫、用户心理等诸多方面提供权威知识与对应方案。

有研究学者指出, 在美国对于国家级的预测, 与使用传统数据进行基准模型预测比较, 利用搜索数据进行样本外预测的平均绝对误差更小。

业内均知的一个案例是,2009年甲型H1N1流感在美国爆发的时候,谷歌通过观察人们在网上的搜索记录完成了冬季流感预测,它所测算出数据也成为美国公共卫生机构所能获取到的非常有价值的信息,谷歌也成为了一个更有效、更及时的指示标。

当然,这背后很大程度上也是由谷歌的信息数据的厚度、样本丰富性与全面性决定的。

搜索大数洞察并指导民生与经济,或是值得研究的课题

因此,如何更大程度的发挥搜索大数据对民意探测的价值或是值得我们思考的话题,在当前疫情之下,它在指导民生方面的价值有两点:

其一:它可以筛选出全民关注的舆情与民意走势,给予地方政府或机构作为决策参考,为舆论民调与民情的把控提供可行的观察方向与视角。

其二:提供数据样本,帮助更多中小企业制定因地制宜的本土性方案。

在疫情期间平均每天有超10亿人次通过百度搜索了解疫情,这带动了更多的搜索内容维度,能反应更多的社会问题与经济问题的侧面与细节。比如说,在百度的搜索大数据报告中,显示部分线下产业受疫情影响严重,旅游业首当其冲,其次是酒店业、装修行业以及房地产行业。

比如具体到广东省,开工关注度较高的行业是金融、机械、电子电气与纺织业,这在某种程度上预示着这些制造业领域对复工的诉求更高。

从国外谷歌的案例来看,曾有业内人士对谷歌预测流感的做法复盘,它是找出在美国google上搜索的最多的5000万个关键词,然后得到每一个关键词被搜索次数的一个时间序列(time series)。每一个关键词都会生成一个“模型“,列出最高的100个关键词,进入下一步,然后的做法就是用排名第一的词放到模型(logit(P) = β0 + β1 × logit(Q) + ε )里面,得出LOGIT(P‘),然后和真实的LOGIT(P)去做相关性分析,把排名第一加第二的词加起来作为Q,一样去看其结果和真实数据的相关性,以此类推到前100个词加起来作为Q的结果。

如果说是前55个词加起来作为Q的模型的模拟度最好,最接近真实数据。那么就能确定了这个预测模型的具体自变量:这45个词的搜索量叠加作为Q。也就是说,如果前55个词全部都和流感相关,而后面的55个中则有19个和流感无关那么就能够最终靠前45个关键词作为最接近真实性的定性关键词做具体判断。

这个模型或许对于普通人而言并不好理解,简而言之是通过关键词的判断,确定我们要预测的是什么数据,确定我们有什么,然后通过对用户搜索数据进行对比分析,区分其来源,时间段,需求点,一个很快而且比较准的预测数据就出来了。如果是针对流感预测,比官方数据快1-2周则意味了有更多的时间来准备如何应对可能爆发的流感。

而如前所述,通过搜索做出来的预测模型同样可以用于疫情之后的抗疫工作。后续地方政府该如何针对疫情防控、物资调配以及针对相关受影响的行业展开救济与补贴,制定相应的政策,用户的搜索数据与行为轨迹提供了一个相对客观性、指向性的参考“路标”,它其实可以为抗疫提供因地制宜的本土性方案。后续针对公众需求的抗疫方案这本身也能影响公众的期望,而使得公众的行为发生改变。

与疫情相关的关键词搜索快速增长背后,它反应了人们在黑天鹅事件下一种新的决策思路——通过搜索留下的痕迹作为数据, 来呈现事件本质甚至预测事件发展走势,进而指导我们更好的规避风险、将危机变为转机。

疫情之下,搜索大数据的在反映民生、服务民生中的价值被放大了。而未来,个人、媒体、政府机构要进一步洞察现实舆论民情以及事件的走向与趋势,通过搜索大数据辅助行动决策是一种很好的思路。

如前所述,搜索能反映出民生需求的阶段性面貌与诉求,如何将搜索大数据开放并对接地方政府机构、学术研究机构、地方企业与公众等,形成共享机制、各界共同展开对数据的研究,推动民生问题的解决就显得颇为关键。这或许也值得百度等科技公司思考。

而各领域的搜索大数据可以梳理出民众需求背后的逻辑、背景与成因机制,通过联合行动快速推动针对性的解决方案落地,就能快速回应民生诉求,带动公众与各界共同参与社会问题的治理中来,在产学研领域,同样的逻辑与做法都可以复用,也能提升各行各业通过数据思考并处理问题的能力。

总体来看,搜索像一面镜子,能映照出民众最迫切的需求,而通过对民意的洞察,可以提供一定的数据决策价值,输出给地方政府与机构、民众所用,起到“取之于民,用之于民”的价值。

未来搜索如何更好的指导民生,改善民生,或是一个值得研究的课题。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!