1. 数据分析网首页
  2. 大数据

大数据的力量左右着今年美国大选?

大数据泄漏和大数据库为今年的美国大选设定了基调。被政客们当作武器的都是哪些类型的数据,这些数据又值多少钱呢?

大数据泄漏和大数据库为今年的美国大选设定了基调。被政客们当作武器的都是哪些类型的数据,这些数据又值多少钱呢?

第一个在竞选中使用大数据的也许是奥巴马,但2016年的大选却成了数据科学家之间的一场恶斗。此前,一场数据泄漏事件让希拉里和桑德斯两个阵营展开了口水战。此事不仅仅透露出双方对选民的了解程度,也告诉我们,当代竞选与以往截然不同,整个架构都已经焕然一新。

选民数据有多重要?以往,竞选团队都只懂得使用通用宣传途径,若要传达讯息或发布广告,往上一发就万事大吉了。如今,这个系统已经被互联网和社交媒体所彻底颠覆。竞选可以在更加个人化的层面上将选民争取过来。在社交媒体上,意见可以迅速传播,迅速改变。数据中的数字比以往更加具体,因而也更有价值。去年,希拉里曾宣称,其赞助者中有61%为女性,而事实上,她的捐款系统并不要求赞助者透露性别,于是就有记者问,这个数据是怎么来的?竞选团队成员乔西·施维琳(Josh Schwerin)答复称:“这是通过内部分析确定的。”他说:“最简单的办法……就是结合出生记录,确定某个名字最可能属于哪一性别。”

就数据泄漏事件而言,这还算是相对温和的例子。桑德斯和希拉里阵营虽然使用同一程序,但部分数据不应该对本团队以外的人可见,所以,桑德斯团队一发现希拉里团队的部分数据对他们可见,就知道情况不妙,担心大家的数据遭到泄漏,之后,他们被指控访问希拉里团队的重要信息,结果受到处分,被禁止访问民主党全国委员会(DNC)的文件。

那么,这些数据究竟值多少钱呢?答案似乎是每天60万美元。这正是桑德斯状告DNC(诉其违反“访问权变更须提前十天通知”的合约条款,直接限制了该团队的访问权限)时提出的赔偿额度。另外,很多人都认为,2012年米特·罗姆尼(Mitt Romney)在大选当天遭遇的数据崩溃,是导致他竞选失败的最后一根稻草。与此形成鲜明对比的是,《连线》杂志报道称,奥巴马竞选连任的活动拉开帷幕时,他们“对当初帮他入主白宫的69,456,897名美国人姓甚名谁了如指掌。”这种数据的价值怕是远不止60万美元。

DNC对大数据的情有独钟始于奥巴马的竞选活动。在大选期间,他们当然没有共享数据;但大选过后,情况就不同了。伊森·罗德(Ethan Roeder)曾在2008和2012年的两场大选中担任奥巴马的全国数据总监,他说,任何一名候选人收集的数据对本党都是无价之宝。初选期间的候选人数据当然应该各自保密,但初选一结束,这些数据就应该拿出来共享。

那么,这些数据都来自哪里呢?不少竞选团队经理都抱怨,旧数据用处不大。人们搬家是常有的事,上一场大选的数字和数据点很快就不合时宜了。保持数据常新是一项艰巨而昂贵的任务;光是一个党派的力量还无法胜任。不过,有一些大型企业专门从事这方面的工作。比如,NGP VAN就充当了选民数据库和竞选团队之间的纽带。其标语是“在美国,几乎每一个大型竞选团队都由NGP VAN提供数据支持”,旁附奥巴马照片。毫无疑问,正是像这样的外部公司承揽着所有的数据工作。NGP VAN把这些工作包揽下来,加以整理与包装,再提供给竞选团队。姓名、住址、捐款额度、隶属关系等能到手的信息全都编列在内。但这只是其中一面。TargetSmart等公司还和NGP VAN合作,编纂消费者意向数据,并将这些数字转变成有价值的适销产品。

数据让大选更美好。虽然,很多人都担心数据被用于支撑竞选阵营或支持市场营销,但大数据也有它贴近民生的一面。大数据的作用不一定是让权力进一步集中到当权者手中。竞选团队管理者与政客们固然对选民更加了如指掌,但他们也更清楚在各个议题上该如何选边站。互联网和社交媒体使这个系统焕然一新,并赋予了普通大众更多的权力。现在,我们可以看到并衡量选民的反响,在手法上的转变也可以更加迅捷。在本次大选中,最耐人寻味的一些数字都是由Twitter和社交数据催生的。

人们还担心,社交媒体会使政治更加面目可憎。竞选领域资深人士乔·特里普(Joe Trippi)在接受TechRepublic采访时称,社交媒体固然赋权于民,但它给民众带来的危险性同样不可小觑。

“Twitter玩的也是权力,它是一种社会认同。如果你信任的三个朋友都发推说,现在热映的是一部烂片,这个时候,制片公司花再多的钱打广告又还能起到几分效果?你还会去看吗?”

对于数据在未来政治中的角色,特里普的展望同样黯淡。眼下的竞选活动不过是在追赶时代的步伐。大家试图效仿2008和2012年的奥巴马竞选手段,并将全部已有手段都用个遍。特里普认为,无论如何粉饰,竞选焦点都“已经从赋权于民,转变成了有针对性地操纵民众。”以其三十年的从业经验,特里普的专业意见使眼下的政治局面愈显错综复杂。但桑德斯与希拉里的数据泄漏事件错在哪一方?使用这些数据究竟是否有违伦理?到头来,人们对这些问题的看法很可能会跟自己选票的去向密切相关。无论个人观点如何,但结果证明,大数据确实能为竞选提供强力支持。要让未来的竞选活动放弃如此好用的工具,实在有些困难。

翻译:雁行

原文:dataconomy.com

来源:造就

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code