1. 数据分析网首页
  2. 大数据
  3. 数据挖掘

伦敦神经科学新算法,能帮你识别和过滤微博垃圾信息

当你看到的时候,你知道微博里充斥着垃圾信息——但是如果你看不到那些垃圾,是不是很爽呢?

不幸的是,分析信息内容的电子邮件过滤软件对微博没有用。因为就那么140个字的一段内容,即使是合法的,读起来也像是尼日利亚网络骗局。而网托儿们往往把陷阱隐藏在链接里。因此微博服务商只能依赖用户举报违法账户。

但是最近伦敦帝国学院一项令人感兴趣的研究发布了一种新的方法。借鉴神经科学的某些计算方法,Gabriela Tavares 和 Aldo Faisal共同开发了一种新的算法,能够鉴别一个Twitter账户(以85%的准确率)不是由正常人使用的,而是挂着自动程序或者(更糟的情况)根本就是个托儿。

这一切都跟时间点有关。通过分析165,000个Twitter用户的使用时间,研究者们发现了三种活动模式截然不同的用户类型——个人、公司和自动程序。这只是开端。这种方法最终会用于为各种社交网络开发有效的过滤系统。

算法

垃圾信息制造者能不能让他们的自动程序模拟人类行为?“那样做非常困难,” Tavares说道(他现在在加州理工学院),“那不是一个确定的模式——不是在一天的固定时刻或是固定间隔发布微博,算法,数据挖掘,数据分析,Twitter消息。这种类型的用户利用机器程序试图扩大潜在销路;不知道想要模仿的行为的参数,就无法模仿。”

制止垃圾信息,似乎是任何人都无法完成的事业。然而,帝国学院的一位神经技术讲师Faisal指出,这样的结果也使得交流元数据带来了更加丰富的信息——一些我们日常网络生活中显得非常琐碎的细节。他说:“这说明即使是最基础的元数据也非常有助于揭示你是什么样的人。”可以想到的是,也许,正因为如此,美国国家安全局正忙于从我们的电话中发掘这样的数据。

事实上,这种新算法不仅能鉴别你是一个守法的Twitter用户,还是一个垃圾信息制造者;它还能够预测你下一次刷Twitter的时间,其准确性令人惊讶——只要你是一个人类。最终证明,人类,作为一个群体,比机器人更加具有可预测性。我们引以为自豪的人类自主性也不过如此啊。那些像机器一样每天按时定点地骚扰你的Twitter很烦人吗?那正是你的朋友们。

英文原文:New Algorithm Can Spot the Bots in Your Twitter Feed | Wired Enterprise | Wired.com

译者: 吾墨起舞 原作者:Michael Salvador

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

联系我们

如有建议:>>给我留言

QR code