伦敦神经科学新算法，能帮你识别和过滤微博垃圾信息

当你看到的时候，你知道微博里充斥着垃圾信息——但是如果你看不到那些垃圾，是不是很爽呢？

不幸的是，分析信息内容的电子邮件过滤软件对微博没有用。因为就那么140个字的一段内容，即使是合法的，读起来也像是尼日利亚网络骗局。而网托儿们往往把陷阱隐藏在链接里。因此微博服务商只能依赖用户举报违法账户。

但是最近伦敦帝国学院一项令人感兴趣的研究发布了一种新的方法。借鉴神经科学的某些计算方法，Gabriela Tavares 和 Aldo Faisal共同开发了一种新的算法，能够鉴别一个Twitter账户（以85%的准确率）不是由正常人使用的，而是挂着自动程序或者（更糟的情况）根本就是个托儿。

这一切都跟时间点有关。通过分析165,000个Twitter用户的使用时间，研究者们发现了三种活动模式截然不同的用户类型——个人、公司和自动程序。这只是开端。这种方法最终会用于为各种社交网络开发有效的过滤系统。

垃圾信息制造者能不能让他们的自动程序模拟人类行为？“那样做非常困难，” Tavares说道（他现在在加州理工学院），“那不是一个确定的模式——不是在一天的固定时刻或是固定间隔发布微博,算法,数据挖掘,数据分析,Twitter消息。这种类型的用户利用机器程序试图扩大潜在销路；不知道想要模仿的行为的参数，就无法模仿。”

制止垃圾信息，似乎是任何人都无法完成的事业。然而，帝国学院的一位神经技术讲师Faisal指出，这样的结果也使得交流元数据带来了更加丰富的信息——一些我们日常网络生活中显得非常琐碎的细节。他说：“这说明即使是最基础的元数据也非常有助于揭示你是什么样的人。”可以想到的是，也许，正因为如此，美国国家安全局正忙于从我们的电话中发掘这样的数据。

事实上，这种新算法不仅能鉴别你是一个守法的Twitter用户，还是一个垃圾信息制造者；它还能够预测你下一次刷Twitter的时间，其准确性令人惊讶——只要你是一个人类。最终证明，人类，作为一个群体，比机器人更加具有可预测性。我们引以为自豪的人类自主性也不过如此啊。那些像机器一样每天按时定点地骚扰你的Twitter很烦人吗？那正是你的朋友们。

英文原文：New Algorithm Can Spot the Bots in Your Twitter Feed | Wired Enterprise | Wired.com
译者：吾墨起舞原作者：Michael Salvador

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

伦敦神经科学新算法，能帮你识别和过滤微博垃圾信息

你可能也喜欢这些文章