1. 数据分析网首页
  2. 行业资讯

Taste Analytics通过非结构化数据分析监控及预防恐怖袭击

就在TasteAnalytics宣布正式进军中国市场之际,这家总部位于美国的全球大数据分析领导厂商的创始人汪晓宇再度接受了笔者的专访。

在不久前,笔者针对TasteAnalytics创始人汪晓宇的采访中,我们了解到其新型数据分析平台产品TheTasteSignalsPlatform是一套可用于每一个企业日常经营的实时的智能数据分析平台,其最独特的地方在于强大的非结构化数据的分析能力,目前其不仅可以分析传统的结构化数据,也可以分析包括中文在内的12种文字、语音等非结构化数据。

近日,我们在采访汪晓宇博士的过程中了解到,TasteAnalytics的智能数据分析平台的强大之处还体现在通过分析非结构化数据来监控和预防恐怖袭击。

具体实现过程

218-15120G52112113

其实,对于恐怖袭击的研究起源于之前他们团队的一个学术研究,客户主要是美国政府。

实际上,大概的过程是对恐怖组织进行分类,一个恐怖组织的袭击形式,比如某一个组织过去5年是以爆炸为主,或者某一个组织的袭击形式是以建筑物为主,这样就可以量化这些组织的行为行径,比如西班牙的ETA组织,他们的恐怖袭击形式是在全球到处作案,根据他们在时间域和地域的行为建立预测模型,把恐怖组织的每一个事件都转变成一个输入点,这样就可以帮助安全局作出预测。

218-15120G52341547

技术角度,具体是这样:把不同的信息从不同的媒体或者媒介里面提取出来,提取出来之后,从它们上面提取特征向量,把所有这些特征项量提取出来,针对每一个组织你就有一个130多维的高维的特征项量,这是第一部分的技术挑战,第二部分,在上一步之后,如何能够把它从高维度降到一个聚类的过程,相当于分块分类,为最后的预测模型打下基础,后续有新的恐怖组织的数据进来,把这些新的恐怖组织相关的维度到放在原来的这个模型里面,进行比对和匹配。

技术难点

对于在当时的情况下实现起来最大的技术难点,TasteAnalytics创始人汪晓宇也表示主要有以下几大方面:

第一是视频,如何从一段视频当中将爆炸事件提取出来

第二是语音,在正常人的语速下做语音的提取,包括词形、词义的分析

第三是文字,如何能够精准的从文字里面提取出相关的语意

第四是聚类,当你有了以上这三大块的所有输入以后,如何找到一组有价值的特征向量群,然后去用来作为聚类和预测分析的输入,从这么多维度里面提取出有价值的信息。

实际上,如果从学术角度来看,你就从信息获取到知识挖掘再到图像识别等过程,相当于需要你把计算机科学各大方面都需要了解,这是一个非常庞大的工程。

从06年到11年,五年期间,整个项目的研发团队来自全美,包括斯坦福大学、普渡大学、华盛顿大学,合作伙伴来自欧洲,最终论文也是发布在欧洲的期刊上。

除了反恐,更多在民用

现在TasteAnalytics的智能数据分析平台涉及到的这一块,其实最多的还是用于社交网络的监控,比如说用在Twitter、Facebook上面。对于是否会侵犯用户的隐私,汪博士给出解释,他表示,作为TasteAnalytics来说,他们还是保持最大的中立,“我们只是提供平台的一个厂商,”汪博士表示。

那么,其实,除了反恐、舆情监控,TasteAnalytics的平台还用于医疗领域,用于监控疾病疫情的发生,比如,在Twitter上面,通过分析疾病的关键字、敏感词,然后同时分析他们的的语境、语义,可以很快的推断出有着一千万人口的华盛顿相关的疾病发生情况,从而可以有效预防疾病的爆发。

值得一提的是,TasteAnalytics的平台在企业的应用场景就更广泛了,比如,可以帮助企事业单位去了解客户的反馈,从客服里面提取相关的信息,来优化企业的业务流程、产品的缺陷,另外,银行可以用这个平台延展去做一些征信服务,还有人拿这个延展去做一些性格测试,人与人性格之间的比较等等。

当然,平台的使用门槛也非常低,“绝大多数情况下,企业可以直接拿来就用,不需要再去做二次开发,”汪博士表示。

TasteAnalytics整体战略

对于TasteAnalytics的整体产品布局,汪博士也给出了详细的解答,从整体上来说,TasteAnalytics是在做一个BI的平台,主要包括两块,第一是结构化的数据分析,第二是非结构化的数据分析,所以TasteAnalytics现在的策略第一是把整个BI的平台提供给社会,让所有需要这种商业情报分析,数据分析的用户,在一个非常快速的简易的平台里面去做这件事情;第二TasteAnalytics接下来的计划是要做图片分析,从图片里面提取出相关的内容,然后反馈给商用或者民用。

TasteAnalytics整体的战略是三步走,第一步是文字的分析,目前已经完成,第二步是图像分析,会在2016年年中期上线,第三步就是视频的分析。

TasteAnalytics进军中国

对于美国的BI环境,汪博士表示,美国对于BI的接受度很高,竞争很多,但是还没有出现一个真正的霸主,BI整体的发展趋势从整体化的解决方案转变为更加专业化的方向发展。

从原来通过服务器投放的,逐渐走向轻量化的SaaS的方式发展,所以可以看出,企业可以使用BI的人员增多了。

最后,这家总部位于美国的全球大数据分析领导厂商TasteAnalytics的创始人汪晓宇博士,表示,在经过一年多的技术储备和行业调研,TasteAnalytics正式进入中国市场,推出实时动态、图像可视化兼具非结构化数据分析能力的综合智能数据分析平台——Signals。

目前,TasteAnalytics已经和国内不少大型企业进行过合作,但是,汪晓宇表示,2016年,才是TasteAnalytics的“中国服务元年”。“我们要实现全部产品的本土化,包括产品使用中文化、云服务部署落地化、技术支持规模化。”汪晓宇说。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code