1. 数据分析网首页
  2. 行业资讯

谷歌是怎样玩转大数据的?

有时候觉得

那些科幻片里的高科技离我好远

直到我发现了大数据

才知道故事可以演的这么贴近生活

摘要:我们已逐渐认识到,高效使用大数据的核心是将大量的数据分解成许多小部分——在数据库里定位查找,找到与你的需求相关的数据,而不是尝试去“覆盖”全部数据。

Facebook最近发布了一份有关社交媒体的报告,这份报告关注了社交媒体对文化趋势的影响。报告从整体上描述了社交媒体的出现如何提供了越来越多的信息。以及,信息的增多如何帮助我们更加全面深刻地理解一些问题。

以这样一个广阔的语境观察问题,我们可以更加容易地去理解技术对我们每天日常生活的产生的影响。本月22日是“世界地球日”,为了配合这一主题,谷歌发布了一篇博客列举了一些使用谷歌的数据资源进行研究和决策的实例。

保护野生老虎谷歌强调的第一个例子是使用谷歌地图的数据来保护野生老虎。借助谷歌地图海量的卫星图像和地理数据库资源,以及强大的处理分析能力,米尼苏达大学的科学家完成了他们在重点地区恢复老虎的栖息地的研究。

这个研究团队测量了过去14年里,全世界76个老虎栖息地面积缩小的数据。他们发现,老虎栖息地的退化速度远远高于森林面积的退化速度。只有在尼泊尔和印度这样拥有老虎栖息地保护区的国家,老虎的数量得到了增长。这两个国家老虎的数量分别增长了61%和31%。

这个研究中最让人惊奇的是,大部分的研究都通过使用卫星图片信息完成的,这些信息全部通过谷歌地球免费获得的。比如,你可以在谷歌地球中输入全球的任何一个位置,然后你就可以通过地球资源卫星图片,看到该地点是如何随着时间的迁移而变化的。

“天窗计划”谷歌另一个有意思的研究项目是“天窗计划”。“天窗计划”可以预估在房顶安装太阳能设备后可以节省的开支。谷歌地球的图像库里拥有全年的日照情况和天气变化数据,“天窗计划”可以计算安装太阳能板的屋顶空间,判断使用太阳能带来的价值和可以节省的能源费用,并将用户与太阳能电池板提供商连接起来。

这是我们对不断扩大的数据库的又一创新使用:帮助我们对重大项目作出更明智的决定。在这个案例中,能源消耗就是这个重要项目。目前,全美41个州的4300多万户居民可以使用“天窗计划”。用户提供一个指标,它就可以来可以测算出可能节省的开支,以及并网发电后可能带来的收益。通过测算你的房子或地区进行独特定制,最终推动太阳能在更大范围的使用。

治理空气污染第三个例子由Google Earth Outreach和环境守护基金(the Environmental Defense Fund)牵头完成。他们测量了铺设在道路下的天然气管道的甲烷泄露情况。

谷歌通过适配谷歌街景(Google Streetview)汽车来完成这一任务。这些汽车携带甲烷分析器,在街道行驶并绘制道路地图。这意味着这些汽车在为Google地图获取街景图片内容的同时,他们也在以半秒钟为时间单位,测量所在街道甲烷的浓度。使用这些数据,研究小组可以标记哪里存在甲烷的泄露以及泄露的程度。

“我们发现泄露的程度从平均一英里一个泄露点位(波士顿)到两百英里一个(印第安纳波利斯)不等。通过分些这些数据,研究小组得出了很多实用的信息。比如,在管线建设中,使用塑料管道的效果会比使用铸铁管道更好。“

“我们希望其他机构可以使用这些数据来完成主干和支线的管线优化或者替换。我们同时会与Aclima合作,使用谷歌街景汽车测量更多的污染物。“

这些项目都强调技术和连接拓展的可能性。随着可以被追踪的数据种类越来越多,范围越来越广,我们的生活和工作都将更加智能化。世界上90%的数据都是近几年才产生的,我们不可能去研究这些所有这些数据的内容看,因为数据实在是太多了。但是我们逐渐认识到,高效使用大数据的核心是将大量的数据分解成许多小部分——在数据库里定位查找,找到与你的需求相关的数据,而不是尝试去“覆盖”全部数据。

你还可以将数据来源范围进行拓展。比如,Twitter的数据也可以用来测定地震和洪水的破坏程度,Facebook则可以通过搜集处理数据来更好地理解用户的生活和兴趣。当你将不同的数据内容进行匹配,你会发现大数据的潜力是无穷的,挖掘大数据可以和你生活的方方面面联系起来。你所做的只是确定你的研究目标,然后确保你可以搜集到你需要的数据。

在我们这样一个“超连接”(hyper-connected)的世界中,数据可以提供给你的可能性远远超过你的想象。

来源:百度新闻实验室

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

联系我们

如有建议:>>给我留言

QR code