张乐
-
有赞搜索引擎实践(算法篇)
1. 搜索算法总体架构 在上篇文章(工程篇)中, 我们介绍了有赞搜索引擎的基本框架. 搜索引擎主要3个部件构成. 第一, hadoop集群, 用于生成大规模搜索和实时索引; 第二, ElasticSearch集群, 提供分布式搜索方案; 第三, 高级搜索集群, 用于提供商业搜索的特殊功能. 商业电商…
-
有赞搜索引擎实践(工程篇)
随着互联网数据规模的爆炸式增长, 如何从海量的历史, 实时数据中快速获取有用的信息, 变得越来越有挑战性. 一个中等的电商平台, 每天都要产生百万条原始数据, 上亿条用户行为数据. 一般来说, 电商数据一般有3种主要类型的数据系统: 关系型数据库, 大多数互联网公司会选用mysql作为关数据库的主选…
-
统计学界的一件大事:美国统计协会(ASA)正式发布了一条关于P值的声明
(图片来源:https://xkcd.com/1478,一幅讽刺滥用P值的漫画) 今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今…
-
数据驱动精准化营销在大众点评的实践
精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器。在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高营销效能,成为营销业务部门的主要挑战之一,同时也是大数据应用的一个重要研究方向。本文通过数据体系架构和技术实现案例,分享美团…
-
一个预测互联网产品的数学模型
导读 : 这个产品模型从几个相对不同的维度定义一个产品的关键要素,是测量产品好坏最核心的指标,通过这套模型能迅速发现产品的问题,留住用户的能力并预测产品未来的走向。 这套模型是我在运营路况电台2000万用户过程中积累出来的,也是我们团队做产品迭代,运营和产品目标设定最基本的方法。这个产品模型从几个相…
-
“神策数据”获400万美元A轮融资,并与OneAPM达成战略合作
文章摘要:本次融资的资金将主要用来做研发投入和市场拓展。 Sensors Data 神策数据今天正式对外宣布,已完成 400 万美元的 A 轮融资,由红杉资本领投,天使轮资方线性资本、明势资本、薛蛮子继续跟投。本次融资的资金将主要用来做研发投入和市场拓展。 36 氪此前报道过,神策数据面向中小企业提…
-
游戏运营数据分析专业术语大全
数据具有统一性,规范性,那么咱们在聊游戏运营数据的时候,必须先知道,数据可以干什么! 数据可以告诉我们用户有多少、他们喜欢玩什么、喜欢做什么。数据可以让我们看清产品全局。数据是最有力的证据,能够让我们说服渠道,说服投资商。数据能更直观的表现产品问题。数据可以告诉我们,投入与产品的合理性…… 终上所述…
-
一棵草的故事带你看懂大数据由来
互联网时代,大数据概念受到强烈追捧,企业宣传、媒体炒作几度将其推至高点,很多非技术行业人士都在感叹大数据神奇的同时望而却步,只觉它晦涩难懂。其实,很多神奇的东西都只是需要时间让人们了解,而后会发现,它其实并不那么高高在上不可触及。下面就让《技术照妖镜》为你照一照大数据真面目,希望看完能对你理解大数据…
-
标准正态分布函数的快速计算方法
标准正态分布的分布函数 Φ(x)Φ(x) 可以说是统计计算中非常重要的一个函数,基本上有正态分布的地方都或多或少会用上它。在一些特定的问题中,我们需要大量多次地计算这个函数的取值,比如我经常需要算正态分布与另一个随机变量之和的分布,这时候就需要用到数值积分,而被积函数就包含 Φ(x)Φ(x)。如果 …
-
关联分析在游戏行业中应用案例
背景:研究用户的历史付费行为,对付费用户购买的道具进行研究,发现道具之间的关联性,方便运营根据道具的关联性进行活动推广。 数据源:2016年3月28日——2016年4月4日一个自然周的付费数据。 数据字段:付费次数、付费人数、付费金额及占比、道具名称。 研究对象:2016年3月28日——2016年4…
-
小白学数据:一篇文章看懂NoSQL数据库
如果你关注大数据科技动向,可能听说过一个叫NoSQL数据库的名词,这可能让人有些云里雾里。其实我们处在一个激动人心的技术更迭时代,以甲骨文为代表的SQL数据库已经称霸了企业市场30年,而近年来的NoSQL则是强有力的更新换代的竞争者。这篇文章就通过问答的方式来给小白解释NoSQL数据库系统是什么,无…
-
游戏运营的常规数据分析思路分享
数据分析工作可以从宏观数据和微观数据(细分数据)说起,这种方式也是我比较喜欢的,宏观数据是对总体趋势的预测,以及对异常数据的敏感性把握。而微观数据分析的来源一方面就是从宏观数据的异动而产生的需求,二者是一种相互依托的关系。 当然如果不是专业做DA工作,也许按照这种方式是没有什么问题的,因为毕竟工作时…
-
用户行为分析三大要素:动机、能力和触发点
有一个好的现象,近几年用户体验设计蓬勃发展,越来越多的产品设计开发同仁认识到一个产品的设计开发需求,不应该是由繁杂的功能特性堆积起来的,而是应该由核心价值用户场景作为思考基础,有效串联产品提供的功能特性而形成的。这是好事,我们做产品需求分析时,看到的不再仅仅是一张成百上千项功能的Spreadshee…
-
让你的数据更引人注目的十个技巧
花了无数时间来创建和进行一系列的活动,现在你终于准备好了要把结果展示给老板看。你已经精心排练了你的演示报告,对整个工作感觉好极了,除了那张展现结果表述得不是很清楚的幻灯片。 就算数据的其余部分很吸引人,你知道老板总是会不自觉地把注意力集中到那张表述不太清楚的幻灯片上。虽然你可能不喜欢那样,但是我们认…
-
如何构建BI数据仓库以及BI数据分析的应用
BI数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据…