Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。对于我来说,最近的一个使用点就是服务集成平台的日志分析。服务集…
摘要:最近研究了下Facebook内容排序问题,这个在新浪微博、知乎内容排序这些场景下都应用到。主要是关于edgerank的算法讨论以及Facebook的AB test机制。 EdgeRank 是Fa…
《老炮儿》讲述的是北京的一辈儿六爷Mr.Six不愿接受新时代的潮流,蜗居在自己的小胡巷子里,而自己的儿子因为划了豪车被绑架,六爷去赎回儿子的一段故事。虽然说最后六爷发现被这个社会抛弃,但是他那股有老礼…
60天入门数据分析师
做推荐系统应该来说也有段时间了,而运营过程中通过推荐智能貌似已经成了烂大街的套路,给你发条短信、推个push、打个小红点、发了广告banner,而作为用户现在也有些变化的麻木了,今天还和郭太讨论了这个…
我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关的。后来,到了淘宝后,自己凭兴趣主动地做了几个月的和用户…
这两天陆续有一些自己经营淘宝或者天猫的店铺朋友咨询数据分析,该怎么入门。过去讲数据分析比较多,更多的是从一名数据分析从业者的角度去思考的。作为目前最大电子商务平台淘宝这样的平台,很多卖家自己对数据分析…
用过虾米、酷狗、QQ音乐、网易云音乐,个人感受网易云音乐在音乐推荐这块做的真心不错,特别是以“人”为角度的推荐,没有像虾米、酷狗推的那么乱。虾米还可以,但更多的是以歌搜歌的形式。刚注册了一个新的账号,…
摘要:今日头条作为一种新型的新闻阅读方式,已经将传统的新浪、腾讯、网易、搜狐这些新闻媒体以一种大数据+新闻内容的方式呈现给用户。上线没几年,用户量已经发展到3亿累计用户,日活奔着3000万去。看到这样…
说到我们要做数据分析,没有米下锅怎么行?没有数据,我们还怎么做数据分析?前几天有个哥们在现场就问我,说我们是一家创业公司,我们也非常想做数据分析、机器学习这些,但是我们没有数据啊!这可怎么办?我们也不…
最近几个同事在做推荐平台的项目,都问到怎么实现FTRL算法,要求协助帮忙实现FTRL的算法模块。今天也是有空,赶紧来做个整理。明天还要去上海参加天善智能组织的FLY BI大数据分享会。有兴趣参加线下活…
其实推荐系统前面已经讲过不少,那时候主要是放在机器学习上讲的,既然这次要系统撸一遍数据挖掘,就把推荐系统单独拿出来说一说。相信如果做过推荐系统的人,都知道是什么回事。一堆features,一堆算法模型…
摘要:数据指标是数据分析很重要的原材料,比如我作为一家电商公司,我的网站运营的如何?每天的流量是多少?新老卖家买家都是什么占比?产品类目销售情况是什么样子?这些都是作为一家电商公司每天都需要去监控和关…
本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。1.聚类 VS 分类 分类是“监督学习”,事先知道有哪些类别可以分…
摘要:曾经有这么一群人,他们每天早上8点打开软件,调试着各种交易工具,确保每天能够正常运行。9点开盘了,静静的看着交易软件的自动买入卖出。中午吃个饭,下午继续这样的工作。晚上想一想算法模型,思考一下人…

关注我们的公众号

微信公众号