搜索:数据挖掘

  • 基于你的点赞轨迹,数据挖掘可以探知你的性格秘密

    摘要:没有人可以离开社交媒体(微信、微博、脸书等),朋友圈是维系外界最重要的通道之一,大多数人都是社交媒体的重度使用者。但是,有没有想过,我们在社交媒体上的一些无意识的行为(例如点赞、收藏、上传头像、状态更新、转帖等),其实很深层次的在暴露内心的一些秘密和隐私。 整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和…

    2016-01-08
    0
  • 零售行业数据挖掘实践七步走

    对于沃尔玛、华润万家、百佳等零售大超市而言,每天都有很多客户通过会员卡进行购买,不断积累了很多销售数据,如何利用这些数据,从数据中挖掘金矿,很值得每个商家去思考。尽管目前零售商有不少的IT系统去支撑企业常规的分析(如销售量、销售额、热销SKU等),但实际上还是未能从数据角度深入挖掘客户的价值,仅仅从经营分析的角度来满足了常规分析工作。 本文从个人的角度去谈一…

    2016-01-05
    0
  • 商业智能BI三层结构:数据报表、数据分析、数据挖掘

    经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。但…

    2016-01-03
    0
  • 数据挖掘公司D square nv完成500万欧元B轮融资

    摘要:D square nv日前完成 500 万欧元 B 轮融资,融资方为 Gemma Frisius Fonds, Jürgen Ingels, Limburgse Reconversie Maatschappij, Fortino Capital。 D square nv 成立于 2007年12月,总部位于比利时哈瑟尔特。当时由创始团队自掏腰包 13.5…

    2016-01-03
    0
  • 大数据/数据挖掘/推荐系统/机器学习相关资源

    摘要:分享大数据/数据挖掘/推荐系统等相关资源,小伙伴们还不赶紧收藏起来备用 书籍 各种书~各种ppt~更新中~ http://pan.baidu.com/s/1EaLnZ 机器学习经典书籍小结 http://www.cnblogs.com/snake-hand/archive/2013/06/10/3131145.html 机器学习&深度学习经典资…

    2016-01-01
    0
  • 通过数据挖掘手段分析网民的评价内容?

    作者:学飞 从坠落开始 本篇综述主要参考了Liu Bing的《Sentiment analysis and opinion mining》,增加了一些自己的观点。 Liu B. Sentiment analysis and opinion mining[J]. Synthesis Lectures on Human Language Technologies…

    2015-12-30
    0
  • 数据挖掘系列篇:在线机器学习FTRL算法介绍

    最近几个同事在做推荐平台的项目,都问到怎么实现FTRL算法,要求协助帮忙实现FTRL的算法模块。今天也是有空,赶紧来做个整理。明天还要去上海参加天善智能组织的FLY BI大数据分享会。有兴趣参加线下活动的可以多关注下微博和微信的信息。没事可以多参加分享分享。现在特别是像做在线学习和CTR这块,应用LR是最广泛的。但是批量处理超大规模的数据集和在线数据流时就遇…

    2015-12-25
    0
  • 数据挖掘系列篇:推荐系统综述以及美团推荐系统介绍

    其实推荐系统前面已经讲过不少,那时候主要是放在机器学习上讲的,既然这次要系统撸一遍数据挖掘,就把推荐系统单独拿出来说一说。相信如果做过推荐系统的人,都知道是什么回事。一堆features,一堆算法模型,一堆online、offline规则和计算,还有若干的场景。包括著名的netflix、Amazon做的推荐场景都有哪些,有哪些坑需要注意的,之前都有说过。没看…

    2015-12-23
    0
  • 考拉FM的个性化数据挖掘和处理

    提起FM类APP,你都会想起哪些应用程序?来自易观智库数据显示,2014年3月电台类应用月度活跃人数最高的APP仍是考拉FM。上线不到一年的考拉FM,为何发展如此之猛? 与其他移动端电台不同的是,考拉FM采用个性化推荐音频流的播放逻辑,在用户未进行主动选择的情况下依旧能够收听到心仪的节目。移动音频娱乐与大数据挖掘的结合会是怎样的爆发?几天前,在中国电子学会主…

    2015-12-23
    0
  • 数据挖掘系列篇:聚类算法概述

    本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。1.聚类 VS 分类 分类是“监督学习”,事先知道有哪些类别可以分。 聚类是“无监督学习”,事先不知道将要分成哪些类。 举个例子,比如苹果、香蕉、猕猴桃、手机、电话机。根据特征的不同,我们聚类会分为【苹果、香蕉、猕猴桃】为水果…

    2015-12-19
    0
  • 数据挖掘系列篇:Netflix机器学习系统的构建经验

    有很多很好的介绍机器学习的教科书和课程,,甚至可以学习一些最复杂的特定的方法或算法,理解这些理论是一个非常重要的基础和起点。还有很多构建真实系统的实际问题,你可能闻所未闻。这篇文章将分享一些Netflix多年来构建大型系统放的最重要的教训,Netflix是跨许多国家支持数以百万计的用户规模。(Netflix是在线视频网站,每晚视频流量占据全美互联网流量近1/…

    2015-12-18
    0
  • 数据挖掘算法:K 均值算法

    摘要:均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据为 (x, y) ,目标是找出分类边界,即对新的数据进行分类。而无监督式学习只给出一组数据集 ${x_1, x_2, … , x_m}$ ,目标是去找出这组数据的模式特征,比如哪些数据是一种类型的,哪些数据是另外一种类型的。典型…

    2015-12-16
    0
  • 数据挖掘系列篇:分类算法概述

    数据挖掘这块重点就是介绍算法和应用案例,还有相应的开发语言R、excel、mapreduce、spark。前面重点介绍了数据挖掘主要解决的几类问题,而分类问题是数据挖掘中的重头戏。 如果我们在高校里,常见的就是训练一群样本数据的特征,跑出模型,也不一定要关心它的上线模型调优的效果,也不一定要关心它的性能还有实际业务的情况。但我们在实际的业务过程中,作为算法工…

    2015-12-16
    0
  • 数据挖掘系列:用户画像之用户标签

    摘要:用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。 微博作为最大的中文社交媒体,拥有数以“PB”(1024 TB)计的用户信息,从海量的用户信息中发掘每个用户的社交特性、潜在能力及兴趣等信息,是微博为用户提供更…

    2015-12-04
    0
  • 数据挖掘系列篇之会员分析

    说到数据挖掘,就不得不说到会员分析。老生常谈的问题,包括会员分级、用户画像、会员个性化营销、会员价值挖掘等等。而现在围绕会员的运营模式也在发生着变化,从过去做产品,到现在做会员服务,从P到S的转变势必会需要介入数据来挖掘会员的特征、习惯、活跃、忠诚度等。凡是接触到会员分析这块,都会谈到会员分级和忠诚度这些话题。至于为什么从零售到金融,从线下到线上都在谈这个,…

    2015-12-04
    0
关注我们
关注我们
分享本页
返回顶部