数据挖掘算法

  • 考拉FM的个性化数据挖掘和处理

    提起FM类APP,你都会想起哪些应用程序?来自易观智库数据显示,2014年3月电台类应用月度活跃人数最高的APP仍是考拉FM。上线不到一年的考拉FM,为何发展如此之猛? 与其他移动端电台不同的是,考拉FM采用个性化推荐音频流的播放逻辑,在用户未进行主动选择的情况下依旧能够收听到心仪的节目。移动音频娱乐与大数据挖掘的结合会是怎样的爆发?几天前,在中国电子学会主…

    2015-12-23
    0
  • 世纪佳缘用户推荐系统演变的故事

    摘要:世纪佳缘用户推荐系统演变史 作为国内最大的婚恋交友系统,世纪佳缘近年来一直在大力发展互联网大数据相亲模式,从成立之初会员自己根据条件“大海捞针”的寻找,到现在的“懂你”系统、“人脸识别”系统,世纪佳缘的用户推荐系统正在一步步的完善和拓展,大数据相亲已经成为互联网婚恋交友网站的发展趋势。 世纪佳缘从2013年开始全力推进业务从PC端向移动端的转移,截至今…

    2015-12-23
    0
  • 数据挖掘系列篇:聚类算法概述

    本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。1.聚类 VS 分类 分类是“监督学习”,事先知道有哪些类别可以分。 聚类是“无监督学习”,事先不知道将要分成哪些类。 举个例子,比如苹果、香蕉、猕猴桃、手机、电话机。根据特征的不同,我们聚类会分为【苹果、香蕉、猕猴桃】为水果…

    2015-12-19
    0
  • 数据挖掘算法:K 均值算法

    摘要:均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据为 (x, y) ,目标是找出分类边界,即对新的数据进行分类。而无监督式学习只给出一组数据集 ${x_1, x_2, … , x_m}$ ,目标是去找出这组数据的模式特征,比如哪些数据是一种类型的,哪些数据是另外一种类型的。典型…

    2015-12-16
    0
  • 数据挖掘系列篇:分类算法概述

    数据挖掘这块重点就是介绍算法和应用案例,还有相应的开发语言R、excel、mapreduce、spark。前面重点介绍了数据挖掘主要解决的几类问题,而分类问题是数据挖掘中的重头戏。 如果我们在高校里,常见的就是训练一群样本数据的特征,跑出模型,也不一定要关心它的上线模型调优的效果,也不一定要关心它的性能还有实际业务的情况。但我们在实际的业务过程中,作为算法工…

    2015-12-16
    0
  • TalkingData数据科学家张夏天:算法是机器学习的核心

    日前,TalkingData首席数据科学家 张夏天在参加CSDN年度技术盛宴“SDCC 2015中国软件开发者嘉年华”时接受了CSDN软件研发频道的专访。

    2015-12-07
    0
  • 新浪微博的推荐算法简述

    在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以”facebook”为代表的社会化网络的兴起和以“淘宝“为代表的电商的繁荣,”选择“的时代已经来临,信息和物品的极大丰富,让用户如浩瀚宇宙中的小点,无所适从。推荐系统迎来…

    2015-11-29
    0
  • 数据挖掘案例:啤酒尿布的关联算法怎么来的?

    故事背景: 在一家超市中,通过大数据分析发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品的销售数据曲线竟然初期的相似,于是就将尿布与啤酒摆在一起。没想到这一举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实大数据案例。原来,美国的妇女通常在家照顾孩子,所 以她们经常会嘱咐丈夫在下班回家…

    2015-11-15
    0
  • 常用的十种数据挖掘算法介绍

    下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下) 1、基于历史的MBR分析(Memory-Based Reasoning;MBR) 基于历史的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(…

    2015-11-14
    0
  • 今日头条算法构架师:3亿用户每天的头条各不一样,靠数据是怎么做到的?

    摘要:11月8日,颠覆式创新研习社产品学院第一课登台,今日头条算法构架师曹欢欢,分享了头条如何用数据打磨产品。 曹欢欢说,今日头条现在有3亿的积累用户,日活用户超过三千万。这些用户,每天每个人的今日头条内容都不一样。头条会根据用户特征、场景和文章特征做个性化推荐,而这些推荐不靠编辑,靠技术算法。 演讲人|曹欢欢(今日头条算法构架师,国内对推荐产品理解最深刻的…

    2015-11-10
    1
  • 大数据技术贴:构建一个有指导的数据挖掘模型

    摘要:数据挖掘的目的,就是从数据中找到更多的优质用户。什么是有指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个有指导的数据挖掘模型,首先要理解和定义一些模型试图估计的目标变量。一个典型的案例,二元响应模型,如为直接邮寄和电子邮件营销活动选择客户的模型。模型的构建选择历史客户数据,这些客户响应了以前类似的活动。有指导数据挖掘的目的就是找到更多类似的客户,以提高未来活动的响应。

    2015-11-10
    0
  • 如何通过自学,成为数据挖掘“高手”?

    摘要:如何成为数据挖掘“高手”?先把最基础的概念操作学好,之后还要多参与实际项目,数据挖掘能力只能在项目实践的熔炉中提升、升华,所以跟着项目学挖掘是最有效的捷径。

    2015-11-07
    0
  • 寻英网依靠大数据算法,实现人才与企业职位精准匹配

    摘要:“寻英网”,一个大数据招聘平台,以大数据算法实现人才与企业职位的精准匹配,并辅助以 “职位需求一键同步至主流招聘网站” 等 HR 实用功能,帮助企业(尤其是中小企业)来做招聘这一摊子活。

    2015-11-07
    0
  • 数据挖掘之七种常用的方法

    利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。

    2015-11-02
    0
  • 统治世界的十大算法

    软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于 “皇冠上的珍珠” 呢?Marcos Otero 给出了他的看法。 什么是算法? 通俗而言,算法是一个定义明确的计算过程,可以一些值或一组值作为输入并产生一些值或一组值作为输出。因此算法就是将输入转为输出的一系列计算步骤。 —Thomas H. Cormen,Chales E. Leise…

    2015-10-31
    0
关注我们
关注我们
分享本页
返回顶部