数据挖掘

  • 数据挖掘之七种常用的方法

    利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。

    2015-11-02
    0
  • 我的数据挖掘之路——从菜鸟到实战

    导读:作者wrchow是浙江大学计算机硕士,通过自己的努力终于拿到了心仪的offer(搜狗Web数据挖掘助理研究员),实现了从事互联网数据挖掘的梦 想。他对数据挖掘这个行业的兴趣,以及为了进入这个行业所做的准备和努力,非常值得想进入这一行业的在校生或朋友们参考。

    2015-11-02
    0
  • 统治世界的十大算法

    软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于 “皇冠上的珍珠” 呢?Marcos Otero 给出了他的看法。 什么是算法? 通俗而言,算法是一个定义明确的计算过程,可以一些值或一组值作为输入并产生一些值或一组值作为输出。因此算法就是将输入转为输出的一系列计算步骤。 —Thomas H. Cormen,Chales E. Leise…

    2015-10-31
    0
  • 腾讯防刷负责人:基于用户画像大数据的电商防刷架构

    颜国平,腾讯云-天御系统研发负责人。 一直负责腾讯自有验证码、业务安全、防刷、账号安全等研发工作。 内部支持的产品(游戏、电商、腾讯投资的O2O企业)非常广泛。 在业务安全领域项目经验丰富,并且具备深度学习、大数据架构搭建等实战经验。 一、背景介绍 最近1~2年电商行业飞速发展,各种创业公司犹如雨后春笋大量涌现,商家通过各种活动形式的补贴来获取用户、培养用户…

    2015-10-30
    0
  • 如何系统地学习数据挖掘?

    问题:如何系统地学习数据挖掘? 虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法..,感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据挖掘系统的学习过程是怎么样的,应该看那些书(中文最好) 回答者:Han Hsiao,发现隐藏的价值 数据挖掘:What?Why?…

    2015-10-28
    0
  • 数据挖掘十大经典算法及各自优势

    国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十…

    2015-10-27
    0
  • 数据挖掘算法与生活中的应用案例

    如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘的知识,你,或许会有柳暗花明的感觉。

    2015-10-27
    0
  • 从拉勾网招聘数据,来看看中国数据挖掘人才挣多少钱?

    说在前面:缘起是因为数据挖掘入行不久,一直上拉勾网看各种公司的招聘JD,人工看一方面是时间很消耗,更严重的是抓不住重点,最近刚好入手python爬虫,试图简化这部分工作。另一方面学习爬虫之后,发现自己整天上网手动翻网页找信息这个动作很low,所以花了两天的时间连爬取带写文档。文档中同时附上github代码,各位想上手python的童鞋可以下载玩一下,(自知代…

    2015-10-26
    0
  • 数据挖掘的聚类算法有哪些,各有什么优势?

    比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异) 可以参照一下sklearn网站给出的列表:2.3. Clustering 除了这些聚类方法以外,统计老师讲过一些传统的聚类方法,归属于系统聚类的范畴,先定义观测间的距离和类之间的距离计算方法,然后按照距离把最接近的…

    2015-10-24
    0
  • 点击流中的非结构化数据——文本挖掘应用实例

    本篇介绍的是点击流中的非结构化数据的文本挖掘应用——当然,核心还是如何更好的应用这些非结构化数据。

    2015-08-31
    0
  • 数据挖掘从入门到进阶,要看什么书?

    数据挖掘从入门到进阶,经典图书推荐!

    2015-08-25
    0
  • 我一如既往热爱大数据与分析的6个原因

    必须承认,一开始我在印度理工学院罗克分校学习工程学时,我还没有关注大数据分析。起初我还是一张白纸,把课程学得一团糟。很快我便对我的常规课程失去了兴趣,取而代之的是开始参加其他项目。我参与的第一个与处理大数据有关的活动是美国运通组织的一场竞赛。由于我对这个活动一见钟情,我甚至从事了清理数据这一差事。不久,我便沉浸在学习编程语言和编码中。今天,我很幸运地说,我找…

    2015-08-08
    0
  • 基于贝叶斯生存分析的《冰与火之歌》人物死亡率分析

    《冰与火之歌》书迷遍布全球。该小说凭借其丰富的人物设置受到广大书迷青睐。然而,在马丁( Martin )笔下,无论好人、坏人,主角、配角都难逃命运的捉弄。除不计其数的无名小卒外,马丁的世界里有916位有名字的角色,其中三分之一都已以各种方式结束了自己在小说中的生命。本文中,我们将进一步探究小说人物的死亡模式,建立贝叶斯生存模型来预测各角色的死亡概率。

    2015-06-23
    0
  • 面向程序员的数据挖掘指南8:聚类分析

    前几章我们学习了如何构建分类系统,使用的是已经标记好类别的数据集进行训练: 训练完成后我们就可以用来预测了:这个人看起来像是篮球运动员,那个人可能是练体操的;这个人三年内不会患有糖尿病。 可以看到,分类器在训练阶段就已经知道各个类别的名称了。那如果我们不知道呢如何构建一个能够自动对数据进行分组的系统比如有1000人,每人有20个特征,我想把这些人分为若干个组…

    2015-05-08
    0
  • 面向程序员的数据挖掘指南7:朴素贝叶斯和文本数据

    非结构化文本的分类算法 在前几个章节中,我们学习了如何使用人们对物品的评价(五星、顶和踩)来进行推荐;还使用了他们的隐式评价——买过什么,点击过什么;我们利用特征来进行分类,如身高、体重、对法案的投票等。这些数据有一个共性——能用表格来展现: 因此这类数据我们称为“结构化数据”——数据集中的每条数据(上表中的一行)由多个特征进行描述(上表中的列)。而非结构化…

    2015-05-07
    0
关注我们
关注我们
分享本页
返回顶部