数据挖掘

  • 一篇文章告诉你机器学习的发展史

    摘要:最近,我们听到了关于机器学习的很多新闻,这部分是由不断增长的需求和缺少数据科学家们所激发的。但像许多创新一样,机器学习并不是简单出现的 ,它至少发展了二十年。在这篇文章中,我们简要地回顾一下这段历史。 在成功地推出Unica系列营销自动化软件之前,这家公司的主要业务是通过特别关注神经网络进而进…

    2016-04-04
    0
  • 一篇文章透彻解读聚类分析及案例实操

    摘要:本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 聚类分析介绍 1.1 基本概念 聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似…

    2016-04-02
    0
  • 推荐系统算法初探

    0. 序言 最近因为PAC平台自动化的需求,开始探坑推荐系统。这个乍一听去乐趣无穷的课题,对于算法大神们来说是这样的: 而对于刚接触这个领域的我来说,是这样的: 在深坑外围徘徊了一周后,我整理了一些推荐系统的基本概念以及一些有代表性的简单的算法,作为初探总结,也希望能抛砖引玉,给同样想入坑的伙伴们提…

    2016-03-31
    0
  • 如何做数据分析挖掘—以电信行业为例

    摘要:本文以电信行业为例讲述如何做数据分析挖掘。 来源:豪研呓语

    2016-03-28
    1
  • 数据挖掘问答精选收藏

    1.现在有大数据、精准挖掘、人工智能等这么多概念及技术,它们之间的关系以及企业大数据实施的路线图应该是怎样的?来自用户 SmartMining 的回答: 大数据、数据挖掘、人工智能三者的关系可以简单的理解为:大数据是原材料,数据挖掘是加工厂,而人工智能是数据产品尤其是基于数据挖掘技术建立的专家系统的…

    2016-03-24
    0
  • 揭开大数据测试的神秘面纱

    一、前言 在大数据时代,数据挖掘,人工智能,机器学习这一系列高大上的技术应运而生,针对这一系列高大上的系统,测试同学如何参与其中,做好质量把控呢?与我们熟悉的测试套路又有何不同呢?欲知详情,请听笔者细细道来。 二、背景知识介绍 模式识别:是目的,就是通过计算机用数学技术方法来研究模式的自动处理和判读…

    2016-03-24
    0
  • 协同过滤推荐算法的原理及实现

    协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filterin…

    2016-03-23
    0
  • 决策树分类和预测算法的原理及实现

    摘要:决策树是一种通过对历史数据进行测算实现对新数据进行分类和预测的算法。简单来说决策树算法就是通过对已有明确结果的历史数据进行分析,寻找数据中的特征。并以此为依据对新产生的数据结果进行预测。 决策树由3个主要部分组成,分别为决策节点,分支,和叶子节点。其中决策树最顶部的决策节点是根决策节点。每一个…

    2016-03-21
    1
  • 京东打造风控“天网”,大数据让刷单无处遁形

    摘要:现如今,网购已经成为人们生活中的重要消费习惯,然而因为商品看得见、摸不着,用户只能透过店铺信誉、成交量、买家评价等信息来判断店家是否“靠谱”。这些数据会形成用户对商家信赖度的重要影响,直接决定是否在该店铺进行消费。这些本应是真实体现商家经营状况的数据,却出现了大量的造假行为——雇人通过虚假交易…

    2016-03-19
    0
  • 海量数据挖掘最优解?机器学习!

    摘要:机器学习是大数据挖掘的一大基础,本文以机器学习为切入点,分享达观在大数据技术实践时的一些经验。 大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺诈交易监测等等。 互联网的海量数据不可能…

    2016-03-18
    0
  • 漫谈:机器学习和数据挖掘中一些常见的距离公式和相似性度量方法

    在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满…

    2016-03-16
    0
  • 大嘴巴漫谈数据挖掘:外部调研看态度,主观客观双结合

    在具体的研究过程中,分为外部调研和内部数据分析两个过程。 外部调研包括用户消费习惯和使用态度的研究,一是通过搜集用户基本属性信息以及使用产品的行为偏好信息来了解用户对产品的认知程度;二是通过搜集用户使用产品的反馈信息来了解用户对产品各方面的评价。 内部数据分析方法主要用来目标用户识别,依照用户的产品…

    2016-03-15
    0
  • 不会写代码也要做增长黑客–产品经理常用数据分析工具

    摘要:最近增长黑客比较热,产品经理也想变身增长黑客推动产品快速发展,但自己又不会写代码,很多创新无法实现,工欲善其事必先利其器,给大家介绍一下我在创业公司常用的工具,今天主要是跟数据有关的。 一、数据收集 1、网站&APP统计–Google Analytics(GA) 2、竞品网…

    2016-03-14
    0
  • 机器学习必备的7项技能包

    摘要:机器学习经常与人工智能紧密相连,在不考虑显式编程的情况下,机器学习可以使计算机具备完成特定任务的能力,例如识别,诊断,规划,机器人控制和预测等。它往往聚焦于算法创新,即在面对新数据时,其自身能够发生演化。 在某种程度上,机器学习与数据挖掘很相似。它们都是通过数据来获取模式。然而,与人类可理解的…

    2016-03-13
    0
  • 数据科学极简史(二)

    2002 年 4 月,数据科学期刊(Data Science Journal)创刊,旨在发表「科学与技术领域的数据与数据库管理」方面的论文。「此期刊涵盖对于数据系统的描述,及其在互联网上的发布、应用和法律问题。」此期刊由国际科学理事会(International Council for Scienc…

    2016-03-10
    0
发表文章
意见反馈
意见反馈
分享本页
返回顶部