搜索:聚类分析

  • 空间数据挖掘认识及其思考

    摘 要: 在这个大数据时代,空间数据正在从各个领域飞速累计。空间数据挖掘作为数据挖掘的一部分,现已成为人们研究空间数据的重点学科。主要介绍了空间数据挖掘的基本概念、一般步骤及其最新的挖掘方法,表达了对当前空间数据挖掘的看法。最后对未来空间数据挖掘的研究方向进行了更加深入的探讨。 0 引言 空间数据挖掘(Spatial Data Mining,SDM)即找出开…

    2016-02-28
    0
  • 如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例

    “如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它…

    2016-02-18
    0
  • 近200篇机器学习、深度学习资料分享

    摘要:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。 《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning. 《De…

    2016-02-15
    0
  • 优秀大数据GitHub项目一览

    VMware CEO Pat Gelsinger曾说:数据科学是未来,大数据分析则是打开未来之门的钥匙 企业正在迅速用新技术武装自己以便从大数据项目中获益。各行业对大数据分析人才的需求也迫使我们升级自己的技能以便寻找更好的职业发展。 跳槽之前最好先搞清楚一个岗位会接触到的项目类型,这样你才能掌握所有需要的技能,工作的效率也会更高。 下面我们尽量列出了一些流行…

    2016-01-20
    0
  • 大嘴巴漫谈数据挖掘:用户调查基样本,街头面访寻偏好

    随后的定量分析以定性研究为基础,基于一定数量样本,对用户的行为和态度进行分析挖掘,细分出不同特征的用户群体,并加以描述。此处采用了一种叫街头面访的分析方法,即在一个相对固定、安静适宜的场所环境内,开展一个较长时间的访问。 接下来先要进行样本筛选及确定问卷结构。样本筛选主要是确定样本量和抽样方法,问卷结构则包括需要调研的各个方面,如生活轨迹、需求偏好等。 在样…

    2016-01-20
    0
  • 数据挖掘必须要具备知识结构类型

    一、概念/类描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。 特征性描述:是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征。生成一个类的特征性描述只涉及该类对象中所有对象的同性。。 区别性描述:描述两个或者更多不同类对…

    2016-01-12
    0
  • 几则趣味的统计小故事,你秒懂了吗?

    很多人在学习统计时都认为统计由一系列枯燥的数字、公式和图表组成,十分繁杂无味。然而随着对这门课的深入理解,不知不觉中会逐渐体会到统计的趣味性。这里,挑选几则经典的统计趣味小故事与大家分享,希望大家喜欢。 《红楼梦》作者考证 众所周知,《红楼梦》一书共120回,自从胡适作《红楼梦考证》以来,一般都认为前80回为曹雪芹所写,后40回为高鹗所续。然而长期以来这种看…

    2015-12-21
    0
  • 数据挖掘系列篇:聚类算法概述

    本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。1.聚类 VS 分类 分类是“监督学习”,事先知道有哪些类别可以分。 聚类是“无监督学习”,事先不知道将要分成哪些类。 举个例子,比如苹果、香蕉、猕猴桃、手机、电话机。根据特征的不同,我们聚类会分为【苹果、香蕉、猕猴桃】为水果…

    2015-12-19
    0
  • 数据分析基础内容介绍:模型、工具、统计、挖掘与展现

    1. 数据分析多层模型介绍 这个金字塔图像是数据分析的多层模型,从下往上一共有六层: 底下第一层称为Data Sources 元数据层。 比如说在生产线上,在生产的数据库里面,各种各样的数据,可能是银行的业务数据,也可能是电信运营商在交换机里面采集下来的数据等等,然后这些生产的数据通过ETL,是英文 Extract-Transform-Load 的缩写,用来…

    2015-12-19
    0
  • 数据挖掘算法:K 均值算法

    摘要:均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据为 (x, y) ,目标是找出分类边界,即对新的数据进行分类。而无监督式学习只给出一组数据集 ${x_1, x_2, … , x_m}$ ,目标是去找出这组数据的模式特征,比如哪些数据是一种类型的,哪些数据是另外一种类型的。典型…

    2015-12-16
    0
  • 非结构化数据分析公司Taste Analytics

    Taste Analytics 公司位于美国硅谷,是一家基于数据驱动的可视化分析公司。它在做的事情就是把任何可以转化成文字的信息,通过机器深度学习来进行自动的挖掘,然后再通过图像可视化给用户展示出去。要理解清楚 Taste Analytics,就要知道它服务的对象不是企业的 IT、数据库,而是商业人员,例如市场营销,客服、信息洞察员、产品优化改进设计人员等。…

    2015-12-11
    0
  • 数据分析系列篇:数据分析方法论

    掌握了excel、spss、sas、r这些分析工具之后,我们来了解下数据分析的基本方法论,其实数据分析方法不复杂,我们需要把一些核心的分析方法掌握了活学活用。 重点包括两块,一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等; 一块是营销管理常用分析方法论:SWOT、4P、PE…

    2015-12-06
    1
  • 移动互联网应用数据分析基础体系

    在2012年及2013年诸多大型互联网公司其移动端的流量已经超越PC端的流量,很多大型互联网企业PC业务用户往移动端迁移,呈现出PC业务增长放缓,移动业务增长迅速的态势。从第三方数据机构统计的数据来看,网民中使用手机上网的人群占比进一步提升,由2013年12月的81.0%提升至2015年6月的88.9%,即中国网民中,接近9成的用户在使用手机上网,达到接近6…

    2015-11-30
    0
  • 新浪微博的推荐算法简述

    在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以”facebook”为代表的社会化网络的兴起和以“淘宝“为代表的电商的繁荣,”选择“的时代已经来临,信息和物品的极大丰富,让用户如浩瀚宇宙中的小点,无所适从。推荐系统迎来…

    2015-11-29
    0
  • 从BAT了解数据化运营体系

    摘要:从BAT了解数据化运营体系 过去的运营体系弊端: 过去运营的方式存在几个比较严重的问题:1)运营模式比较单一,很难适应互联网快速变化的节奏,不能及时根据市场和用户的变化作出调整。比如双十一、828、双12、黑色星期五等;2)摸不清自己的用户,不清楚自己产品的老用户是谁、什么习惯,也没有针对的运营来拉动新用户,导致最后很难挽留住用户。比如我做移动电台,我…

    2015-11-22
    0
关注我们
关注我们
分享本页
返回顶部