搜索:数据挖掘

  • 领英宣布开源数据挖掘软件WhereHows

    摘要:领英称即将开源他们内部的应用软件WhereHows,一个企业级的数据挖掘软件。 准确的说,领英称它为“数据发现软件”。从商业角度讲,WhereHows的目标是从分布式的多种元数据中进行挖掘。 据领英发布的资料显示,WhereHows已经挖掘了50,000条数据集,14,000条评论和35,000,000个工作机会,多达15PB的数据。 在一篇博客中,领…

    2016-03-09
    0
  • 统计学和数据挖掘的异同探讨

    1. 简介 统计学和数据挖掘有着共同的目标:发现数据中的结构。事实上,由于它们的目标相似,一些人(尤其是统计学家)认为数据挖掘是统计学的分支。这是一个不切合实际的看法。因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科,例如数据库技术和机器学习,而且它所关注的某些领域和统计学家所关注的有很大不同。 统计学和数据挖掘研究目标的重迭自然导致了迷惑。…

    2016-03-03
    0
  • 以性别预测为例,谈谈数据挖掘中的分类问题

    摘要:互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘基本的处理流程,以性别预测实例来讲解一个具体的数据挖掘任务是如何实现的。 数据挖掘的基本内容 首先,对于数据挖掘的概念,目前比较广泛认可的一种解释如下: Data mining is the use o…

    2016-03-02
    0
  • 融资1000万!他们是世界数据大赛冠军,已为15家企业提供数据挖掘应用服务

    前几年,外界关于大数据的讨论沸沸扬扬。不过在陈运文(以下简称陈)看来,这些讨论雷声大雨点小,落实到应用层面的并不多。 那个时候,陈还是盛大创新院的成员,在院长陈大年的召集下,这里聚集了众多陈景仰的计算机人才,如潘爱民、陆坚博士等。在创新院里,负责数据挖掘的他还结识了许式伟、季昕华、黄伟等技术牛人。 进入2015年以后,有一段时间,生活安逸的陈觉得有些彷徨。与…

    2016-03-01
    0
  • 如何做好数据挖掘与数据建模的9条经验总结

    数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的…

    2016-02-29
    0
  • 空间数据挖掘认识及其思考

    摘 要: 在这个大数据时代,空间数据正在从各个领域飞速累计。空间数据挖掘作为数据挖掘的一部分,现已成为人们研究空间数据的重点学科。主要介绍了空间数据挖掘的基本概念、一般步骤及其最新的挖掘方法,表达了对当前空间数据挖掘的看法。最后对未来空间数据挖掘的研究方向进行了更加深入的探讨。 0 引言 空间数据挖掘(Spatial Data Mining,SDM)即找出开…

    2016-02-28
    0
  • 大嘴巴漫谈数据挖掘:问卷测试评分项,测试结果分析中

    在产品试商用的定量测试结果分析中,首先通过实际数据展示了产品下载安装成功率的具体情况。如上所示,可以看出,其中有90%的测试用户安装成功,有10%的测试用户出现了问题,而安装不成功主要归咎于三种情况,应重点关注并及时改进完善。   接下来的产品偏好评价方面,如上所示,最上面描述了影响产品各个指标的体验得分及权重。纵坐标表示各个指标的重要性程度,横坐…

    2016-02-25
    0
  • Salesforce 收购 PredictionIO,加强自身机器学习和数据挖掘能力

    Salesforce 正式对外宣布收购 PredictionIO,用于增强自己在机器学习和大数据分析方面的能力。 Prediction IO 于 500 Satrtups 毕业,在 2014年 拿到了 250 万美元的种子轮融资,投资人包括投资了 VMWare 的 Azure Capital,StartX 基金等。 其 CEO 兼创始人 Simon Chen…

    2016-02-22
    0
  • 大嘴巴漫谈数据挖掘:深入评价需定量,问卷测试评分项

    通过定性研究,深入了解用户的产品使用行为、探索归纳出使用过程中遇到的障碍和问题,并对这些问题作出详细合理的解释,为随后的定量分析做准备。 结合定性研究总结出的主要问题,定量分析通过结构化的问卷调研了解用户的行为特征,如用户下载安装、使用地点、使用频率,以及对产品功能、价格和名称等方面的评价,并进行量化确认。 定量分析中,一般会借助电话访问结合问卷调研来获取用…

    2016-02-22
    0
  • 数据挖掘的常用方法、功能和一个聚类分析应用案例

    摘要:笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,将其示例教程结合自己的体会作为文章的第三部分。 一、数据挖掘的常用方法 利用数据挖掘进行数据…

    2016-02-20
    0
  • 如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例

    “如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它…

    2016-02-18
    0
  • 大嘴巴漫谈数据挖掘:用户招募选样本,发现问题给建议

    下面通过一个实际产品例子来描述可用性测试的整个实施过程,即按照任务流程总结归纳某一电子书城网站的可用性问题,统计各个情境下可用性问题的出现和分布状况,发现高优先级的可用性问题并给出改进建议,以及根据测试结果列出衡量可用性问题的对比指标。其中的测试内容包括针对网站的注册,电子书的试读、购买和赠送。 用户招募是可用性测试中的一个重要环节,且具有一定难度。为了达到…

    2016-02-05
    0
  • 大嘴巴漫谈数据挖掘:试用产品商用前,定性研究分用户

    与可用性测试不同,接下来的试商用测试选取的是产品的真实用户,能够根据用户自发的业务使用行为,获取更为客观且具有实际参考意义的用户反馈,并在产品正式投放市场前尽可能多地修正发现的问题。但有时与最终上市产品相比,在某些方面还会有一定程度的限制,比如使用场所、订购渠道等。 产品试商用时,测试研究通常需要测试用户对产品进行综合评价,汇总产品各个方面的用户反馈信息,一…

    2016-02-05
    0
  • 大嘴巴漫谈数据挖掘:结果分析看指标,完成时间完成率

    在用户数据统计分析中,指标任务完成率和任务完成时间意指根据产品实际情况积累出的参考值,从而作为横向比较指标。通常会将所有任务的任务完成率取平均值,则可得到针对某项产品的平均任务完成率,同理也可得到平均任务完成时间。如上所示,在情境1的任务1.1里,有10%的测试用户未完成任务;有5人的任务完成时间小于平均值,4人的任务完成时间大于平均值。 如上所示,在不同的…

    2016-02-04
    0
  • 大嘴巴漫谈数据挖掘:产品商用需测试,可用测试验原型

    第四时期产品测试是在新产品开发完成以后,为了获取用户对产品的功能、性能等方面的评价,通常会事先邀请符合目标用户特征的潜在用户试用该产品,以便进一步完善和改进产品。 产品测试包括可用性测试和试商用两个步骤。可用性测试意指通过检测产品原型的可用性,来了解用户使用产品的具体情况。试商用则是指将完成可用性测试的新产品小范围投入市场,提供给真实用户使用及体验。 一般来…

    2016-02-03
    0
关注我们
关注我们
分享本页
返回顶部