R语言

  • R语言数据挖掘实战案例:电商评论情感分析

    随着网上购物的流行,各大电商竞争激烈,为了提高客户服务质量,除了打价格战外,了解客户的需求点,倾听客户的心声也越来越重要,其中重要的方式 就是对消费者的文本评论进行数据挖掘.今天通过学习《R语言数据挖掘实战》之案例:电商评论与数据分析,从目标到操作内容分享给大家。 本文的结构如下 1.要达到的目标 通过对客户的评论,进行一系列的方法进行分析,得出客户对于某个…

    2016-04-27
    0
  • MySQL连接到 R Excel 或SPSS

    2.然后同样在MySQL官网下载安装好MySQL ODBC连接程序(MySQL connector\ODBC)。 4.具体连接步骤参考如下动图。 步骤二 步骤四最前面的那个表名称是中文的,R对中文支持还不够好 (4)将数据库表中的数据读取出来并存入数据框。 city<-sqlFetch(wechat,”city”) 结果如下图所示: (2)连接到MyS…

    R 2016-04-26
    0
  • 到底该使用哪一种大数据编程语言:R、Python、Scala和Java

    说到处理大规模数据,R、Python、Scala和Java基本上都能满足你的要求。 你有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题…

    2016-04-26
    0
  • 银行推荐系统在生活中的应用案例解析

    介绍 日常生活中,推荐工作都是怎样开展的呢推荐来源于经验。假设现在有人需要你基于现实生活中的数据立刻作出推荐,你会怎样做呢首先,我们会感觉自己得像智能顾问一样聪明。其次,我们做的已经超出人类的能力范围了。因此,我们的目标就是建立智能软件,让它为我们提供值得信赖的推荐系统。 当我们访问亚马逊、Netflix、 imdb等许多网站时,我们的潜意识里已经接触到了一…

    2016-04-12
    0
  • 深入对比数据科学工具箱:Python和R之争

    概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型数据科学。 从工具上来看,按由业务到工程的顺序,这个两条是:EXCEL >> R >> Python &g…

    2016-04-10
    0
  • R语言构建配对交易量化模型

    我们可以通过“统计套利”的方法,发现市场的无效性。

    2016-04-05
    0
  • R的学习路径,从新手到专家的7个步骤

    摘要:如果你从来没有编程经验,也没有比较熟悉的统计软件,那么学习R可能会比较困难。这个学习路径主要针对新手。关于R有很多优秀资源,这里介绍的一些在线课程、书籍和更多让你尽快学会R。 纲要: 步骤1:你为什么要学习R 步骤2:安装 步骤3:了解R的语法 步骤4:R的核心->包 步骤5:帮助系统 步骤6:数据分析工作流程 6.1导入数据 6.2数据操作 6…

    2016-04-04
    0
  • 你的大数据项目使用的工具正确吗?

    摘要:工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具,并提供了调查的匿名原始数据。 通过主成分析(PCA)法进行降维分析 对所有的工具同时进行关系分析,常规来说,PCA通过对大样本数据统计性质(eg, 协方差)的分析,试图用主要特征来解释关系。 分析结果: 当前分析的目标:通过…

    2016-04-04
    0
  • 一篇文章透彻解读聚类分析及案例实操

    摘要:本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 聚类分析介绍 1.1 基本概念 聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相同聚类中的数据实例彼此相同,处于不同聚类…

    2016-04-02
    0
  • 你难道仅仅是个数据工具使用者吗?

    有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」…… 高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工具,使用工具是为了解决某种问题,而问题本身有往往有不同的场景(不可穷举),有可能你会用工具解决这个问题,却不会用工具解决另一个问题,所有前面说的「学会」,往往有伪命题的意味在里面。 更…

    2016-03-31
    0
  • 海纳百川 有容乃大:SparkR与Docker的机器学习实战

    题图为美国尼米兹核动力航空母舰 介绍 大数据时代,我们常常面对海量数据而头疼。作为学统计出身的人,我们想折腾大数据但又不想学习Hadoop或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一个航空母舰战斗群!不仅仅简化了分布式计算的操作,还简化了安装部署的环节,我们只几乎…

    2016-03-28
    0
  • 当数据分析遇上超级奶爸

    摘要:大数据分析与儿童健康的结合已经是一个广受欢迎的课题,在医疗等领域也多有成果。不过,数据分析能否应用在幼儿日常生活的监护中呢?本期我们推出的文章是由团队内新晋奶爸撰写的,他以切身体验回答了这个问题,有类似担忧的家长们可以直接学习哦~ 希望大家喜欢他的文章,也喜欢他最爱的小土豆! 晚上7点,全家人正在吃晚饭。 忽然“哇”地一声,20多天大的小土豆的哭声打破…

    2016-03-27
    0
  • 2015年度十大Plotly图形,图表以及可视化数据

    摘要:文章整理出了2015年最优秀的十个Plotly图表,这些交互式的图表使用Plotly的web app和APIs制作而成。 第十位. “2001-2014对同性婚姻的支持” 这些Tufte迷你图(sparklines)由Pew Research绘制。 制作这些图表运用了Python, R以及Plotly web app. 第九位. “在Facebook网…

  • R语言与非结构化数据共舞

    介绍 现代化数据科学中的 DataFrame 概念源起R语言,而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不过在实际的网络数据通讯中,类似DateFrame这样的格式却并不是主流,真正主流的方式其实是JSON(JavaScript Online Notation),所以讨论如何处理非结构化数据就变得非常有意义了。加之…

    2016-03-17
    0
  • 微软为Visual Studio发布R工具,免费开源且多项新功能

    摘要: 微软在今天发布了 Visual Stuido R 工具,结合了 R 语言和 Visual Studio 的功能,且完全免费和开源。 R语言无疑是当今统计学和数据分析中最为流行的一种编程语言,微软近日正式宣布了适用于Visual Stuido集成开发环境的R工具,它结合了R语言和Visual Studio的强大优势,以更加方便和易于使用的插件形式提供,…

    2016-03-15
    0
关注我们
关注我们
分享本页
返回顶部