数据清洗是整个数据分析过程中一个非常重要的环节。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。本篇文章将介绍几种简单的使用R进行数据清洗的方法。
本篇文章介绍如何使用R读取并查看数据,包含一些最基础的函数使用方法和说明。后面还会陆续介绍数据清洗,匹配和提取等相关的操作。
编码问题是编程过程中最常遇见的问题之一,本文清晰地介绍了计算机编码的由来,以及如何处理乱码等技巧。
线性判别式分析(Linear Discriminant Analysis)简称LDA,是模式识别的经典算法。
R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)。
为什么你选择Python来进行机器学习?
散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。
本文由 Python 翻译组 最新翻译出品,原作者为 Michael Discroll,译者为 cystone,并由编程派作者 EarlGrey 校对。昨天,编程派已经发布了一篇多线程编程的教程,一文…
折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴。
数据可视化中,最常用的图非条形图莫属,它主要用来展示不同分类(横轴)下某个数值型变量(纵轴)的取值。
本篇文章介绍如何使用R语言中的这些函数进行假设检验。
本篇文章介绍如果使用R语言中的这些函数求解事件发生的概率。
本文将给出使用R语言进行数据塑型的一些基本的技巧,更多技术细节推荐参考《R语言核心手册》。
本文主要对ggplot2的可视化理念及开发套路做一个总体介绍,具体绘图方法(如折线图,柱状图,箱线图等)将在后面的文章中分别进行讲解。
支持向量机SVM(Support Vector Machine)是有监督的分类预测模型,本篇文章使用机器学习库scikit-learn中的手写数字数据集介绍使用Python对SVM模型进行训练并对手写…

关注我们的公众号

微信公众号