软件工具

使用python训练贝叶斯模型预测贷款逾期-数据分析网

使用python训练贝叶斯模型预测贷款逾期

蓝鲸阅读(204)

朴素贝叶斯(Naive Bayes)是一种简单的分类预测模型,本篇文章将使用机器学习库scikit-learn中的Gaussian Naive Bayes算法对贷款历史数据进行建模。并通过模型对新贷款用户的逾期情况进行模拟预测。

使用PCA对特征数据进行降维-数据分析网

使用PCA对特征数据进行降维

蓝鲸阅读(126)

PCA(Principal Component Analysis)是机器学习中对数据进行降维的一种方法。主要目的是在不丢失原有数据信息的情况下降低机器学习算法的复杂度,及资源消耗。本篇文章将使用python对特征进行降维。

使用scikit-learn进行特征选择-数据分析网

使用scikit-learn进行特征选择

蓝鲸阅读(384)

scikit-learn中提供了用于特征选择的模块feature_selection,主要方法包括方差移除法,卡方检验法,基于L1的特征选择和基于树的特征选择。

使用R进行数据提取-数据分析网

使用R进行数据提取

蓝鲸阅读(498)

本篇文章介绍如何通过R按特定的维度或条件对数据进行提取,完成数据提取需求。

使用R进行数据匹配-数据分析网

使用R进行数据匹配

蓝鲸阅读(461)

R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。