Python

使用python训练贝叶斯模型预测贷款逾期-数据分析网

使用python训练贝叶斯模型预测贷款逾期

蓝鲸阅读(204)

朴素贝叶斯(Naive Bayes)是一种简单的分类预测模型,本篇文章将使用机器学习库scikit-learn中的Gaussian Naive Bayes算法对贷款历史数据进行建模。并通过模型对新贷款用户的逾期情况进行模拟预测。

使用PCA对特征数据进行降维-数据分析网

使用PCA对特征数据进行降维

蓝鲸阅读(126)

PCA(Principal Component Analysis)是机器学习中对数据进行降维的一种方法。主要目的是在不丢失原有数据信息的情况下降低机器学习算法的复杂度,及资源消耗。本篇文章将使用python对特征进行降维。

使用scikit-learn进行特征选择-数据分析网

使用scikit-learn进行特征选择

蓝鲸阅读(384)

scikit-learn中提供了用于特征选择的模块feature_selection,主要方法包括方差移除法,卡方检验法,基于L1的特征选择和基于树的特征选择。

用Python进行梯度提升算法的参数调整-数据分析网

用Python进行梯度提升算法的参数调整

数据工匠阅读(517)

提升算法(Boosting)在处理偏差-方差权衡的问题上表现优越,和装袋算法(Bagging)仅仅注重控制方差不同,提升算法在控制偏差和方差的问题上往往更加有效。在这里,我们提供一个对梯度提升算法的透彻理解,希望他能让你在处理这一问题上更加...