数据工匠
数据工匠

主页: http://datartisan.com/

简介:厦门数析信息科技有限公司(品牌:数据工匠)成立于2014年10月14日。公司主要提供数据分析服务与产品,具体内容包括对企业与政府机构提供大数据咨询;平台级的通用化数据分析产品(软件)开发。

用Python进行梯度提升算法的参数调整-数据分析网
Python

用Python进行梯度提升算法的参数调整

数据工匠阅读(534)

提升算法(Boosting)在处理偏差-方差权衡的问题上表现优越,和装袋算法(Bagging)仅仅注重控制方差不同,提升算法在控制偏差和方差的问题上往往更加有效。在这里,我们提供一个对梯度提升算法的透彻理解,希望他能让你在处理这一问题上更加...

美国大选Facebook舆情分析——基于R-数据分析网
R语言

美国大选Facebook舆情分析——基于R

数据工匠阅读(554)

2016年7月27日,希拉里·克林顿顺利成为民主党总统候选人,这也意味着她将和之前成为共和党总统候选人的唐纳德·特朗普在11月份进行最终角逐。两位候选人在之前的五个月的网络口水仗,也使得各大社交平台异彩纷呈。

机器学习通用框架-数据分析网
机器学习

机器学习通用框架

数据工匠阅读(848)

每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调整,将原始数据转变为可以用机器学习所识别的形式。

永不过时的K-Means算法-数据分析网
数据挖掘

永不过时的K-Means算法

数据工匠阅读(758)

众所周知,数据挖掘算法并非十全十美,在某些情况下他们也会失效。 使用 K 均值算法(K-Means)时就可能会出现这种情况,当然此时你可以尝试一下另一种方法—— K 中心聚类算法(K-Medoids),也许效果会更好。

Python 中的可视化工具介绍-数据分析网
Python

Python 中的可视化工具介绍

数据工匠阅读(1310)

几周前,R语言社区经历了一场关于画图工具的讨论。对于我们这种外人来说,具体的细节并不重要,但是我们可以将一些有用的观点运用到 Python 中。