数据工匠
-
短文本主题建模方法
许多数据分析应用都会涉及到从短文本中提取出潜在的主题,比如微博、短信、日志文件或者评论数据。
-
美国大选Facebook舆情分析——基于R
2016年7月27日,希拉里·克林顿顺利成为民主党总统候选人,这也意味着她将和之前成为共和党总统候选人的唐纳德·特朗普在11月份进行最终角逐。两位候选人在之前的五个月的网络口水仗,也使得各大社交平台异彩纷呈。
-
机器学习通用框架
每个数据科学家每天都要处理成吨的数据,而他们60%~70%的时间都在进行数据清洗和数据格式调整,将原始数据转变为可以用机器学习所识别的形式。
-
永不过时的K-Means算法
众所周知,数据挖掘算法并非十全十美,在某些情况下他们也会失效。 使用 K 均值算法(K-Means)时就可能会出现这种情况,当然此时你可以尝试一下另一种方法—— K 中心聚类算法(K-Medoids),也许效果会更好。
-
用R语言对混合型数据进行聚类分析
利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。
-
Python 中的可视化工具介绍
几周前,R语言社区经历了一场关于画图工具的讨论。对于我们这种外人来说,具体的细节并不重要,但是我们可以将一些有用的观点运用到 Python 中。
-
一个计算我的妻子是否怀孕的贝叶斯模型
在2015年的二月21日,我的妻子已经33天没有来月经了,她怀孕了,这真是天大的好消息!通常月经的周期是大约一个月,如果你们夫妇打算怀孕,那么月经没来或许是一个好消息。但是33天,这还无法确定这是一个消失的月经周期,或许只是来晚了,那么它是否真的是一个好消息?
-
如何成为一名数据科学家并得到一份工作
大数据科学家被认为是21世纪最性感的职业,且未来薪水优渥。其工资高达10万美金每年,而市场对最优秀的数据科学家的需求正强劲。另一方面,很多20世纪流行的工作将会因为机器人,人工智能和机器学习的发展而消失。那么,如何做才能确保自己得到这份性感的工作,成为一名数据科学家并被雇佣呢?
-
漫说为什么无法预测枪击案?
在发生了一系列的枪击案后,人们都想知道如何才能保护好自己。平时生活中是否存在一些需要留心的警告信息?如何判断某个人是否为精神病患者?他/她是否为极端主义分子?
-
亚马逊选品策略深度分析
用数据脉打造亚马逊上最火的商品。
-
一个自动化解决数据科学问题的python工具
机器学习中最乏味的部分就是调整超参数(简称调参)。
-
神经网络从被人忽悠到忽悠人(六)
引子 在求解神经网络权值过程中,有一个点是经常被人们遗忘的,神经网络的误差是收敛,也就是说渐渐的稳定到一个值里,这种过程类似于热力原理。符合一定的自然规律,是符合规律一个过程。如果把这个特性和神经网络结合,会产生什么效果呢? Hopfield网络 对于求权值的方法,之前的神经网络大部分采用的都是误差方式。这种方式比较直观明了,但求解的过程没有那么的方便。19…
-
神经网络从被人忽悠到忽悠人(五)
Vladimir Vapnik到底提出了什么理论能有这么大的影响呢?大家都非常熟悉的分类方法:支持向量机(SVM)
-
神经网络从被人忽悠到忽悠人(三)
bp神经网络虽然取得了很大的进步,但它本身存在着一些无法避免的问题,其中一个比较困惑的应该是局部最优解问题。
-
神经网络从被人忽悠到忽悠人(二)
70年代,神经网络的研究进入了萧条期,人工智能里产生了许多不同的方向,神经网络,好像被人们所忘记。