人工智能
-
基于朴素贝叶斯分类器的情感分析
朴素贝叶斯分类器基于词袋模型,通过词袋模型我们可识别出文本中出现的词属于积极还是消极,若这个词出现在积极的词语列表中,文本的总体分数 +1,若总体分数为正,该段文本被分类为积极,反之亦然。
-
可视化不确定网络的概率图布局方法
在不确定网络可视分析中,现有的方法往往直接在确定图(exact graph)中用视觉变量(visual variables)表示不确定信息。这些方法可以很好的将图的拓扑结构展示出来,但忽略了不确定信息的概率分布情况。
-
揭开机器学习的面纱
你周围的人是否都在谈论着“机器学习”?而你是否也听说过一些算法技术却仍旧缺乏一个全局的认识?本文也许就是一个好的起点……
-
GAN之父Ian Goodfellow在Quora:机器学习十问十答
近日,GAN之父Ian Goodfellow在Quora上举行了一年一度的live问答活动。不同于去年的独挑大梁,他今年还叫来了他在Google Brain的好基友Alexey Kurakin。本次互动吸引了将近2万Quora用户的参与,两人总共回答了网友提出的35个机器学习相关的问题。
-
猫奴的自我修养,教你如何用机器学习识别猫的品种
如何用机器学习算法能否判断猫的品种?
-
数据科学家Vs机器学习工程师
真正让“数据科学”发挥出了强大威力的,是在人们意识到,数据不仅止于精算统计、商业智能和数据仓库的时候。
-
机器学习技术——有监督学习
毫无疑问,机器学习技术将成为未来社会最重要的基础技术之一。
-
推荐系统主要算法总结及Youtube深度学习推荐算法实例概括
现如今,许多公司使用大数据来做超级相关推荐,并以此来增加收益。在海量推荐算法中,数据科学家需要根据商业限制以及需求来选择最佳算法。为使其简单化,Statsbot 团队为现有的主要推荐系统算法准备了一份概述。
-
深度学习可视化工具大盘点
本文主要基于ICML可视化的workshop和查到的相关论文,分享一下提到的一些先进的可视化概念和方法。
-
如何解决机器学习中的数据不平衡问题?
作者:章华燕 在机器学习任务中,我们经常会遇到这种困扰: 数据不平衡问题。 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。 本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路…
-
数据采集:人工智能的基础服务 | 创业方向的研究与思考
这是一个数据驱动商业发展的时代。 数据的挖掘和分析不再只是 BAT 大公司的专属,其正逐步成为广大中小企业的基础需求,而且日趋迫切。并且数据挖掘的技能也随着网络爬虫的普及,云计算的计算能力的提高,机器学习算法的发展,逐渐变得平民化。广大的中小企业也可以基于数据驱动,提供更好的服务与产品,从而取得更大的发展。 数据挖掘其实是一个很大的概念,本文主要探讨其中的“…
-
这11个观点可能会让你和深度学习擦肩而过
作者:Carlos E. Perez 我大部分走路的时间还有睡梦中的潜意识里都会琢磨着Deep Learning 的问题。Peter Thiel 有一个很有名的说法——“最后一个公司的优势”。意思是你可能不需要具备“第一启动的优势”,但是你一定要成为你行业里最后一个站着的公司。就像 Google有可能是最后一个搜索引擎公司,Amazon有可能是最后一个做电商…
-
从头开始:用Python实现随机森林算法
拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱。bagging(bootstrap aggregating 的缩写)算法从训练数据的样本中建立复合模型,可以有效降低决策树的方差,但树与树之间有高度关联(并不是理想的树的状态)。 随机森林算法(Random forest algorithm)是对 bagging 算…
-
机器学习的实现依赖于数据
大数据、分析、物联网、云技术……最近的几年里,没有这些术语你就无法参与到关于科技的讨论和对话中。它们已经成了科技中主要的参与者,影响着商务的方方面面。变化似乎正在以极快的速度发生着,并且没有减速的迹象。 如今,科技中唯一不变的就是变化本身了。不断的变化需要不断的创新,因此就需要引入更多的新技术。进入科技话题的新技术之一是机器学习。加特纳指出机器学习是2016…
-
基于CFTC持仓报告的机器学习模型
来源:The Journal of Financial Data Science Summer 2021 作者:Oleksandr Proskurin 标题:Does the CFTC Report Have Predictive Power: Machine Learning Approach 核心观点 基于CFTC的COT持仓报告构建特征,应用随机森林模…