张乐
-
数据可视化入门:六种基本图表的特点和适用场合
摘要:”数据可视化”可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。 用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据…
-
如何研究学习一个机器学习算法?
摘要:机器学习算法都是一个个复杂的体系,需要通过研究来理解。学习算法的静态描述是一个好的开始,但是这并不足以使我们理解算法的行为,我们需要在动态中来理解算法。 机器学习算法的运行实验,会使你对于不同类型问题得出的实验结论,并对实验结论与算法参数两者的因果关系有一个直观认识。 在这篇文章中,你将会知道…
-
基于Spark的异构分布式深度学习平台
导读:本文介绍百度基于Spark的异构分布式深度学习系统,把Spark与深度学习平台PADDLE结合起来解决PADDLE与业务逻辑间的数据通路问题,在此基础上使用GPU与FPGA异构计算提升每台机器的数据处理能力,使用YARN对异构资源做分配,支持Multi-Tenancy,让资源的使用更有效。 深…
-
甲方?乙方?-数据分析师的职业选择
未来我想做数据分析师,是去甲方公司比较好,还是乙方公司比较好? 最近几个要转行或毕业的朋友都谈起这个话题,作为一个未来的数据分析师,这是个需要面对的问题。数据分析师在甲方和乙方的职能有所不同,各有特点,同时近些年也在不断发展变化。 1.甲方是甲方,乙方是乙方 乙方一般指提供数据分析服务的企业,较早的…
-
使用Python和Perl绘制北京跑步地图
摘要:当你在一个城市,穿越大街小巷,跑步跑了几千公里之后,一个显而易见的想法是,如果能把在这个城市的所有路线全部画出来,会是怎样的景象呢? 文章代码比较多,为了不吊人胃口,先看看最终效果,上到北七家,下到南三环,西到大望路,东到首都机场。二环32公里,三环50公里,这是极限,四环先暂时不考虑了。。。…
-
用Python写一个简单的微博爬虫
我是个微博重度用户,工作学习之余喜欢刷刷timeline看看有什么新鲜事发生,也因此认识了不少高质量的原创大V,有分享技术资料的,比如好东西传送门;有时不时给你一点人生经验的,比如石康;有高产的段子手,比如银教授;有黄图黄段子小能手,比如阿良哥哥 木木萝希木 初犬饼… 好吧,我承认,爬黄…
-
让数据和用户服务于你的运营
【摘要】 什么都要靠数据去支撑。比如我们把按钮从左边换到右边,从红色换成黄色。这个东西一定要有什么数据分析团队、数据分析师、产品经理在哪儿反复打磨。最后跟我们说一句,按钮从以前的100像素换到了105像素。这是很无聊的一件事情,但是这个要用数据去验证,你知道吗? 大家好,我是来自萌义网络的干田。 以…
-
史上最全Python数据分析学习路径图
Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势,Python受欢迎程度扶摇直上。 Python工作环境及基础语法知识了…
-
数据科学产业科普:不同的职业所扮演的不同角色
概述:数据科学是近年来最热门的话题之一,其就业前景一片光明。但很多人对该领域的诸多职位和从事的工作仍然不是很了解。本篇文章可以很好的解答这个困惑。 数据科学家 掌握语言:R、SAS、Python、Matlab、SQL、Hive、Pig、Spark 技术及才能: 分布式计算 预测建模 数据的故事设计与…
-
面试干货!21个必知数据科学面试题和答案part2(12-21)
摘要:这里是第二部分,就从我给大家准备的“特别提问”开始吧。作者Gregory Piatetsky,KDnuggets. 特别提问:解释什么是过拟合,你如何控制它 这个问题不是20问里面的,但是可能是最关键的一问来帮助你分辨真假数据科学家! 回答者:GregoryPiatetsky 过拟合是指(机器…
-
面试干货!21个必知数据科学面试题和答案part1(1-11)
摘要:KDnuggets编辑给你“20个问题来分辨真假数据科学家”的答案,包括什么是正则化、我们崇拜的数据科学家、模型验证等等。 作者:Gregory Piatetsky, KDnuggets. 最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首…
-
数人云获 3000 万元 A 轮融资,打造轻量级 PaaS 平台发挥应用弹性
3月2日,“数人云” 宣布公司完成三千万人民币 A 轮融资,此次融资由云启创投领投,策源、唯猎以及两家全球领先的 IT 厂商跟投。此次融资将主要用于产品研发和市场开拓。“数人云” 于2014年9月 正式成立,并拿到百万美元天使投资。创始人兼 CEO 王璞强调,云计算将重塑传统企业服务的产业链。而目前…
-
数据科学的统计学入门
统计学是门严肃的学科,很多人穷尽一生来学习研究它。
-
Google深度学习要抢Photoshop的饭碗,看看DeepDream的风格转换算法
15年,Google 开源了用来分类和整理图像的 AI 程序 Inceptionism,并命名为 DeepDream。DeepDream 的开源除了帮助我们深入了解深度学习的工作原理外,还能生成一些奇特、颇具艺术感的图像。不久前,一位研究人员发表了一篇论文,提出了一种风格转换算法,可以将照片与绘画风…
-
可视化分析的知识产生模型
日前在2014 VIS会议上,来自德国康斯坦茨大学数据分析和可视化组(Data Analysis and Visualization Group, University of Konstanz)的Sacha等人,提出了一种基于可视化分析的知识产生模型。这个模型保留了过去的挖掘模型,如KDD模型,也从…