搜索:Python

  • 【Python】爬虫+K-means聚类分析电影海报主色调

    摘要:每部电影都有自己的海报,即便是在如今这互联网时代,电影海报仍是一个强大的广告形式。每部电影都会根据自身的主题风格设计海报,精致的电影海报可以吸引人们的注意力。那么问题来了,不同风格的电影海报对颜色有什么样的偏好呢? 利用Python爬取海报数据 为了回答这个问题,我们需要分析不同风格电影的海报情况。首先,我们需要构建一个电影海报数据的数据集,因此我利用…

    2016-03-02
    0
  • R语言 vs Python:数据分析哪家强?

    摘要:这篇文章旨在更客观地看待这两门语言。我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样的代码。这让我们了解每种语言的优缺点,而不是猜想。在Dataquest,我们教授两种语言,并认为两者在数据科学工具箱中都占据各自的地位。 我们将会分析一个NBA数据集,包含运动员和他们在2013-2014赛季的表现,可以在这里下载…

    2016-02-28
    0
  • 利用Python,四步掌握机器学习

    摘要:为了理解和应用机器学习技术,你需要学习Python或者R。这两者都是与C、Java、PHP相类似的编程语言。但是,因为Python与R都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据,Python的优势在于它适用于许多其他的问题。因为Python拥有更广阔的分布(使用Jan…

    2016-02-25
    0
  • 学神之路 —— Python数据科学全攻略

    Python菜鸟到Python Kaggler 如果你梦想成为一名数据科学家,或者已然是数据科学家的你想扩展自己的工具库,那么,你找对地方啦。本文旨在为做数据分析的Python人提供一条全方位的学习之路,完整讲述运用Python进行数据分析的所有步骤。当然,如果你已经有了一些知识储备,或者无需掌握全部的内容,可以按照自己的需求做出调整,也欢迎与我们分享你是如…

    2016-02-24
    0
  • 本·拉登的书架:Python文本分析拉登最常念叨什么?

    摘要:2015年,美国官方解密了一系列有关本·拉登的文件,其中最引人瞩目的,是美国国家情报总监办公室(The Office of the Director of National Intelligence)在其官网上列出的“本·拉登的书架”。 曝光的这份阅读清单涉及书籍和其他材料400余种。其中包含了已解密的书信等文档103份、公开发表的美国政府文件75份、…

    2016-02-21
    0
  • LIGO用Python分析引力波数据

    美国科学家11日宣布,他们去年9月首次探测到引力波。这一发现印证了物理学大师爱因斯坦100年前的预言。宣布这一发现的,是激光干涉引力波天文台(LIGO)的负责人。 这个机构诞生于上世纪90年代,进行引力波观测已经有近30年。那么观测到的引力波数据的量应该很大,科学家如何对这些数据进行分析?有没有用到Python编程语言? 答案是肯定的。笔者在Github上发…

    2016-02-21
    0
  • 如何通过Python来开始数据分析

    最近,Analysis with Programming加入了Planet Python。作为该网站的首批特约博客,我这里来分享一下如何通过Python来开始数据分析。具体内容如下: 数据导入——导入本地的或者web端的CSV文件; 数据变换; 数据统计描述; 假设检验——单样本t检验; 可视化; 创建自定义函数。 数据导入 这是很关键的一步,为了后续的分析…

    2016-02-15
    0
  • Python之父:为什么Python的索引从零开始?

    刚开始学习Python语言的时候,并不是很理解为什么Python列表的索引值是从0开始的,不过却很喜欢列表切片的语法,非常简单、优雅。而最近在翻阅Python之父Guido老爹的Google+发文时,看到了他自己对这个问题的解释。 下面是Guido老爹的回答。 最近有人在Twitter上问我,为什么Python中的索引从0开始(0-based indexin…

    2016-01-27
    0
  • 你用Python做过什么有趣的数据挖掘项目?

    本文授权转载自知乎回答-何明科,作者:何明科系一面网络技术有限公司创始人。作者现身说法,用自己的创业历程举例说明:有钱很重要,有趣更重要。 第零步:原点,大数据与价值 大概一年多以前,和几个小伙伴均认同一个趋势:觉得通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活。(大数据被叫烂了,所以用低调的方式来…

    2016-01-26
    0
  • 用Python Pandas处理亿级数据

    在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据: 硬件环境 CPU:3.5…

    2016-01-24
    0
  • 随机森林入门攻略(内含R、Python代码)

    简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中,随机森林一次又一次地展示出令人难以置信的强大,而与此同时它又是如此的方便实用。 需要大家注意的是,在上文中特别提到的是第一组测试结果,而非所有的结果,这是因为随机森林…

    2016-01-24
    0
  • 如何使用Python创建一个NBA得分图?

    摘要:本文意在创建一个得分图,该图同时描绘了从场上不同位置投篮得分的百分比和投篮次数,这和 Austin Clemen 个人网站上的帖子http://www.austinclemens.com/shotcharts/ 类似 。 为了实现这个得分图,笔者参考了 Savvas Tjortjoglou 的帖子http://savvastjortjoglou.com…

    2016-01-20
    0
  • 数据科学的完整学习路径(Python版)

    摘要:从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Python新手提供一个完整的学习路径。该路径提供了你需要学习的利用Python进行数据分析的所有步骤的完整概述。如果你已经…

    2016-01-20
    0
  • 七步精通Python机器学习

    开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。 从哪里开始? 本文旨在通过七个步骤,使用全部免费的线上资料,帮助新人获取最基本的 Python 机器学习知识,直至成为博学的机器学习实践者。这篇概述的主要目的是带领读者接触众多免费的学习资源。这些资源有很多,但哪些是最好的?哪些相互补充?怎样的学习顺序才…

    2016-01-15
    0
  • Python实现抓取城市的PM2.5浓度和排名

    主机环境:(Python2.7.9/Win8_32/bs4) 利用BeautifulSoup4来爬取WWW.pm2.9.Com上的PM2.5统计数据,之所以抓取这个网址,是因为上面有城市PM2.5浓度值排名(其实真正的原因是,它是百度搜PM2.5出来的第一个网站!) 程序流程里只对比了2个城市,所以java进程的速率提高并非很明显,大家能够弄12个城市并开1…

    2015-12-25
    0
关注我们
关注我们
分享本页
返回顶部