Github 上 Pandas, Numpy 和 Scipy 三个库中 20 个最常用的函数

几个月前,我看到一篇博客中列出了 Github 网站上 Python 常用库中使用频率最高的一些函数/模块。我在这个基础上做了可视化理,并撰写了每个库中使用频率前十的函数示例。其中本文中只包含了部分示例,完整的示例可以参见我的 Github。

首先我利用 requests 和 BeautifulSoup 从原始博客中爬取相关的数据,然后利用 matplotlib 和 seaborn 来绘制条形图,其中函数的排序由包含该函数的资源库(Repositories)数目所决定。比如,虽然 pd.Timestamp 的总频次特别高,但是该函数仅在少量的资源库中出现,所以它的排序相对靠后。

Pandas

DataFrame: 创建一个 dataframe 对象

merge:联结两个 dataframe


Numpy

arange: 创建某个区间内等间距的序列数组

mean: 沿着某个轴向计算列表/数组中所有数据的平均数

Scipy

stats: 常用的统计函数或分布函数

linalg: 常用的线性代数函数,如逆矩阵(linalg.inv)、行列式(linalg.det)

interpolate: 样条函数和插值函数


signal: 包含信号处理工具


misc: misc.imread 和 misc.imsave 分别用于读取和保存图像数据



最后谢谢各位的阅读,你可以在我的 Github中看到完整的函数示例。

原文链接:https://galeascience.wordpress.com/2016/08/10/top-10-pandas-numpy-and-scipy-functions-on-github/
原文作者:Alexander Galea
译者:Fibears

注:数据分析网遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏,请联系主编邮箱:afenxi@afenxi.com

数据工匠

厦门数析信息科技有限公司(品牌:数据工匠)成立于2014年10月14日。公司主要提供数据分析服务与产品,具体内容包括对企业与政府机构提供大数据咨询;平台级的通用化数据分析产品(软件)开发。

分享到:更多

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址