1. 数据分析网首页
  2. 大数据
  3. 大数据技术

GitHub上7大最受欢迎的开源数据科学课程

GitHub是最著名的版本控制存储库之一。在其中,您可以找到很多优秀的项目和资源。这是列出了在GitHub上最受欢迎​​的7个数据科学课程的列表。

GitHub上7大最受欢迎的开源数据科学课程

前言

GitHub是最著名的版本控制存储库之一。在其中,您可以找到很多优秀的项目和资源。

这是列出了在GitHub上最受欢迎​​的7个数据科学课程的列表。排名基于每个项目的forks数。

1. Standford TensorFlow Tutorials(4,072 forks)

GitHub上7大最受欢迎的开源数据科学课程

该存储库和Stanford CS 20课程相关:用于深度学习研究的TensforFlow课程相关。课程网站上提供了详细的教学大纲,幻灯片和讲义。讲师使用python 3.6和TensorFlow 1.4.1。

这是课程说明:

TensorFlow是Google研究人员开发的强大的机器学习开源软件库。它具有许多预先构建的功能,可以简化构建不同神经网络的任务。TensorFlow允许在不同计算机之间以及一台计算机中的多个CPU和GPU之间分配计算。TensorFlow提供了Python API以及文献较少的C ++ API。在本课程中,我们将使用Python。

本课程将涵盖Tensorflow库用于深度学习研究的基础知识和当代用法。我们旨在帮助学生理解TensorFlow的图形计算模型,探索其提供的功能以及学习如何构建和构建最适合深度学习项目的模型。在整个课程中,学生将使用TensorFlow构建不同复杂度的模型,从简单的线性/逻辑回归到卷积神经网络和递归神经网络,以解决诸如单词嵌入,翻译,光学字符识别,强化学习之类的任务。学生还将学习最佳实践,以构建模型和管理研究实验。

2.Deep Learning Specialization on Coursera(3,352 forks)

GitHub上7大最受欢迎的开源数据科学课程

这是一个由学生创建的资源库,该学生发布了课程分配的解决方案和Coursera深度学习专业化的解决方案。

它的内容没有那么丰富,但是,它可以用来更好地理解一些与深度学习有关的概念。将您的解决方案与该存储库中提供的解决方案进行比较也很有用。

这是您可以找到编程作业和测验的课程列表:

  • 课程1:神经网络与深度学习
  • 课程2:改善深度神经网络:超参数调整,正则化和优化
  • 课程3:构建机器学习项目
  • 课程4:卷积神经网络
  • 课程5:序列模型

3.Practical RL: A course in reinforcement learning in the wild (3,368 forks)

GitHub上7大最受欢迎的开源数据科学课程

这个课程的英语和俄语在线版本可用,但在高等经济学院以俄语授课。

知识库中还包含一些材料,可供在现场学习课程或只是想在线浏览课程的学生使用。

本课程侧重于实用机器学习,涵盖以下主题:

  • 引言。我们周围的RL问题。决策流程。随机优化,交叉熵法。参数空间搜索与动作空间搜索。
  • 基于价值的方法: 折扣奖励MDP。基于价值的方法。价值迭代。策略迭代。折扣奖励失败。
  • 无模型强化学习。Q学习。SARSA。脱离策略与基于策略的算法。N步算法。TD(Lambda)。
  • 深度学习回顾。深度学习101.它附带一个研讨会,介绍pytorch / tensorflow,带卷积网络的简单图像分类
  • 近似(深)RL。无限/连续状态空间。值函数近似。收敛条件。多人特技 体验重播,目标网络,双重/决斗/自举DQN等。
  • 探索。情境强盗。汤普森抽样,UCB,贝叶斯UCB。探索基于模型的RL,MCTS。“令人沮丧的”启发式探索。
  • 策略渐变方法。基于策略的动机,策略梯度,对数导数技巧,REINFORCE /交叉熵方法,方差减少(基准),有利于参与者的批评者(包括GAE)
  • 序列模型的强化学习。顺序数据问题。复发性神经痛。通过时间的反向传播。消失和爆炸的梯度。LSTM,GRU。渐变裁剪
  • 部分观察到的MDP。POMDP简介。POMDP学习(具有记忆的代理)。POMDP规划(POMCP等)
  • 基于策略的高级方法。信任区域策略优化。NPO / PPO。确定性政策梯度。DDPG
  • 基于模型的RL&Co. 基于模型的RL,总体规划,模仿学习和反强化学习
  • 逆RL和模仿学习。本课程未讲授的所有内容

4. Creative Applications of Deep Learning with Tensorflow (1,341 forks)

GitHub上7大最受欢迎的开源数据科学课程

该课程包含Kadenze学院使用TensorFlow课程进行深度学习的创造性应用的作业和讲稿。

本课程包括以下课程:

  • 第一场:TensorFlow简介
  • 第三节:无监督和有监督的学习
  • 第四节:可视化和产生幻觉
  • 第五节:生成模型

该存储库还包含有关设置和使用所需工具入门的大量文档。

5. Data Science Coursera (714 forks)

GitHub上7大最受欢迎的开源数据科学课程

该项目由一位名为Michael Galarnyk的数据科学硕士学生准备。他建立了这个资料库,以记录他在约翰·霍普金斯(Johns Hopkins)的Coursera数据科学课程中的历程,作为对他在加州大学圣地亚哥分校计划的补充。

该GitHub存储库包含每周对应的目录,以及每个课程的博客文章。

以下课程与相应的存储库和博客相关联:

  • 统计推断课程回购
  • 可重现的研究课程回购博客
  • 探索性数据分析课程回购博客
  • 获取和清理数据课程仓库博客
  • R编程课程库博客
  • 数据科学家工具箱课程回购博客

6. Udacity’s Machine Learning Engineer Nanodegree Stanford’s Convolutional Neural Networks for Visual Recognition (69 forks)

GitHub上7大最受欢迎的开源数据科学课程

这是一个带有一个有用的Udacity’s Machine Learning Enginee课程。

它包含有关如何使用内容的信息,与课程材料相关的超链接以及对学生有用的其他链接,例如Andrej Karpathy博客,Andrew Trask博客等。

当学生完成作业分配后,将邀请他们在资源库中共享他们的解决方案,以便其他人可以查看并从中受益。

7. Introduction to Hadoop and MapReduce (47 forks)

GitHub上7大最受欢迎的开源数据科学课程

该项目与Udacity Hadoop和MapReduce入门课程有关。

它包含源代码和问题集,以及有用的自述文件,说明了进行设置的方式,有关输入和输出数据文件的文档以及针对该课程的问题集以及Python和Java解决方案。

总结:

这只是基于forks数量的一些最受欢迎的课程的列表。还有许多其他资源库可以作为学习和受益的有用资源。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code