6月份最热门的机器学习开源项目Top10

编译 | Debra

编辑 | Natalie

微信公众号“AI 前线”（ID：ai-front）

Github 收藏平均数量：764⭐️
机器学习 Github Top10 开放源代码，https://github.com/Mybridge/machine-learning-open-source。
主题：NLP 架构、视频分类、Mlflow、经典游戏、Dragonfire、Opencv、计算机视觉、Star GAN、Glow、生成压缩

这些开源项目对程序员很有用，希望你能找到一个能引起你兴趣的有趣项目。

Top1 Nlp-architect

英特尔人工智能实验室的 NLP 架构：探索最先进的 NLP 深度学习拓扑和技术的 Python 库[Github 1194 颗星]

当前版本的 NLP Architect 包含了从研究角度和实际应用都非常有趣的特性：

NLP 核心模型可以为 NLP 工作流程提供强大的语言特征提取功能：例如分析器（BIST）和 NP chunker
提供一流性能的 NLU 模块：例如意图提取（IE），名称实体识别（NER）
解决语义理解的模块：例如，内涵提取，最常见词义，NP 嵌入表示（如 NP2V）
会话式 AI 组件：例如 ChatBot 应用程序，包括对话系统，序列分块和 IE
使用新拓扑的端到端 DL 应用程序：例如 Q＆A，机器阅读理解

感谢 Intel Nervana[英特尔人工智能实验室对 NLP 架构的介绍：

https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/

github 链接：

https://github.com/NervanaSystems/nlp-architect

Top2 视频非局域网

Video-nonlocal-net：用于视频分类的非局部神经网络，用 Caffe2 开发[Github 592 颗星]

Facebook Research 介绍：https://medium.com/@FBResearch

论文地址：https://arxiv.org/pdf/1711.07971.pdf

GitHub 链接：

https://github.com/facebookresearch/video-nonlocal-net

Top3 Mlflow

整个机器学习生命周期的开源平台 [Github 1282 颗星]

目前的 MLflow 是 alpha 版本，意味着 API 和数据格式有可能发生变化，且不支持 Windows 运行。

GitHub 链接：

https://github.com/databricks/mlflow

Top4 Gym Retro

经典游戏强化学习平台 [Github 905 颗星]

OpenAI 使用 Gym Retro 来研究强化学习（RL）算法并研究泛化。 RL 之前的研究主要集中在优化代理解决单个任务上。通过 Gym Retro，我们可以研究在概念相似但外观不同的游戏之间进行概括的能力。此外，OpenAI 还为新游戏添加了新的整合工具。

视频地址：https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4

此版本包括世嘉创世纪和世嘉主系统的游戏，以及任天堂的 NES，SNES 和 Game Boy 游戏机。它还包括对世嘉 Game Gear，任天堂 Game Boy Color，任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支持。一些已发布的游戏集成（包括 Gym Retro 的数据 / 实验文件夹中的那些游戏）处于测试状态。由于涉及的变化规模很大，代码暂时只能在一部分游戏上使用。

OpenAI 介绍：https://blog.openai.com/gym-retro/

GitHub 链接：

https://github.com/openai/retro/tree/develop

Top5 Dragonfire v1.0

基于 Ubuntu 的 Linux 发行版的开源 AI 助手 [Github 688 颗星]

支持环境：

Dragonfire 执行命令步骤：

搜索内置命令并评估代数表达式
尝试学习使用高级 NLP 和数据库管理技术
询问无所不知的 Q＆A 引擎（感谢所有为维基百科做贡献的人）
使用 Deep Conversation 系统进行响应，这是一个使用 Cornell Movie-Dialogs Corpus 训练的 seq2seq 神经网络

Dragonfire 使用 Mozilla DeepSpeech 来理解你的语音命令，并使用 Festival Speech Synthesis System 来处理文本到语音的任务。

你可以到 Gitter 聊天室（https://gitter.im/DragonComputer/Lobby），或者 Twitter 帐户与 Dragonfire 体验亲自与她交谈的乐趣。

DRAGON.COMPUTER 介绍：

https://github.com/DragonComputer/Dragonfire

GitHub 链接：

https://github.com/DragonComputer/Dragonfire

Top6 FaceAI

人脸、视频、文字检测和识别项目（使用自动翻译器：中文 – >英文） [Github 1482 颗星]。

功能

人脸检测、识别（图片、视频）
轮廓标识
头像合成（给人戴帽子）
数字化妆（画口红、眉毛、眼睛等）
性别识别
表情识别（生气、厌恶、恐惧、开心、难过、惊喜、平静等七种情绪）
视频对象提取
图片修复（可用于水印去除）
图片自动上色
眼动追踪（待完善）
换脸（待完善）

开发环境

Windows 10（x64）
Python 3.6.4
OpenCV 3.4.1
Dlib 19.8.1
face_recognition 1.2.2
keras 2.1.6
tensorflow 1.8.0
Tesseract OCR 4.0.0-beta.1

GitHub 链接：

https://github.com/vipstone/faceai

Top7 Sod

嵌入式计算机视觉和机器学习库（CPU 优化和 IoT 功能）[Github 557 颗星]

SOD 是嵌入式的现代跨平台计算机视觉和机器学习软件库，公开了一套用于深入学习的高级媒体分析和处理 API，包括实时、多类别对象检测和嵌入式系统上的模型训练计算资源和物联网设备，旨在为计算机视觉应用提供通用基础设施，并加速在开源和商业产品中使用机器感知。

SOD 目前的计算机视觉算法支持但不限于移动机器人、AR/VR、基因学、人机交互、机器自动化等。

值得注意的 SOD 功能：

专为真实世界和实时应用程序而打造。
最先进的 CPU 优化深度神经网络，包括全新的独家 RealNets 架构。
无需专利，先进的计算机视觉算法。
支持主要的图像格式。
简单，干净且易于使用的 API。
深入了解有限的计算资源，嵌入式系统和物联网设备。
易于使用 OpenCV 或任何其他专有 API 进行插补。
预训练模型可用于大多数体系结构。
支持 CPU 的 RealNets 模型训练。
已完备、跨平台、高质量的源代码。
SOD 是免费的，用 C 语言编写，几乎可以在所有平台和体系结构上编译和运行。合并 – 将所有 SOD 源文件合并为一个 C 文件（sod.c）以便于部署。
开源，积极开发和维护产品。
开发者友好的支持渠道（https://sod.pixlab.io/support.html）

SOD 编程指南：https://sod.pixlab.io/intro.html

Symisc Systems 主页介绍：https://sod.pixlab.io/

GitHub 链接：https://github.com/symisc/sod

Top8 StarGAN-Tensorflow

StarGAN 的简单 Tensorflow 实现（CVPR 2018 Oral）[Github 382 颗星]，感谢 Junho Kim。

StarGAN 是一个使用单个数据集解决多域图像到图像转换问题的框架，可以合并包含不同标签集的多个数据集，并灵活地使用这些标签进行图像翻译。

论文链接：https://arxiv.org/pdf/1711.09020.pdf

GitHub 链接：

https://github.com/taki0112/StarGAN-Tensorflow

Top9 Glow

神经网络硬件加速器编译器 [Github 603 颗星]，致谢 PyTorch。

Glow 是针对各种硬件目标而设计的机器学习编译器和执行引擎，被用作高级机器学习框架的后端。该编译器可以进行最先进的编译器优化和神经网络图的代码生成。这个库还在实验和发展阶段。

工作原理

Glow 将传统的神经网络数据流图降低到两阶段强类型中间表示（IR）。高级 IR 允许优化器执行特定域的优化。较低级别的仅基于指令的 IR 允许编译器执行与内存相关的优化，例如指令调度，静态内存分配和复制消除。在最底层，优化器执行特定机器代码生成，以利用其硬件特性。Glow 的降低阶段特点在于使编译器无需在所有目标上实现所有运算符，从而支持大量的输入运算符以及大量的硬件目标。降低阶段的设计旨在减少输入空间，让新的硬件后端专注于少数线性代数基元。其设计理念在 arXiv 论文中有所描述。

论文链接：https://arxiv.org/abs/1805.00907

GitHub 链接：

https://github.com/pytorch/glow

Top10 生成压缩

Generative-compression：GAN 极端学习图像压缩的 TensorFlow 实现。[Github 225 颗星]，致谢 Justin-Tan。

Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。

论文链接：https://arxiv.org/pdf/1804.02958.pdf

GitHub 地址：

https://github.com/Justin-Tan/generative-compression

原文链接：

https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f

本文为特邀专栏文章，来自：AI前线，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/56938.html 。

6月份最热门的机器学习开源项目Top10

Top1 Nlp-architect

Top2 视频非局域网

Top3 Mlflow

Top4 Gym Retro

Top5 Dragonfire v1.0

Top6 FaceAI

Top7 Sod

Top8 StarGAN-Tensorflow

Top9 Glow

Top10 生成压缩

你可能也喜欢这些文章