机器学习项目 - 暑期代码节

注意:FluxML 作为 NumFOCUS 的子组织参与。前往 FluxML GSoC 页面 获取他们的想法列表。

强化学习环境

时间:175 小时

开发一系列强化学习环境,类似于 OpenAI Gym。虽然我们有可用的 gym 包装器,但它很难安装(由于 Python 依赖关系),而且由于它是用 Python 和 C 代码编写的,我们无法用它做更多有趣的事情(比如通过环境进行微分)。

预期成果

使用 Flux 进行 RL 的任何人都能从一个支持类似 API 和可视化选项的纯 Julia 版本的环境中获益。

导师:Dhairya Gandhi.

AlphaZero.jl

AlphaZero.jl 项目的理念是提供一个 AlphaZero 的实现,该实现足够简单,以便贡献者和研究人员可以广泛访问,同时又足够强大和快速,可以在有限的计算资源上进行有意义的实验(我们最新的版本始终比竞争的 Python 实现快一个到两个数量级)。

以下是一些基于 AlphaZero.jl 的项目想法。请联系我们获取更多详细信息,并告知我们您的经验和兴趣,以便我们能够建立一个最适合您个人资料的项目。

预期成果

在所有这些项目中,目标不仅是展示当前的 Julia 生态系统并测试其极限,而且还通过其他人可以构建的具体贡献推动其发展。这些贡献包括

导师Jonathan Laurent