MLJ.jl 项目 – 代码之夏

MLJ 是一个用于 Julia 的机器学习框架,旨在提供一种便捷的方式来使用和组合 Julia ML/Stats 生态系统中提供的众多工具和模型。

项目列表

MLJ 在 MIT 许可证下发布,并由艾伦·图灵研究所赞助。

  1. MLJ.jl 项目 – 代码之夏
    1. 项目列表
    2. 类别变量编码
      1. 描述
    3. 先决条件
    4. 你的贡献
    5. 参考文献
    6. 预测生存分析中的机器学习
      1. 描述
    7. 先决条件
    8. 你的贡献
    9. 参考文献
    10. 更深入的贝叶斯集成
      1. 描述
    11. 你的贡献
    12. 参考文献
    13. 难度:中等至困难
    14. 使用 MLflow 跟踪和共享 MLJ 工作流
      1. 描述
    15. 先决条件
    16. 你的贡献
    17. 参考文献
    18. 仅限速度狂魔申请
      1. 描述
    19. 先决条件
    20. 你的贡献
    21. 参考文献

类别变量编码

扩展 MLJ 的类别变量编码。

难度。中等。持续时间。350 小时

描述

MLJ 提供了类别变量的基本独热编码,但没有提供复杂的编码技术。独热编码相当有限,特别是当类别具有非常多的类时。存在许多其他技术,而该项目旨在使其中一些技术可供 MLJ 用户使用。

导师。 Anthony Blaom(最佳联系方式:Julia Slack 上的私信)

先决条件

你的贡献

在这个项目中,您将调查用于对类别变量进行独热编码的流行现有方法。在与导师协作的情况下,您将制定一个将其中一些技术集成到 MLJ 中的计划。您将开始实施该计划,最初专注于简单的方法,为现有的 Julia 包提供 MLJ 接口,或在需要时提供新的实现。如果项目进展顺利,您将实现更高级的技术,例如通过 MLJFlux.jl(MLJ 的神经网络接口)进行实体嵌入

参考文献

预测生存分析中的机器学习

实现用于 MLJ 机器学习平台的生存分析模型。

难度。中等 - 困难。持续时间。350 小时

描述

生存/事件时间分析是统计学的一个重要领域,它关注的是理解事件随时间的分布。生存分析提出了一个独特的挑战,因为我们也对没有发生的事件感兴趣,我们将其称为“删失”。生存分析方法在许多现实世界环境中都很重要,例如医疗保健(疾病预后)、金融和经济学(违约风险)、商业活动(客户流失)、工程(组件寿命)等等。该项目旨在使用 MLJ 机器学习框架实现执行生存者分析的模型。

mlr3proba 目前是最完整的生存分析接口,让我们将 SurvivalAnalysisA.jl 提升到相同的标准 - 但要从沿途的错误中吸取教训。

导师。 Sebastian VollmerAnthony Blaom

先决条件

优先考虑。

你的贡献

您将致力于创建一个具有各种指标的生存分析包,能够对经典模型和 ML 模型进行分布预测。您将在早期引入竞争风险,以及预测转换,并包括左删失和区间删失。您将编写基本的模型(Cox PH 和 AFT),以及一个作为概念验证的 ML 模型(可能决策树最简单或 Coxnet)。

具体来说,您将

学习模型。

模型开发概念验证。

参考文献

更深入的贝叶斯集成

贝叶斯方法和概率监督学习提供不确定性量化。本项目旨在增加集成,以使用 Turing 结合贝叶斯和非贝叶斯方法。

难度。困难。持续时间。350 小时。

描述

作为第一步,在 Turing 中重现SOSSMLJ。该项目的大部分内容是实现结合多个预测分布的方法。

你的贡献

参考文献

贝叶斯堆叠 SKpro

难度:中等至困难

导师葛洪 Sebastian Vollmer

使用 MLflow 跟踪和共享 MLJ 工作流

帮助使用 MLJ 的数据科学家使用MLflow跟踪和共享他们的机器学习实验。本项目此阶段的重点是

难度。中等。持续时间。350 小时。

描述

MLflow 是一个用于机器学习生命周期的开源平台。它允许数据科学家将实验元数据和输出上传到平台,以进行复制和共享。MLJ 已经允许用户将基本模型性能评估报告到 MLflow 服务,而该项目则试图大大增强这种集成。

先决条件

你的贡献

参考文献

导师。 Anthony Blaom

仅限速度狂魔申请

诊断并利用加快常见 MLJ 工作流的机会。

难度。中等。持续时间。350 小时。

描述

除了调查一些已知的性能瓶颈外,您还将拥有自由裁量权来确定加快常见 MLJ 工作流的机会,以及更好地利用内存资源。

先决条件

你的贡献

在这个项目中,您将

参考文献

导师。 Anthony Blaom、Okon Samuel。