stcasshern
V2EX  ›  问与答

有没有开源好用的数据、算法超参数、模型版本记录与管理工具

  •  
  •   stcasshern · Jan 31, 2019 · 1924 views
    This topic created in 2683 days ago, the information mentioned may be changed or developed.

    RT,工作需要,针对同一个业务,会选取不同数据(比如不同时间段)、 不同算法、不同参数进行模型训练,有时候模型太多 就难以管理了(目前就靠命名区分。。)
    另外还有一个问题,就是比如 lightgbm 这样的包,保存下来的模型文件,是不带超参数的( sklearn 的是带的),每次都要手动单独保存。
    因此有了一个需求,有没有一个开源工具(最好能兼容 诸多算法包),能够每次完成训练,自动(或者半自动)记录 这次训练选取的数据集、模型参数、模型文件。
    求助。

    1 replies    2019-02-01 18:07:54 +08:00
    stcasshern
        1
    stcasshern  
    OP
       Feb 1, 2019
    回复关注本主题的同学。。MLflow ( databricks 开源 )可以满足该需求
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1002 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 23:05 · PVG 07:05 · LAX 16:05 · JFK 19:05
    ♥ Do have faith in what you're doing.