• 请不要在回答技术问题时复制粘贴 AI 生成的内容
bingoAI
0.01D
V2EX  ›  程序员

AI coding 时代, test case 测试用例的价值如何评估?

  •  
  •   bingoAI · 10 days ago · 677 views
    = 1475 passed, 3 skipped, 90 warnings in 47.90s =
    qdd48
        1
    qdd48  
       10 days ago
    看各种评测数据集,基本都需要测试用例,测试用例价值挺大的,感觉训练验证属于必不可少的内容
    xsonglive491
        2
    xsonglive491  
       7 days ago
    测试用例和 benchmark 价值大增
    bingoAI
        3
    bingoAI  
    OP
       6 days ago
    你们说的是针对 model 的评测 eval 基准用例?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3616 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 05:00 · PVG 13:00 · LAX 22:00 · JFK 01:00
    ♥ Do have faith in what you're doing.