• 请不要在回答技术问题时复制粘贴 AI 生成的内容
bingoAI
0.01D
V2EX  ›  程序员

AI coding 时代, test case 测试用例的价值如何评估?

  •  
  •   bingoAI · 8 days ago · 664 views
    = 1475 passed, 3 skipped, 90 warnings in 47.90s =
    qdd48
        1
    qdd48  
       8 days ago
    看各种评测数据集,基本都需要测试用例,测试用例价值挺大的,感觉训练验证属于必不可少的内容
    xsonglive491
        2
    xsonglive491  
       5 days ago
    测试用例和 benchmark 价值大增
    bingoAI
        3
    bingoAI  
    OP
       4 days ago
    你们说的是针对 model 的评测 eval 基准用例?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2879 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 04:46 · PVG 12:46 · LAX 21:46 · JFK 00:46
    ♥ Do have faith in what you're doing.