V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
FlashEcho
V2EX  ›  问与答

有没有那种比较各家大模型性能并且按时发布的网站

  •  
  •   FlashEcho · Nov 5, 2023 · 1207 views
    This topic created in 904 days ago, the information mentioned may be changed or developed.

    感觉 openai 的原生 gpt-4 变笨了,不清楚别人的大模型有没有进步,而且各个公司都在发布自己的新的大模型,自己一个个试用肯定没时间

    所以有没有什么网站/自媒体/机构,定期测试大模型性能并且比较的?

    1 replies    2023-11-06 09:35:07 +08:00
    ripperts
        1
    ripperts  
       Nov 6, 2023   ❤️ 1
    https://opencompass.org.cn/leaderboard-llm
    评分这玩意看看热闹就好
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3868 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 00:46 · PVG 08:46 · LAX 17:46 · JFK 20:46
    ♥ Do have faith in what you're doing.