FlashEcho
V2EX  ›  问与答

有没有那种比较各家大模型性能并且按时发布的网站

  •  
  •   FlashEcho · Nov 5, 2023 · 1326 views
    This topic created in 959 days ago, the information mentioned may be changed or developed.

    感觉 openai 的原生 gpt-4 变笨了,不清楚别人的大模型有没有进步,而且各个公司都在发布自己的新的大模型,自己一个个试用肯定没时间

    所以有没有什么网站/自媒体/机构,定期测试大模型性能并且比较的?

    1 replies    2023-11-06 09:35:07 +08:00
    ripperts
        1
    ripperts  
       Nov 6, 2023   ❤️ 1
    https://opencompass.org.cn/leaderboard-llm
    评分这玩意看看热闹就好
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2652 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 08:29 · PVG 16:29 · LAX 01:29 · JFK 04:29
    ♥ Do have faith in what you're doing.