laraws
V2EX  ›  OpenAI

目前靠谱的 AI 模型水平排行榜有哪些? marena.ai 的 leaderboard 是否值得参考?

  •  1
     
  •   laraws · Dec 11, 2024 · 2427 views
    This topic created in 564 days ago, the information mentioned may be changed or developed.

    目前靠谱的 AI 模型水平排行榜有哪些? marena.ai 的 leaderboard 是否值得参考?

    我看经常有大佬们提及 https://lmarena.ai/?leaderboard ,但是我看 gpt-4o 居然排名第二,比 gpt-o1-preview 和 Claude 3.5 Sonnet 还要强。个人平时用 AI 提问写代码,感觉 gpt-o1-preview 和 Claude 3.5 Sonnet 提供的基本都是可以直接用的,gpt-4o 提供的有时候不能使用。

    有没有靠谱的 AI 模型水平排行榜? marena.ai 的 leaderboard 的排名依据是啥?应该不是生成代码能力吧?

    5 replies    2025-02-17 01:48:02 +08:00
    eremit
        1
    eremit  
       Dec 11, 2024 via Android   ❤️ 2
    laraws
        2
    laraws  
    OP
       Dec 11, 2024
    @eremit 不错,这个感觉比较靠谱,和我自己的一些使用感觉相符
    Persimmon08
        3
    Persimmon08  
       Dec 11, 2024
    我也觉得 gpt4o 写代码的能力不如 o1 ,最近发布会后 4o 的表现更是比不上之前,似乎把算力都分配给 o1 了
    Liftman
        4
    Liftman  
       Dec 11, 2024   ❤️ 1
    反正都是第一梯队的。这个所谓的排名也只是针对特定情况下的分数。

    你看国产模型的名次也不低,但是实际差太远了,全靠拟合。

    只能说自己试才知道哪个最好。
    NianBroken
        5
    NianBroken  
       Feb 17, 2025 via iPhone
    @eremit #1 这个数据有点旧了,有没有新的排行榜网站呢?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2098 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 16:12 · PVG 00:12 · LAX 09:12 · JFK 12:12
    ♥ Do have faith in what you're doing.