azev
V2EX  ›  问与答

大家用哪家大模型的 api?

  •  
  •   azev · Mar 10, 2025 · 3502 views
    This topic created in 466 days ago, the information mentioned may be changed or developed.

    目前发现 Gemini 和 Grok 的页面对话速度非常快 不知道 api 情况如何?

    20 replies    2025-03-12 11:21:27 +08:00
    ration
        1
    ration  
       Mar 10, 2025
    免费就用这两个,对话速度还行
    BearCookie
        2
    BearCookie  
       Mar 10, 2025
    火山
    knightdf
        3
    knightdf  
       Mar 10, 2025
    grok api 还不能用 3 ,所以目前 API 用的 deepseek ,不过很少用 API ,都是用网页版
    mumbler
        4
    mumbler  
       Mar 10, 2025   ❤️ 1
    这两家都不算快,要快用 groq ,秒出,免费额度也挺多
    Comyn
        5
    Comyn  
       Mar 10, 2025 via iPhone
    deepseek claude
    tool2dx
        6
    tool2dx  
       Mar 10, 2025
    api 肯定用 deepseek ,你找不到更便宜的了。
    layxy
        7
    layxy  
       Mar 10, 2025
    腾讯元宝目前足够用了,没有单独使用 API 场景,ai 编程有插件
    Sting1226
        8
    Sting1226  
       Mar 10, 2025
    最快不过 gorq 。
    andrew2558
        9
    andrew2558  
       Mar 10, 2025
    deepseek 便宜吗?现在 deepseek 比 gemini 都贵了
    ThinkStu
        10
    ThinkStu  
       Mar 10, 2025
    混元 TurboS ,快/聪明/便宜
    clementewy
        11
    clementewy  
       Mar 10, 2025
    @tool2dx gemini 也很便宜的
    Donaldo
        12
    Donaldo  
       Mar 10, 2025
    英伟达的 送了点免费额度 巨快。。
    Leeeeex
        13
    Leeeeex  
    PRO
       Mar 10, 2025 via iPhone
    @mumbler #4 好像是 100w 吧 用完不就没了吗
    al0ne
        14
    al0ne  
       Mar 10, 2025
    Gemini 便宜量大 还支持多模态,文本/图片/PDF 啥的都能丢进去
    mumbler
        15
    mumbler  
       Mar 10, 2025
    @chanChristin #13 每天 qpd 有限制,总量没有限制
    coefu
        16
    coefu  
       Mar 10, 2025
    本地部署 qwq 32b fp16 强的一笔。
    pkoukk
        17
    pkoukk  
       Mar 10, 2025
    claude
    YJi
        18
    YJi  
       Mar 10, 2025
    今天刚接了 Qwen-Long ,阿里家的好像只有这个可以传文件上去解析。
    hkiJava
        19
    hkiJava  
       Mar 12, 2025
    @coefuqin #16 是 ollama 量化版部署的嘛
    coefu
        20
    coefu  
       Mar 12, 2025
    @hkiJava int 4 24g vram 刚刚够跑,但是上下文和推理过程长点就要更多了。fp16 我还没试,估计要准备 96g vram 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2691 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 63ms · UTC 14:18 · PVG 22:18 · LAX 07:18 · JFK 10:18
    ♥ Do have faith in what you're doing.