V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
qazwsxkevin
V2EX  ›  Local LLM

用 DGX Spark 做这些事情,是否能力合适/足够,有佬能解答吗?(估算也行)

  •  
  •   qazwsxkevin · 1 天前 · 550 次点击

    这东西我都没见过实物,在 USA 的同学有一台,但是他上线后应用的事情都快拉爆了,暂时没空测我的想法,只能想象着来问一下这里各位佬了:

    • C++,Python 的代码 review;
    • 根据提示词,处理 MySQL 返回来 8k~13k 条已成 JSON 的数据提取;(字段和内容不多,爆不了上下文)
    • 给出初高中的数学物理,某题的解题思路;
      需求就这三类事情为主。

    问题:

    • DGX Spark 128G 跑个什么模型能应付以上三类强度的事情?
    • 如果有合适(或者将就)应付的模型,90%额定容量的上下文打进去,要多久时间有反应开始出 tokens?
    • 每秒能吐多少 tokens?

    考虑:

    • 场地空间和物理条件所限,只能找这类小机.
    • 可以考虑 Mac Studio M3U 256G,再新款的加钱也不好买,也贵.
    5 条回复    2026-04-23 12:00:52 +08:00
    lan894734188
        1
    lan894734188  
       1 天前 via iPhone   ❤️ 1
    最多跑 100b 左右的 moe 模型 tps 约 40 左右 不快不慢
    Zhuzhuchenyan
        2
    Zhuzhuchenyan  
       21 小时 34 分钟前   ❤️ 1
    正好 B 站刷到一个视频,应该能解答你的疑问,视频中也提到了如何根据模型理论参数反推部署后的指标

    花 5 万买 Mac Studio 跑 AI 值不值?用了一年终于能回答了。附模型评论和硬件对比,部署指南
    https://www.bilibili.com/video/BV1zmSoBnEYM
    coefu
        3
    coefu  
       13 小时 35 分钟前   ❤️ 1
    https://www.v2ex.com/t/1207254

    看他的帖子,他有一台。
    qazwsxkevin
        4
    qazwsxkevin  
    OP
       13 小时 30 分钟前
    @coefu 嗯嗯,我在大佬另外一个帖子下面咨询了他,估计他也不清楚,没时间琢磨了,我自己也有想法等 M5Ultra 出来看看情况...
    babymonster
        5
    babymonster  
       13 小时 7 分钟前
    这个可以玩的有很多呀,文生图,文生视频,Comfy UI ,ASR ,TTS ,OCR 等等这些都是可以玩的。但是这些部署过程就会很繁琐,我看有一款产品跟这个差不多,叫懒猫微服,他们有工程师 7×18 小时在线服务,这一点还是挺好的,不知道有没有评论区大佬来看看
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1433 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 17:07 · PVG 01:07 · LAX 10:07 · JFK 13:07
    ♥ Do have faith in what you're doing.