sjmcefc2
V2EX  ›  Local LLM

买 macbook pro 笔记本,跑本地模型,怎么配置性价比比较高?

  •  
  •   sjmcefc2 · 19h 12m ago · 1640 views

    macbook pro 跑本地模型,64g 内存够用吗? 64g 可以跑哪些模型呢? 等 9 月新品还是现在呢? 不懂 mac 的商品啊

    27 replies    2026-06-13 12:39:23 +08:00
    NASK
        1
    NASK  
       19h 6m ago
    macbook Pro 跑本地模型没有意义,如果真想本地跑的话,可以用 mac mini 来跑.
    ssack9
        2
    ssack9  
       19h 1m ago
    MacMini 需要什么样的配置来跑本地模型
    wuxilaoshiren
        3
    wuxilaoshiren  
       19h 0m ago
    伪需求
    et5494
        4
    et5494  
       18h 58m ago
    25 年购入了一台 MAC MINI M4 PRO 64G 版
    实际测试下来,跑模型的 token/S 很慢,GPU 全程 102°,完全等不及的那种(我忘记上的多大模型了,反正 64 是低不成高不就)
    这钱直接花在订阅上,这不香吗?
    sjmcefc2
        5
    sjmcefc2  
    OP
       18h 44m ago
    @et5494 多大的配置才能比较顺利的跑呢?
    mbooyn
        6
    mbooyn  
       17h 43m ago
    一般推荐显存几百 G 的才跑本地模型,否则一律走云端 api
    YanSeven
        7
    YanSeven  
       17h 40m ago via Android
    就算能顺利跑了,堆到顶级了。那个智力可能都不如现在有些厂商发善心给你免费用的 API ,都不必花钱。
    sjmcefc2
        8
    sjmcefc2  
    OP
       17h 25m ago
    @YanSeven 那就剩下一个苹果开发了。对吧。只是想着顺带跑跑本地模型,有个高中生水平就可以简单执行任务了。
    ntedshen
        9
    ntedshen  
       17h 23m ago
    9 月不涨价就不错了。。。618 的货还是年初的价
    ysn2233
        10
    ysn2233  
       16h 57m ago
    伪需求,不跑最好
    foxio2
        11
    foxio2  
       16h 56m ago via Android
    这个好办。选内存带宽超过 800G/s 的。
    foxio2
        12
    foxio2  
       16h 54m ago via Android
    4 万以下根本不用看。4 万以上的那种。本地跑的,主要是是为了保护宝贵的私有数据。所以。这点钱也值得。
    409164
        13
    409164  
       16h 41m ago
    你能跑的都是弱智模型
    Mandelo
        14
    Mandelo  
       16h 21m ago
    本地模型要好用,卖 token plan 的早倒闭了
    onetown
        15
    onetown  
       16h 15m ago
    我现在很多代码是用 m5 max + 128g 内存跑的 qwen3.6 35b 的模型跑的。65k 上下文, 模型本身支持 128k , 但是我为了可以并发, 限制到 65k 。
    sjmcefc2
        16
    sjmcefc2  
    OP
       12h 22m ago
    @foxio2 能列一下配置吗
    sjmcefc2
        17
    sjmcefc2  
    OP
       12h 17m ago
    @onetown 也就是 128g 就可以跑目前的新模型了?
    coefu
        18
    coefu  
       12h 16m ago
    mac 系列只有 ultra 能用,别的都不用试了。
    sjmcefc2
        19
    sjmcefc2  
    OP
       12h 15m ago
    @coefu 能具体说说吗?
    coefu
        20
    coefu  
       12h 8m ago   ❤️ 1
    @sjmcefc2

    推理第一要素,gmem/umem 的带宽,越大越好。
    第二要素才是算力本身,prefill 阶段,context 太长,Nvidia 的 cuda 擅长的地方。

    mac 系列只有 ultra 的带宽>= 800GB/s ,这是第一个要素。 至于 apple metal gpu 的 core 数量,讲真,再多一倍也无济于事。算力对于 mac 系列来说,聊胜于无。
    felixcode
        21
    felixcode  
    PRO
       10h 15m ago
    建议拔网线,关网卡,再也不联网,然后再跑本地模型。
    这样就能发挥本地模型保护隐私数据的优势了。
    wsbqdyhm
        22
    wsbqdyhm  
       4h 48m ago via iPhone
    目前 m1max64g ,能跑 qwen3.6-27b ,10 多 token/s 吧,仅供参考。架构 omlx 。没有什么实际意义。
    CakeJu
        23
    CakeJu  
       3h 40m ago
    有什么本地模型的需求吗,不如把买笔记本的钱拿来订阅
    decemberpei
        24
    decemberpei  
       3h 8m ago
    投入大几万,跑个垃圾模型,在 token 比自来水还便宜的时代,意义在哪里?
    RW233
        25
    RW233  
       1h 59m ago
    本地 LLM 本身就不是一件有性价比的事情
    cnrting
        26
    cnrting  
       1h 11m ago via iPhone
    你直接问 ai 吧
    XieBoCai
        27
    XieBoCai  
       18 mins ago via Android
    @onetown 大佬,您都是用在哪些场景?这个效果怎么用?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2928 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 127ms · UTC 04:58 · PVG 12:58 · LAX 21:58 · JFK 00:58
    ♥ Do have faith in what you're doing.