TGOcc
V2EX  ›  Mac mini

Air M5 32G 跑本地模型快冒烟了, 6 月没发新硬件, 9 月会发 MAC mini M5 或 M5 Pro 吗?有没有会冲的。

  •  
  •   TGOcc ·
    PRO
    · 2 days ago · 1336 views

    自己上手了 air 最大 32G 内存版本,之前考虑到便携内存也算大能跑大模型,使用后才发现跑本地大模型,温度上升很快,没内置风扇,被动散热很容易被降频。目前用带风扇的支架在用,只能说比没有好,但不解决长期使用问题。

    之前网上传 6 月 WWDC 会发布新机,事实上没发,又开始传 9 月份会发布。按现在大内存版本 MAC 二手价格,桌面端 MAC 新机估计又会被抢购吧。

    想从两个方面考虑,选 64G 版本或 128G 版本,看定价在多少。如果发布能抢的到,溢价高就转,不高就自己用。跑本地大模型不是刚需,就是探索学习,有没有同样想法的朋友啊。

    之前硬盘涨价时,买的企业级固态硬盘 2890 ,后面二手价格到了 8000 元,成了理财产品,越用越值钱。

    现在小道消息挺多,有说起步 16G 内存,取消 256G 存储本版,有没有可能出个 64G+512 或 128G+512 版本。内存大硬盘小点,靠外挂 ssd 解决,经济又实惠数据转存还方便。

    21 replies    2026-06-18 21:27:06 +08:00
    jhytxy
        1
    jhytxy  
       2 days ago via iPhone
    老老实实上两张 2080ti 魔改吧
    mac 就是玩具
    keyu1103
        2
    keyu1103  
       2 days ago
    最后悔的就是去年 7w 不到的 512g mac studio 我觉得贵没买
    后来想起来一看,天塌了
    ETiV
        3
    ETiV  
       2 days ago via iPhone
    上 M5 Ultra 512G
    paopjian
        4
    paopjian  
       2 days ago
    你这需求真不是被本地大模型异化了吗, 口口声声说不是刚需, 只是探索, 却在期待换新的大内存版, 说明现在大内存变成了你唯一在期待的目标, 在没有明确瓶颈的需求却变成了不断在意的东西, 如果你脑子一热, 真的花钱买了, 会后悔吗?
    TGOcc
        5
    TGOcc  
    OP
    PRO
       2 days ago
    @jhytxy 没打算当生产力工具,台式机有一张 3080 ti 12G 的卡,也能跑一些小点的模型。mac 生态联动上挺方便。


    @keyu1103 现在应该二手上十几万了吧


    @ETiV M5 Ultra 512G 新发价格肯定不便宜吧,除非当理财去买,风险不好说。能自己用或转手两个平衡一点,心态也会好些。
    ETiV
        6
    ETiV  
       1 day ago via iPhone
    我觉得 Mac 的算力大概率就这样了

    Mac 内存带宽再高就要被出口管制了…
    为了能在全球卖,肯定有一个峰值,买回来八年内都不用换机器

    我现在 DGX spark 上跑 DeepSeek v4 flash ,不到 12tok/s ,接 Claude code 上,不需要马上响应的 agent 也能用…(比如每日总结飞书聊天记录啥的
    TGOcc
        7
    TGOcc  
    OP
    PRO
       1 day ago
    @paopjian 不存在后悔吧,大内存版本当家用机器也能战个四五年没问题,再加上可能升值的期待。不升值自己用,升值就转手。也就没后悔一说。很多时候买一件某件东西是冲动消费,可能实际使用需求只有 10%-30%。就跟换手机一样,有人一年一换,也有二年三年一换,还有不坏就不换。我不是绝对理性,对数码电子产品有兴趣,关注投入就多些。(如 AR 眼镜、无人机、数码相机、电子阅读器)大彊还没这么大时,还众筹过一款掌上无人机。
    MagicLi
        8
    MagicLi  
       1 day ago
    不会,结束。
    TGOcc
        9
    TGOcc  
    OP
    PRO
       1 day ago
    @ETiV 512G 版本太高端了,要做生产力工具,预算也够的冲没问题啊,真是探索学习,或是兴趣爱好,这成本太高了。在内存硬盘涨价的今天,价格肯定不会低于之前 512G 的版本吧。
    wu67
        10
    wu67  
       1 day ago
    你这典型的伪需求啊, 干活买 API 套餐就行.
    验证想法模型调教, 你可以直接买计时的云机器, 用完就把数据拉回来、删除实例. 几万十几万的钱, 够你用好久了.
    TGOcc
        11
    TGOcc  
    OP
    PRO
       1 day ago
    @wu67 可能算是伪需求吧,有时就是折腾,喜欢那个折腾的过程,在不停的折腾中学习跟享受过程,就像钓鱼佬(没贬义的意思),买器材的钱,能买多少鱼是一个道理。
    marcong95
        12
    marcong95  
       1 day ago
    @jhytxy 单 2080Ti 22G 在用,tok/s 好像比我 M2 还低,即便是换成双卡也不见得比 M5+ 好吧
    quantum00549
        13
    quantum00549  
       1 day ago
    理解喜欢折腾的心情, 但是, 哪怕是最顶配的 mac, 以及各种消费显卡, 能跑出来的模型在我的工作场景都没法用
    TGOcc
        14
    TGOcc  
    OP
    PRO
       1 day ago
    @quantum00549 是的,关键是能不能适配自己的使用场景。
    xubeiyou
        15
    xubeiyou  
       1 day ago
    额 我真觉得不是豪 没必要折腾 买 token 就可以了诶
    felixcode
        16
    felixcode  
    PRO
       1 day ago
    折腾了大半天,还完全比不上买 API 的效果。
    TGOcc
        17
    TGOcc  
    OP
    PRO
       1 day ago
    @xubeiyou 实用上来讲,免费的模型都已经够我日常使用了。

    @felixcode 折腾的过程也挺有意思的,就像买无人机,飞的不多(现在的新规就更少飞了),也拍不出别人的大片感觉,但这中间花的时间学习跟试错都挺有意思。
    tubanwu
        18
    tubanwu  
       1 day ago
    买个二手的 M1MAX 64g 的玩玩得了
    TGOcc
        19
    TGOcc  
    OP
    PRO
       1 day ago
    @tubanwu 现在二手也不便宜啊,能抢到新发的话,搞不好价格贵不了太多性能提升大。数码电子类产品买新不买旧。
    techhe
        20
    techhe  
       23h 23m ago
    我一台 4090d+128g 内存,跑 32B 都不快,达不到生产级,是不是部署的有问题?
    TGOcc
        21
    TGOcc  
    OP
    PRO
       16h 33m ago
    @techhe 不正常吧,我 32g 内存,跑 Qwen3.6-35B-A3B-4bit 速度还不错。


    oMLX - LLM inference, optimized for your Mac

    Benchmark Model: Qwen3.6-35B-A3B-4bit
    Engine: Auto
    ================================================================================

    Single Request Results
    --------------------------------------------------------------------------------
    Test TTFT(ms) TPOT(ms) pp TPS tg TPS E2E(s) Throughput Peak Mem
    pp1024/tg128 1265.0 15.99 809.5 tok/s 63.0 tok/s 3.296 349.5 tok/s 19.20 GB
    pp4096/tg128 6128.9 16.64 668.3 tok/s 60.6 tok/s 8.242 512.5 tok/s 19.89 GB

    Continuous Batching
    pp1024 / tg128
    --------------------------------------------------------------------------------
    Batch tg TPS Speedup pp TPS pp TPS/req TTFT(ms) E2E(s)
    1x 63.0 tok/s 1.00x 809.5 tok/s 809.5 tok/s 1265.0 3.296
    2x 119.1 tok/s 1.89x 461.2 tok/s 230.6 tok/s 2847.9 6.591
    4x 235.4 tok/s 3.74x 370.4 tok/s 92.6 tok/s 6131.4 13.234
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2503 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 69ms · UTC 06:00 · PVG 14:00 · LAX 23:00 · JFK 02:00
    ♥ Do have faith in what you're doing.