Air M5 32G 跑本地模型快冒烟了， 6 月没发新硬件， 9 月会发 MAC mini M5 或 M5 Pro 吗？有没有会冲的。

自己上手了 air 最大 32G 内存版本，之前考虑到便携内存也算大能跑大模型，使用后才发现跑本地大模型，温度上升很快，没内置风扇，被动散热很容易被降频。目前用带风扇的支架在用，只能说比没有好，但不解决长期使用问题。

之前网上传 6 月 WWDC 会发布新机，事实上没发，又开始传 9 月份会发布。按现在大内存版本 MAC 二手价格，桌面端 MAC 新机估计又会被抢购吧。

想从两个方面考虑，选 64G 版本或 128G 版本，看定价在多少。如果发布能抢的到，溢价高就转，不高就自己用。跑本地大模型不是刚需，就是探索学习，有没有同样想法的朋友啊。

之前硬盘涨价时，买的企业级固态硬盘 2890 ，后面二手价格到了 8000 元，成了理财产品，越用越值钱。

现在小道消息挺多，有说起步 16G 内存，取消 256G 存储本版，有没有可能出个 64G+512 或 128G+512 版本。内存大硬盘小点，靠外挂 ssd 解决，经济又实惠数据转存还方便。

大模型

内存

散热

21 replies • 2026-06-18 21:27:06 +08:00

jhytxy

2 days ago via iPhone

老老实实上两张 2080ti 魔改吧
mac 就是玩具

keyu1103

2 days ago

最后悔的就是去年 7w 不到的 512g mac studio 我觉得贵没买
后来想起来一看，天塌了

ETiV

2 days ago via iPhone

上 M5 Ultra 512G

paopjian

2 days ago

你这需求真不是被本地大模型异化了吗, 口口声声说不是刚需, 只是探索, 却在期待换新的大内存版, 说明现在大内存变成了你唯一在期待的目标, 在没有明确瓶颈的需求却变成了不断在意的东西, 如果你脑子一热, 真的花钱买了, 会后悔吗?

TGOcc

PRO

2 days ago

@jhytxy 没打算当生产力工具，台式机有一张 3080 ti 12G 的卡，也能跑一些小点的模型。mac 生态联动上挺方便。

@keyu1103 现在应该二手上十几万了吧

@ETiV M5 Ultra 512G 新发价格肯定不便宜吧，除非当理财去买，风险不好说。能自己用或转手两个平衡一点，心态也会好些。

ETiV

1 day ago via iPhone

我觉得 Mac 的算力大概率就这样了

Mac 内存带宽再高就要被出口管制了…
为了能在全球卖，肯定有一个峰值，买回来八年内都不用换机器

我现在 DGX spark 上跑 DeepSeek v4 flash ，不到 12tok/s ，接 Claude code 上，不需要马上响应的 agent 也能用…（比如每日总结飞书聊天记录啥的

TGOcc

PRO

1 day ago

@paopjian 不存在后悔吧，大内存版本当家用机器也能战个四五年没问题，再加上可能升值的期待。不升值自己用，升值就转手。也就没后悔一说。很多时候买一件某件东西是冲动消费，可能实际使用需求只有 10%-30%。就跟换手机一样，有人一年一换，也有二年三年一换，还有不坏就不换。我不是绝对理性，对数码电子产品有兴趣，关注投入就多些。(如 AR 眼镜、无人机、数码相机、电子阅读器）大彊还没这么大时，还众筹过一款掌上无人机。

MagicLi

1 day ago

不会，结束。

TGOcc

PRO

1 day ago

@ETiV 512G 版本太高端了，要做生产力工具，预算也够的冲没问题啊，真是探索学习，或是兴趣爱好，这成本太高了。在内存硬盘涨价的今天，价格肯定不会低于之前 512G 的版本吧。

wu67

1 day ago

你这典型的伪需求啊, 干活买 API 套餐就行.
验证想法模型调教, 你可以直接买计时的云机器, 用完就把数据拉回来、删除实例. 几万十几万的钱, 够你用好久了.

TGOcc

PRO

1 day ago

@wu67 可能算是伪需求吧，有时就是折腾，喜欢那个折腾的过程，在不停的折腾中学习跟享受过程，就像钓鱼佬（没贬义的意思），买器材的钱，能买多少鱼是一个道理。

marcong95

1 day ago

@jhytxy 单 2080Ti 22G 在用，tok/s 好像比我 M2 还低，即便是换成双卡也不见得比 M5+ 好吧

quantum00549

1 day ago

理解喜欢折腾的心情, 但是, 哪怕是最顶配的 mac, 以及各种消费显卡, 能跑出来的模型在我的工作场景都没法用

TGOcc

PRO

1 day ago

@quantum00549 是的，关键是能不能适配自己的使用场景。

xubeiyou

1 day ago

额我真觉得不是豪没必要折腾买 token 就可以了诶

felixcode

PRO

1 day ago

折腾了大半天，还完全比不上买 API 的效果。

TGOcc

PRO

1 day ago

@xubeiyou 实用上来讲，免费的模型都已经够我日常使用了。

@felixcode 折腾的过程也挺有意思的，就像买无人机，飞的不多（现在的新规就更少飞了），也拍不出别人的大片感觉，但这中间花的时间学习跟试错都挺有意思。

tubanwu

1 day ago

买个二手的 M1MAX 64g 的玩玩得了

TGOcc

PRO

1 day ago

@tubanwu 现在二手也不便宜啊，能抢到新发的话，搞不好价格贵不了太多性能提升大。数码电子类产品买新不买旧。

techhe

23h 23m ago

我一台 4090d+128g 内存，跑 32B 都不快，达不到生产级，是不是部署的有问题？

TGOcc

PRO

16h 33m ago

@techhe 不正常吧，我 32g 内存，跑 Qwen3.6-35B-A3B-4bit 速度还不错。

oMLX - LLM inference, optimized for your Mac

Benchmark Model: Qwen3.6-35B-A3B-4bit
Engine: Auto
================================================================================

Single Request Results
--------------------------------------------------------------------------------
Test TTFT(ms) TPOT(ms) pp TPS tg TPS E2E(s) Throughput Peak Mem
pp1024/tg128 1265.0 15.99 809.5 tok/s 63.0 tok/s 3.296 349.5 tok/s 19.20 GB
pp4096/tg128 6128.9 16.64 668.3 tok/s 60.6 tok/s 8.242 512.5 tok/s 19.89 GB

Continuous Batching
pp1024 / tg128
--------------------------------------------------------------------------------
Batch tg TPS Speedup pp TPS pp TPS/req TTFT(ms) E2E(s)
1x 63.0 tok/s 1.00x 809.5 tok/s 809.5 tok/s 1265.0 3.296
2x 119.1 tok/s 1.89x 461.2 tok/s 230.6 tok/s 2847.9 6.591
4x 235.4 tok/s 3.74x 370.4 tok/s 92.6 tok/s 6131.4 13.234