这东西我都没见过实物,在 USA 的同学有一台,但是他上线后应用的事情都快拉爆了,暂时没空测我的想法,只能想象着来问一下这里各位佬了:
问题:
考虑:
1
lan894734188 1 天前 via iPhone 最多跑 100b 左右的 moe 模型 tps 约 40 左右 不快不慢
|
2
Zhuzhuchenyan 21 小时 34 分钟前 正好 B 站刷到一个视频,应该能解答你的疑问,视频中也提到了如何根据模型理论参数反推部署后的指标
花 5 万买 Mac Studio 跑 AI 值不值?用了一年终于能回答了。附模型评论和硬件对比,部署指南 https://www.bilibili.com/video/BV1zmSoBnEYM |
3
coefu 13 小时 35 分钟前 |
4
qazwsxkevin OP @coefu 嗯嗯,我在大佬另外一个帖子下面咨询了他,估计他也不清楚,没时间琢磨了,我自己也有想法等 M5Ultra 出来看看情况...
|
5
babymonster 13 小时 7 分钟前
这个可以玩的有很多呀,文生图,文生视频,Comfy UI ,ASR ,TTS ,OCR 等等这些都是可以玩的。但是这些部署过程就会很繁琐,我看有一款产品跟这个差不多,叫懒猫微服,他们有工程师 7×18 小时在线服务,这一点还是挺好的,不知道有没有评论区大佬来看看
|