| RSS |
| 自己做了一款在线 GPU 推理速度计算器 · TPS Calculator diudiuu • May 7 • Lastly replied by diudiuu | 12 |
| 我做了个工具让 8GB 显卡跑 30B 模型从 3 tok/s 提到 21 tok/s,记录一下技术发现 KaiWuBOSS • May 6 • Lastly replied by kevan | 107 |
| 有一台 16 寸 m1max 64g+1T 满 GPU 的 MacBook Pro 适合部署哪个本地模型 alangz • May 2 • Lastly replied by davidqw | 11 |
| 用 antirez 的 llama.cpp fork 把 DeepSeek v4 Flash 在本地跑起来了
Livid PRO |
15 |
| qwen3.6 27b 本地编码测试 zsj1029 • May 2 • Lastly replied by zsj1029 | 62 |
| 全球本地部署开发者们一起,打造一个真正属于开源社区的 Coding Agent 了 KaiWuBOSS • Apr 29 • Lastly replied by coefu | 29 |
| xllm 真的比 vllm+plugin 性能好么? joeue404 • Apr 27 |
| 各位推荐一个 32G Macbook air M5 可以跑的 moe 模型 Hermitist • Apr 26 • Lastly replied by Hermitist | 19 |
| 请教一个关于模型训练主机配置的问题 jamme • Apr 26 • Lastly replied by zhoukevin233 | 12 |
| 大伙有想过二次训练吗? archxm • Apr 25 • Lastly replied by mingtdlb | 9 |
| 想在本地部署 OCR 服务,解析美团的外卖订单截图,求推荐一个好用的 OCR 模型 EchoPrince • Apr 28 • Lastly replied by PersueYan | 48 |
| 多台 GPU 之间怎么组网互联? mingtdlb • Apr 26 • Lastly replied by makictos | 30 |
| 用 DGX Spark 做这些事情,是否能力合适/足够,有佬能解答吗?(估算也行) qazwsxkevin • Apr 25 • Lastly replied by diudiuu | 6 |
| 有没有简单版的 new-api 项目 novaren • Apr 28 • Lastly replied by wukaige | 7 |
| 部署本地模型 token 输出万能公式 diudiuu • Apr 21 • Lastly replied by diudiuu | 3 |
| 本地部署靠不靠谱? jdjingdian • Apr 20 • Lastly replied by diudiuu | 6 |
| 为什么你该停止使用 Ollama catazshadow • Apr 22 • Lastly replied by seakingii | 14 |
| [求助] DGX Spark 上 Ollama 推理极慢,改用 llama.cpp 部署是否更合适? diudiuu • May 19 • Lastly replied by diudiuu | 48 |
| 本地大模型多大显存够用? s2555 • Apr 23 • Lastly replied by s2555 | 14 |