Chihaya0824

Chihaya0824

🏢  雑魚
V2EX member #432561, joined on 2019-07-28 21:24:43 +08:00
Today's activity rank 3551
Per Chihaya0824's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
Chihaya0824's recent replies
gguf 是这样的,有几点 op 可以试一下,算是在小显存里挣扎的一些经验
1.用 fp8 的 kv cache
2.尝试用 speculative decoding ,就是说你把 MTP 给打开,应该能够让 tps 变高挺多的,后续如果有 dflash 还可能可以提高更多
3.接受质量损失去用 awq 版,但是肯定不会比 fp8 好
都可以试一下,8 个 h20 肯定可以跑的,而且 kvcache 还可以做 tiering ,可以用内存 swap ,变相支持更多用户(一定程度上)
@murongxdb 你是否在找
https://arxiv.org/html/2605.15184v1
前几天才看见这个 paper
不行,这种 cpe 最好还是中兴或者华为之类的,他们信号不是很好,开源也不是很好(以前开,现在好像都不开了
May 19
Replied to a topic by roykingH NAS 致态的 SC001 固态盘是不是有问题?
直通到 Windows 虚拟机里在 CDI 截图呗,如果不愿意拆下来的话
@roykingH
Not X but Y 直接判定为 AI slop
原版散热比较差
其他散热据说好一点,但是我只用过原版
反正买一个以上千万不要堆叠摆放,他会降频
Apr 24
Replied to a topic by JZen 分享发现 一个性价比极高的数据冷备份路子
@x86 同问,但是没那么大
目前想 28T * 8 了,一段时间内应该是够用了
Apr 20
Replied to a topic by yusf 程序员 第一次见这么细致的笔前端笔试题...
一眼白嫖,如果 op 非要去做,做完了千万别给代码,建议就是不要做
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5357 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 08:01 · PVG 16:01 · LAX 01:01 · JFK 04:01
♥ Do have faith in what you're doing.