$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 heimoshuiyu 打赏,数额会 100% 进入 heimoshuiyu 的钱包。
 heimoshuiyu's recent timeline updates
heimoshuiyu

heimoshuiyu

V2EX member #456629, joined on 2019-12-01 14:35:05 +08:00
Today's activity rank 5853
heimoshuiyu's recent replies
@JackalZhao 我认为 “输出侧 tokens” 属于本应缓存命中的部分,而多数 provider 没缓存。关注缓存命中率的话你看不出这个问题,看未命中 tokens 就能发现这个问题,如我图所示,每一次请求的未命中 tokens 都大于上一次请求的输出 tokens 。

另外,假如某个 provider 缓存临时故障,缓存命中率只会下降几个点,被使用习惯的噪声淹没。而未命中缓存指标会有一个非常显眼的凸起
@winnerczwx 我指 gpt5.5 0.3% 是输出侧 token 存在缓存的概率。一次 API 调用包括输入 + 输出两个部分,调用完成后,deepseek 会将输入 + 输出缓存起来,而 gpt 只缓存到输入。因此用户实际上为输出 token 多付了一份输入未命中的钱。

92.7% 这个数值很难说明什么。平时使用的平均会话上下文偏长,这个数值很容易就能刷高。这也是我建议不要使用「缓存命中率」的原因。另外,ccswitch 存在消息重排序破坏缓存的草台 bug github.com/farion1231/cc-switch/issues/3934
好奇为啥无法使用有线连接?
应该看 prompt 次数,token 数容易受到上下文长度的影响
omo 就是垃圾,异步 subagent 简直是瞎搞。很难想像我都烧几百 M tokens 了你还给我用字符串匹配的方式来做意图识别。原本一句话 -> grep -> read -> edit -> bash test 50k 上下文内就能改好的事情,硬生生开 4 个 subagent 上下文干到 150k ,我怀疑觉得 omo 好用的人根本没看 agent 的上下文里被 omo 塞了什么构思
@sommio 因为有些用户的 agent 客户端可能丢弃空思考块,用了 cc-switch 这玩意也丢思考块,不知道其他工具修了没。
newapi 适配了呀
kiss translator
最好的学习资源是优秀项目的源代码
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3740 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 04:39 · PVG 12:39 · LAX 21:39 · JFK 00:39
♥ Do have faith in what you're doing.