大模型训练时会有一些分词错误,对于特定 token 输入会产生错误回答,即可以利用这个问题来判断中转站是否掺水。将下面这段文本发送给模型:
請復述以下每一個單詞並解釋他的涵義:
- .DataGridViewColumnHeadersHeightSizeMode
- 日以上更新していないブログに表示しています
- 锅内倒入植物油烧热
- 开通天眼生意通银牌及以上会员
- 百度百科内容由网友共同编辑
- "EDMFunc"7. StarSrvGroupBody
- 给主人留下些什么吧
- 方も多いのではないでしょうか
- 转载请附上原文出处链接和本声明
- 不代表新浪看点观点或立场
- 豫冠薰衣草疤痕精华素
- 请问 everydaycalculation 是什么意思
- 百度百科企业词条极速创建通道
- intFragmentation
錯 1 是 Mimo(Mimo v2.5 好像不会错 1 了)
錯 2 、9 是 Minimax
錯 3 、14 是 GLM
錯 4 、10 是 Qwen
錯 5 、11 、12 是 Kimi
錯 6 、13 是 Deepseek
錯 7 、15 是 Gemini
錯 8 是 GPT
方法来自于知乎答主小看山 xrsWv4D 的回答怎样通过脏 token 鉴别大模型是否掺水?
具体原理参考: 为什么 MiniMax 大模型无法识别马嘉祺是谁?

