6 月 25 号的消息,Anthropic 指控阿里巴巴开展了“迄今为止已知最大规模的蒸馏攻击”。该公司在致美国会议员的信中称,阿里巴巴创建了近 2.5 万个虚假账户,通过与 Claude 进行交互来获取能力。
我靠,这是真的假的?大厂真在默默干这种事啊?
我靠,这是真的假的?大厂真在默默干这种事啊?
1
mokeyjay 2 days ago 不是哥们,模型互蒸是啥新闻吗?不都是行业惯例
|
2
zuokanyunqishi 1 day ago
哈哈,读书人不叫偷书...
|
3
zuosiruan 1 day ago via iPhone
这不是公开的秘密吗
|
4
levn 1 day ago
现在不是都知道了吗。用户现在的抱怨都是他们蒸馏的不够好。
如果能蒸出一个 230b 的 opus4.6 的话…… |
5
x86 1 day ago via iPhone 我蒸别人笑嘻嘻,别人蒸我死个🐎
|
6
muapyw 1 day ago A➗
ai 界的婊子 |
7
v2gba 1 day ago 只要蒸完开源 群众就站在它那边
|
8
imnpc 1 day ago
都一样 没有一家不蒸馏的
|
9
pnczk2019 1 day ago
他为什么会没本事防住人家呢.干啊.封号啊.
|
10
HappyFox 1 day ago A➗搁那纯扯淡,但凡了解过 Agent 和 AI 的人都知道这中低质量数据不是大厂蒸馏用的。
原文是 [Anthropic 在信中称,阿里在 4 月至 6 月间利用近 2 万 5000 个欺诈账户,与 Claude 进行了 2880 万次对话] 。好,既然三个月,就按照 90 天算, [28800000/25000/90=12.8] ,但凡正经用个网页版都比这次数多。 另外 A➗揣着明白装糊涂,Agent 进行一次完整的编程,从了解上下文、构建记忆、编写 demo 、运行测试、验收结果,少的也得 20 次以上的请求,多的上百、上千次都不止。 甚至用“次”来界定是否蒸馏都纯外行,都是多少轮以上的“会话”,也就是一个 session 下多少次请求,这类高质量会话想要收购,只能找中转站或者自己内部收集,其他领域的都是噪声,且收购成本一个都得几十块钱。 综上,怀疑是自费上班的大厂老哥 or 零星用户 or 用阿里云开中转站,被 A➗看见以后拿出去捞钱。 另外多一句嘴,A➗是真的脸都不要了。正经公司即使是使用用户数据做训练,也要脱敏,绝不能看明文。A➗这直接看明文数据来推算用户信息,是真的把自己当上帝了。 |
12
argentea 1 day ago
偷得好,节约了很多算力资源,在这个算力短缺的年代我是支持相互蒸馏的
|
13
userding2 1 day ago
今晚号被封了。。。不知道跟这有没有关系
|
14
wolfie 1 day ago
国内企业抄袭不是基操吗
|
15
Yadomin 1 day ago
那 A\ 能不能解释一下为什么 Opus 4.8 会自称是 Qwen 啊
|
16
BigShot404 1 day ago
他蒸馏全世界给我打过招呼么?
|
17
photolife 1 day ago
这正常吧,国内这些大厂节操在外面能直接破产加终身监禁。。。
|
18
toubi 1 day ago opus4.8 2T ~ 4T 规模的。
glm5.2 0.7T 规模。 用不到 1 半的参数规模。保守估计能到达 75%的水平。看着不够夸张,但是要知道 A\囤了多少芯片,他能一直训练试错。所以 A\就是纯堆参数,力大飞转。 只可惜国内这些企业没那么多芯片算力,没那么多试错空间,要是给足了算力,国内这些企业更是能给你堆出个花样来。所以 A\极力阻止出口 ai 芯片给中国。 |
19
chitanda 1 day ago 这吊公司,别人几万个号蒸馏他,他防不住,正常用户真金白银用动不动封号
|
22
lscho 1 day ago via Android @stabc 看不懂就别抬杠了。。。➗25000 是人家在算单账号请求次数。结果是单账号平均 12.8 次
人家接下来就说了少于 20 次根本不可能完不成一次 agent 编程。 你可以用 agent 编程工具做一个小功能试试,会产生多少次请求 |
23
stabc 1 day ago
@lscho 你没用过 AI 编程就别发言。首先一个任务需要多少次请求不确定,要看任务大小。其次 api 请求是无状态的,你把一个任务拆分给多个账号,甚至多个 AI 模型都可以。
|
24
PalenessIb 1 day ago 往大而空的方向扯一句:本来也不该、不能让 Anthropic 这种有着病态上帝情结、超级自恋狂、撒谎不眨眼的公司垄断 AI 智力。国产模型有意无意在做的 AI 平权,对全人类都在做贡献。
|
25
xiaomushen 1 day ago
不不不,Anthropic 不会蒸馏别人,最多只是学习。
Anthropic 才是人类道德楷模,他家说啥就是啥。 当然,上述这些话,西方人是不信的,大部分中国人也不信。但架不住美国政客相信鸭,哈哈哈 哦对,还有 X 上一部分简体中文的二极管生物,他们也信。 |
26
bronyakaka 1 day ago
这是好事啊
|
27
Lemonyi 1 day ago
群众:这不是马哥风格嘛,怎么跑阿里去了
|
28
HappyFox 1 day ago
@stabc #23 [你没用过 AI 编程就别发言] 这句话太重了,你应该向楼上 V 友道歉。
关于你说的 1 、 [为什么要➗25000 ] 因为用过 cc 的都知道 5H 限制和周限,这决定着任何一个脑子没问题的公司如果想蒸馏,那用量必然是平均的,不可能某个账号开了套餐后放那不用 2 、 [之所以用欺诈账户就是为了看起来合理] 很遗憾,如果你真的从事过中转站 or 数据行业,就应该知道目前最好的 agent 数据只能从各种形式的中转站获取,包括不限于内部网关、亲自下场开中转站(某上市企业中转站质量和价格那叫一个香)、联系中转站买数据 3 、 [首先一个任务需要多少次请求不确定,要看任务大小。] 没人让你预测多少次,但高质量对话就是 20 次以上的硬标准,你找个数据贩子问问 10 次以下交互的对话收不收就知道了 4 、 [其次 api 请求是无状态的,你把一个任务拆分给多个账号,甚至多个 AI 模型都可以] 有一种东西叫缓存,找中转站、内部建网关要的就是成本低,真用 api 直接去 openroute 和云厂商自部署了(这两种可选数据不回传,A➗能查个锤子)。 |
29
HappyFox 1 day ago
#28 顺便补一下 agent 大爆发前的数据价格,开中转站的 V 友收到的消息是“10 次以上才收”,编程相关、次数大于 20 乃至 50 的高质量的会话,贩子从中清洗后,卖给公司只会更贵。
https://v2ex.com/t/1197381 |
30
yuedashi 1 day ago via Android
早期大家谈蒸馏,大家都默认是 AI 大模型领域一个常规的技术方案。现在被 A÷硬是搞成变成抄袭,剽窃的邪恶技术了。。。特么的自己用维基百科,爬互联网数据,爬 github 代码,给人打过招呼吗
|
31
webcape233 1 day ago
蒸餾就蒸餾,加個“攻擊”啥意思
|
33
stabc 1 day ago @HappyFox 看到第一点就没必要看下去了,你根本看不懂上下文。我一直说的是总量。
➗25000 有什么意义?不知道 A➗喜欢封号?它都识别出批量欺诈账号了还让你所有账号跑满 3 个月了? |
34
jjx 1 day ago
SpecStory 这个插件能将你的会话记录云端保存
这样看来是笔好生意啊 |
35
iixy 1 day ago
蒸馏攻击?发明这个词的人跟发明恶意举报的人都是天才
|
36
Zarhani 1 day ago
「你说得对,但是蒸完了人家是真开源」
|
37
pagxir 1 day ago via Android
Anthropic 他们这些言论侧面反映了他们自身相对同行并没有什么技术门槛。
|
38
qxmqh 1 day ago
A\的市值能干到快一万亿美刀,我是不敢想这里的泡沫得多大,妈的,快能把太平洋给洗个泡泡浴了。
|
39
SeptApt 1 day ago
反人类学
|
40
chutianyao 1 day ago
因吹斯汀
|
41
laofan666 1 day ago
跟新疆棉一个性质,自己干的事赖别人头上
|
42
Sh15 PRO 这是好事啊,就得蒸,好像你不蒸别人一样
|
43
gason406 1 day ago
A/不让别人蒸,说明他爱美国
A/蒸别人,还是说明他爱美国 狗皮爱国,就硬炒作罢了 |
44
gpt5 1 day ago via iPhone
帖子里来了很多阿里水军😡😡😡
|
45
ccsexyz 1 day ago
Dario 偷完千问还指责阿里有点不要脸了。
|
46
ningxing 19h 45m ago
真假无所谓,它自己的训练素材资源还不是 google 、github 和互联网上找的蒸馏的。大哥不说二哥,不知道它怎么有脸说的。
|
47
fyq 19h 29m ago
这一下不就对上了!
站里有人控诉用阿里云开中转被封账号; 那边说阿里对他们搞蒸馏…… |
48
matthewgao 18h 3m ago
是假的,这个不是阿里,昨天开会刚同步过。而且阿里本来就正规采买了 Claude
|
49
liuzhihang 16h 42m ago via iPhone
我自己充值的账号,不会被认定为中国用户在蒸馏吧?
|
50
duchenpaul 10h 55m ago @matthewgao 这个跟花钱不花钱没啥关系, 应该是使用 claude 生成的东西来训练自己的模型这个行为违反 claude 的 TOS
|
51
jackerbauer 6h 38m ago
不都在互相蒸馏么
|
52
xiaomushen 5h 51m ago
Anthropic 是人类道德之光,他们说的,一定是对的
|
53
jaskell 5h 44m ago via Android 就是定义解释权的问题,先污名化你,再定义自己的正义和主导地位,anthropic 的做法观感就很不好
|
54
astrodaw 4h 16m ago
才 25000 大厂没这么舍不得,不可能这么少
|
55
dkhcyx 3h 2m ago
hackernews 上都是对 anthropic 的冷嘲热讽
|