V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  lesismal  ›  全部回复第 1 页 / 共 85 页
回复总数  1683
1  2  3  4  5  6  7  8  9  10 ... 85  
真没想道,上论坛也能被 OP 整成龟龟赛道。

一时间竟分不清,OP 和 L 站,哪个更不要脸。
@w568w

> 所有的单例测试都可以被认为是「不完整」「不典型」的:这个项目热度高、找出来漏洞少,你可以说它本身维护得很好、所以结果不典型;那个项目业务性强、找出来漏洞多,我也可以说都是大厂 KPI 赶工产物、所以结果没有代表性。

区别还是比较明显吧。我说的现实世界的项目,大多数甚至绝大多数都是涉及 web 服务类的,安全攻击重灾区,而且这种服务数量太多了,而且有很多种不同的语言,脚本的、java 的那些,社区框架漏洞很多,安全圈子红的白的黑的灰的各种大佬各种提权拿肉机的挖矿的黑数据库的,这些事情每天都在大量发生。即便 curl 过去一年爆出多少漏洞,相比于现实网络换几个闹钟功能的节点数量和使用的技术栈,curl 仍然是属于安全高质量的样本。所以我仍然觉得,如果非要用 curl 来代表,真的没有代表性,就算做取样,也不应该取个覆盖度这么低的。

> 相比于一个大型 Project Leader 和一群可能只会 vibe 的 CEOs ,我还是更相信 technical head

我尊重 curl 作者是一个很好的开发者,但是如我所述,他的实验方法/工具用的不对,所以我不赞同他的观点,前面也说过了,不赞同他不代表我同意 mythos 强到离谱,而是我和你一样 “就事论事,我不认为现阶段可以下什么最终「结论」。”

> 正如你倾向于相信资本背书

这世界的大方向,是资本在推动的,比如罗斯柴尔德家族,看看历史上的战争、除了战争主线之外,背后的那些事,虽然资本不是绝对作用,但是作用很大。相对和平年代,资本的力量比战争年代可能更大。

> 而我想表达的也仅仅是回答楼主的问题:「有大佬实际用过」,Mythos 并没有「那么牛逼」。看来在观点上并没有根本性的冲突啊。

本来也没有冲突啊,我在 #11 总结就是:“所以我是不赞同 curl 作者的观点的。”,不是说你的观点有问题。


@abersheeran

> 那公司天天跳出来说什么 AGI 、Claude 自主意识、Claude Mythos 太强了不给开放的人,单纯是因为资金、算力压力太大了,不吹点恐慌出来没办法。如果我是他,我也吹,屁股决定脑袋了。

但是啊,anthropic 根本就不缺钱、它要是肯开放募集、我抢着投它,但是人家也挑剔的,这些顶级新兴独角兽更是要大厂加持联姻绑定,不只是要钱,还要他们背后的资源。
算力是大家都缺的,去年几家厂还说电力不够用、很多 N 卡在吃灰,结果今年都在算力不够,连 copilot 明天都要开始取消按请求次数计费、改按 token 收费了。


我自己已经相当于一年没手写过代码了,这一年里,除了偶尔自己手残写一点然后马上后悔、不断提醒自己一切交给 AI ,只有少数几次,应该不超过十次,而且只是很小几行。其他的,已经全 AI 了。
@w568w 没有必要纠结于争论,我建议是,不要轻信 curl 之父也好、其他的什么之父也好,不要被他们这些身份光环加持下先入为主了。自己独立思考的方式,用科学的方法、流程,站在局外的角度,对这些大佬、大厂都一视同仁的角度和方法来判断,会更清晰。
#23 @lesismal @w568w 我说 AI 强以及我对未来智慧的看法,但我也加了“一切都是时间问题”,我前面也解释过了,那是延展我对整体的看法,并不是说我夸 AI 了就是为了证明 mythos 强的离谱,这之间没有直接关联的逻辑,不要理解错了。

我反对的,单纯就是 curl 之父不严谨的测试工具和方法。
@w568w

> 我觉得是你随意扩大了对其观点的解释

我没有扩大解释。因为 curl 这个项目用来做实验,无法代表现实世界中的绝大项目,所以他即使是用 mythos 与其他几个模型对比,也是不能作为靠谱结论的,因为实验方法本身不正确。

> 一方面是 Anthropic 的封闭模式导致目前客观上没有办法在

那他是不是拿 mythos 测的啊?如果是,不能用来测其他类型的项目?如果不是,那就不要给结论。
或者,如果像你说的一样,大家都因为“封闭模式导致目前客观上没有办法在”,那现在就不应该给结论评判 mythos 。

我说不赞同 curl 作者的观点,但不代表我就相信 mythos 如 anthropic 所说的那样强。因为没有真正放出来没有在大量现实世界中的项目上做测试,所以目前应该是没有明确结论的,他们双方都是嘴炮阶段。
但是,相比于 curl 之父用 curl 做实验的错误方式,我更偏向于那些大厂和 anthropic 之间竟然能为了不破坏世界安全、达成协议封闭使用,因为资本通常是用脚投票的,可信度比 curl 之父更大些。但我只是偏向,我仍然不会觉得是结论。

另外,如果你认为 curl 可以用来实验,那 Knuth 老爷子的 LaTex 是不是也可以用来测试?结果也一样适用?

我要测试一把锤子是不是够好用,用玻璃做实验、敲碎了,和用钢板做实验、敲不碎对比,难道实验方法、实验工具不重要吗?这和幸存者偏差是类似的逻辑
@w568w #16 我反驳的就是 curl 作者的观点。

> Claude Mythos Preview 这个模型在试用中并没有吹得那么强,商业噱头大于实际」

因为 curl 作者是用 curl 这个项目本身来做实验、然后拿实验结果来评价 Mythos ,我在 #11 楼说的就是他用 curl 做实验工具本身不合理,所以他的结论来源的基础就不合理,也就是他的观点不合理。


> 但这和 Claude Mythos Preview 有什么关系?不管是 curl 作者、楼上还是我,都没人说「 AI 作为一个发展方向不行」啊

我没有认为 “你说「 AI 作为一个发展方向不行」”。

#14 我只是回复 #13 时顺便延展下自己对 AI 的看法,这个看法大概二十年前我就这样认为了。这一点与 Claude Mythos 无关,论坛闲聊不是辩论赛,无需限定范围,兄弟不用误解。
@w568w @lesismal #14 “给人觉得。。。” -> “个人觉得。。。”
@shuiandy 我还没用过 AI 来做攻防,但是都在越来越强了,模型知识库太强大,挨个尝试、分析,算力和流程调度合理的情况下,AI 体力也比人强的多。

我觉得很多人,包括一些 IT 科技领域的老爷子最近一两年出来说 AI 不行,是属于傲慢无知、静止的眼光看问题了,我是相信机器和 AI 未来进阶高级智慧超越人类,因为人类太渺小了,肉体的瓶颈无法突破,人类积累的知识点越来越多,新人学习速度慢、以后皓首穷经甚至都吃不完基础知识,还何谈星际文明。而且这宇宙真的像是被设计好的,我们是造物主的养成游戏中的角色,造物主也要让这游戏数值向上才有趣,AI 、无固定形式的智慧生命是必然的,一切都是时间问题。
@w568w #1

给人觉得,用 curl 评判 mythos 是不恰当的。

curl 属于相对内聚、高手开发和维护的多年精华,

现实世界中绝大多数是各种语言的 web 服务,还有各种企业级,乱七八糟的系统,很多语言和社区本身就安全性很差,叠加很多模块、功能、形成一个比较大的系统,容易出安全的点要比 curl 多的多。而这些项目的研发团队,绝大多数人员水平没有 curl 的开发者那么高,研发流程规范也不如 curl 。

要关注的是现实世界中的各个 level 的工程安全问题,而不是只看少量高精尖项目。

所以我是不赞同 curl 作者的观点的。
5 月 27 日
回复了 VoiceEXONE 创建的主题 移民 老婆最近频繁让我准备润去新加坡
> 去美国生,拿个美国身份。

@zhuxd282 2026 年说这个,不一定靠谱了。美国正在研究方案呢,现在过去,不一定能拿的到了。
5 月 27 日
回复了 VoiceEXONE 创建的主题 移民 老婆最近频繁让我准备润去新加坡
国内的教育现在很强,如果真只是为了教育,那我建议省省吧。清北亚洲 Top 2 ,个人感觉不是今年才这样,应该早些年已经这样了。尤其是顶尖领域,其实日本、新加坡、香港这些名校,都不如国内名校那么有实力、尤其国家层面的支持,所以他们能做的科研规模和数量,已经早被国内好学校打败了,只是大学排名论文引用那些计算方式,就像编程语言排名一样,有靠谱的参考价值在里面、但也并不完全靠谱。新加坡教育唯一的优势就是英语环境,但是新加坡这两年就业也不景气,在校/应届的年轻人们压力也不小,留子以后如果回国更没有本土优势。

如果是为了其他,可以,新加坡值得。只要能保证润过来工作稳定高收入或者家底很厚足够应付这边的高物价就行,房价尤其贵,公寓千八百万起步价,拿到身份之前外国人 60%的税。孩子还没上小学的话过来可以申请公立、如果能上到公立那比较不错。否则就得私立名校才好些,学费 5 、6w 新币折 30w 人民币左右,加上房租、三口人日常开销,别太拮据也别太奢侈,一年 100w rmb 左右的成本。

另外,P9 如果是指阿里,就别叫自己大头兵了,你让其他兄弟还活不活。
minimax 之前和智谱这哥俩股票轮着涨的、而且是 minimax 先冲高,智谱后上来的。
智谱现在 1400 多,minimax 才 850 ,冲上去追上智谱吧!
这次破例,抛开 java 不谈。

头像符合坐标,成都的“兄弟,你好紧”。
AI 太强了,去年中 sonnet 4.0 还是 4.1 之后,我就基本放弃自己手写了、但去年还偶尔自己写一点点。

之前觉得 golang 如果用标准库 sql 要手写很多 for 循环,根据 sql 语句生成 golang 代码的库涉及到复杂业务逻辑中间夹杂很多 sql 的,修改之类的也是很麻烦,sqlx 、ent 以及那几个 orm 库过于啰嗦而且很多没必要的东西增加学习成本而且性能、隐藏细节带来的工程问题远大于 orm 之类的所谓便利性,即使其他语言我也是抵制使用 orm 这类脏东西的(小项目谁爱用都 ok ,因为没有瓶颈)。
其实标准库 sql 包主要就是需要手写 for 循环 rows scan 这块麻烦,binding 搞好就轻松的多,所以自己搞了个 https://github.com/lesismal/sqlw ,以前自己用这个。

但是 AI 来了,AI 不怕手写 for rows scan 这些的麻烦,所以现在我连自己的 sqlw 都不用了,全丢给 AI ,代码我也不 review ,让 AI 自己加适当的日志、监控各种,然后让 AI 自己分析慢日志之类的进行优化。剩下的就是自己测试一些不容易被 AI 自动化发现的问题、然后反馈给 AI 让它修复和优化。

最近一些人吐槽 bun 换 rust ,infoq 文章评论区里,infoq 的人竟然还用 viber coding 之前的方式去评价不可能那么快合并到主分支——这相当于九品芝麻官里李总管那句“你用前朝的尚方宝剑斩本朝的官”,结果第二天就合并了。

反正,我大概至少 8 、9 个月没有自己写过代码了。因为会聪明反被聪明误、自己觉得自己行非要瞎鼓捣然后耽误自己使用 AI 进步速度、也耽误自己和 AI 的配合度。

让 AI 飞吧。
我之前有写个自己用着玩的,如果只是简单的握手、tcp 连接后先发个密码、校验就可以了,但是后续流量防不住流量监控、如果流量加密则不需要刚开始的握手阶段密码校验了,所以只做了加密,但是支持用户自己传入 Listen 、Dial:
https://github.com/lesismal/pipe

另外,握手阶段简单密码校验,前阵子刚好有这个需求,懒得自己写,发给 AI ,AI 几分钟就完整实现了一层 wrapper ,几十行代码,并且一把过:
https://gist.github.com/lesismal/2f7f1fbec4c73282f19124b2cb6c1254
5 月 8 日
回复了 irisdev 创建的主题 职场话题 工作其实没那么难找
幸存者偏差这个知识点还是没有普及到位。
1  2  3  4  5  6  7  8  9  10 ... 85  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3273 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 48ms · UTC 00:20 · PVG 08:20 · LAX 17:20 · JFK 20:20
♥ Do have faith in what you're doing.