V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  ntdll  ›  全部回复第 5 页 / 共 181 页
回复总数  3616
1  2  3  4  5  6  7  8  9  10 ... 181  
其实抛开模型不谈,你做的东西,本质上是一个 AI Agent ,我理解的正确吗,至于模型是本地还是远程,国内还是国外,其实并没有什么影响。

而 AI Agent 的核心问题就在于 Agent Loop 怎么设计,以及如何编排不同的 Agent 。

其实类似的需求,我自己动手已经做了一丢丢,只是应用场景上,比你考虑的要收窄了许多,是某个领域特化的 Agent ,虽然也还没做到能用的程度就是了。

我自己的体验是,做这个玩意,跑起来不难,但是到好用还是挺难的。就是能用 -> 好用的这个路径很长。
4 月 28 日
回复了 mains 创建的主题 程序员 codex 周额度刷新了,提前了 21 小时,小赚
哎呀,真是服了呀,还剩下 29%的周限没用完,亏了一个亿
其实拆了,也很难维持。我经常遇到 Claude 说

我现在已经完成 xxxx ,下一步是 xxxx ,如果你愿意的话,我可以 xxxxx

然后就停那了,明明它啥都知道,就是要你回个“继续”

我也试过提示词里告诉他,直到完成之前,不要问我,也不用告诉我任何中间状态,但依旧出现:

我已经完成了 xxxx ,下一步要做 xxxx ,用户的原话是:xxxx (就是我那一句让他不要停的提示词)

然后停在那了,等我回复
4 月 27 日
回复了 mightofcode 创建的主题 职场话题 我公司真的有古法编程程序员
唔,Vibe 我也用,但是并不觉得它的效率会有多高,反复的等待、沟通、试错,甚至比我手写还慢一些,尤其是项目规模大了以后,vibe 出来的,说是狗屎都不过分。我觉得但凡是一个已经上线的项目,都很难无脑就上去 vibe 。

我现在也只敢在小型项目和自己的玩具里用。
本地能跑起来的,只有弱智,你看不上。
不弱智的,本地根本跑不起来。

本地能跑起来的模型,只有一些方向特化的,比如某些模型,只能做分类,只能做某种识别,这种特化过的模型,本地才有可能跑起来,且有意义。
看起来是 nVidia only

如果有用 AMD + Windows 的组合,可以尝试把 llama.cpp 的后端改成 vulkan ,会比 ROCm 的推理速度快上一档。在 Linux 上,我试下来是 ROCm 更快,但 Windows 相反。
我现在是 gpt 5.4 做规划,gpt 5.3 codex 做编码,Plus 订阅,勉勉强强还是够用的,加上前几天,好几次重置额度,现在还有点富余。
4 月 23 日
回复了 cMoon 创建的主题 职场话题 转摄影有什么建议吗
如果是兴趣爱好,那问题不大
如果是奔着赚钱,那很可能不赚钱

你就先随便去几个私人工作室、影楼,花点钱,去拍一个,然后和摄影师闲聊一下看,了解下工作强度和收入。

杭州这里,我了解的,收入高一点的是,出外景跟拍的早 8 开始,结束时间不固定,快的话在晚上 6 点,慢一点得晚上 9 、10 点,这样一天大概六七百上下。就这还有明显的淡旺季,也不是天天有活。

如果是棚拍的话,收入就更低了。

然后摄影自己还负责照片的一级调色,男摄影如果跟拍对象有男性的话,还得负责男士的服装搭配。

拍摄器材还得自己购买。
我反倒觉得龙虾的锅没那么大,以现在不断涨价的订阅价格来看,龙虾真的能值这个订阅费吗,还是说都是有钱的大佬就爱玩,不在乎钱呢。

我觉得这两个答案都是否定的。普通人玩玩,能花 200 买个 coding plan 的人,大概率是少数,更多人是没有付费意愿,只想白嫖或者本地部署的。
4 月 21 日
回复了 mains 创建的主题 OpenAI Codex 周额度又刷新了,省着用的血亏
现阶段,codex 可以称之为 token plan 界的赛博菩萨,对比 Claude 的 KYC ,Google 的疯狂砍额度,那真是一个在天上,一个在下水道里。

模型质量上,其实差距也没多大。
@niubilewodev #17 阿里勉强也能算模型供应商,QWen 系列,只要新版本不开放权重,阿里就是独家嘛,就和之前 GML 5.1 那个情况是一样的,想要用就只能买 GML 的订阅。

而且我最近逛 reddit ,我发现不少海外用户,对于 GML/QWEN/KIMI 的评价都还可以,我看了海外的定价,这几家的价格也并不比御三家便宜多少,像阿里的 coding plan 国际站就 50 刀,相当于国内 200 元的那个。
4 月 21 日
回复了 meetyuan 创建的主题 程序员 AI 太烧钱了,有什么好的大模型组合方案?
通常是用大模型做规划和最后的审查 code review ,而小模型负责根据规划文档编码,这样可以节约 token
4 月 20 日
回复了 evemoo 创建的主题 宽带症候群 安卓手机 sing-box 和 tailscale 共存配置参考
sing-box 有遇到过,运行时间久了,或者网络状态多切换几次( WiFi 、数据网络)

然后就出来 DNS 解析不了情况吗,也不太能确定是 sing-box 的问题,还是我配置文件的问题,但这个情况只在 Android 上出现过,同样的配置文件,在 PC 上就没问题。
如果目的只是为了防止一些羊毛用户的话,可以尝试接入一些大平台的 OAuth 用户体系的认证,比如微信、QQ ,就是用户进来之前,至少得有个这个平台的账号,而像微信这种显然风控还是挺严格的,能挡住很多羊毛党。
如果你有一台没有网络问题的机器,可以考虑 https://code.claude.com/docs/en/remote-control 这是官方支持的方案。另一种就是 OAuth 代理出来的,这种可能就有封号的可能性了。
4 月 18 日
回复了 fan88 创建的主题 OpenAI 现在到底是什么模型强?性价比高?
我的订阅,只支持我用 gpt-5.3-codex ,不然额度不够用。这个模型的水平,我觉得也够用了,是一轮写出来,还是三轮写出来,我也没那么在意,反正在跑的时候,就泡茶,看 B 站了。
4 月 18 日
回复了 hhxsky 创建的主题 Google Gemini 学生认证薅的 gemini 用不了了吗?
用还是能用的,我也是白嫖的学生认证。不过现在 Google 全线大模型产品降级的都很厉害,甚至到晚上九、十点的时候,网页版的 https://gemini.google.com/ Pro 模型问题都用不了,说当前使用人数过多,给降级了,当然这可能是美国人的使用高峰了。
是这样的,我刚开始也有这种感觉,慢慢习惯就好了。

现在想通了,其实我根本不需要“对自己的代码了如指掌”,屎山又如何。

也许宏观上的架构设计,受限于上下文,现阶段 AI 不一定比得过人,但是改屎山,AI 可太在行了,越是屎山,越是只有 AI 能改。

我看与不看,之后都是交给 AI 来处理的,我的掌握毫无意义。

老板也不关心我写的是啥,我也不关心,人和代码有一个能跑就行了。
4 月 17 日
回复了 PeterTanJJ 创建的主题 服务器 2026 年,海外最便宜的服务器在哪里?
@CodeCodeStudy #11 现在只有特定区域才有,基本都是美国的,而且 IPv6 Only ,不过这倒是问题不大,出口套一个 cloudfalre wrap ,就能双栈,IPv4 的内容也是可以正常请求的。
1  2  3  4  5  6  7  8  9  10 ... 181  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2956 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 06:00 · PVG 14:00 · LAX 23:00 · JFK 02:00
♥ Do have faith in what you're doing.