V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  Perchouli  ›  全部回复第 1 页 / 共 1 页
回复总数  17
@Cynicsss ocr 行数少跳过 plan ,但主审查会继续跑。实际情况是只改了 1-2 个文件的 1-2 行,但是牵涉到另一个内容很多的文件,subagent 还是会把这个内容很多的文件看一遍,并发设计又要等所有 subagent 返回,每次跑还都是独立操作,缺缓存和复用,就出现这种奇怪的情况了。
谢谢!有用的项目。做训练的时候是调阿里的 Document Mind 接口转结构化,然后自己处理 RAG 。这个 knowhere 相当于把 RAG 也做好了,企业内部知识库这类场景节省很多工作量。
@andrewTeller 外网访问是把 URL labfile.oss-cn-hangzhou-internal.aliyuncs.com 里的 oss-cn-hangzhou-internal.aliyuncs 这段替换成 shiyanlou
纯演示项目,给没网络的读者 vcrpy 重现请求用的,在他们虚拟环境里能下载。
谢谢!同样的痛点——网上小程序广告太多,又都是中文。
看了下这个项目还支持多语言,非常贴心了。
24 天前
回复了 jsxyzb 创建的主题 程序员 GSC 站点地图无法抓取
看描述真是疑难问题了。是说 Bing 能正常抓取 sitemap.xml ?是不是可以排除连通性问题。

这个 GSC 的提交失败 Status 一直不成功,是[失败]?在 GSC 顶部的搜索栏直接输入 sitemap.xml 的地址是绿色吗
24 天前
回复了 kimwang 创建的主题 WordPress wordpress 如何做成多站点?
上规模就考虑多站点。

要是小一些的站,直接用子分类。父分类地区,子分类菜系。缺点是子分类也要手动建。
还要一点灵活性的话,可能注册 taxonomy 会更好。
这条推支持反对的都有,有说让 CEO 深入技术细节不如让他们专注于商业判断。也有说不用 AI 构建产品的 CEO 正在管理一家他们实无法理解的公司,“理解力”无法转交给下属。
AI 应该还没到完全颠覆企业流程的阶段,CEO 下场 vibe 没什么问题,但如果不是技术背景或者之前从来不参与,贸然干涉已有开发流程可能不是明智做法。
多人协作的目前最容易落地的应该是“中间产物”和“共享上下文”。前者就是在“意图”和“代码”之间,有一个记录,将自然语言意图编译为可读、可编辑且受版本控制的结构化中间表示,根据团队成熟度用 Spec 文件,用图(转 spec ),用自己实现的其他格式都有。“共享上下文”是项目里用 AGENTS.md 、.cursorrules 、architecture.md 控制好大的约束,然后用其他记忆管理比如 mem0 动态记录项目变化,比如一个配置文件用 TOML 写了被记录到记忆里,另一个人像用 YAML 写,在上下文里发现冲突就能拦掉。

猪队友——文明一点叫低效协作者,影响主要集中在倾向于快速接受 AI 生成的第一个“能跑”的方案。降低方式主要是人工审核了,另一个实践是引入发散性思维的显式脚手架,就是让低效协作者在接受这个方案之间,先让 AI 多给一些其他方案做选择。

如果一直都是 vibe coding ,“能跑”会累积成复杂的缺陷,传统的单测被认为会失效。有一种实践是强制要求 AI 生成一个映射表,将 Prompt 中的每一句话(业务意图)精确映射到具体的代码行(类/函数)和具体的验证点上。审查这个会比审查代码细节更能发现早期的规范缺失。我前两天还 share 了一个做法,也是一种可供参考的实践: https://v2ex.com/t/1216271

至于“最佳”估计很难说,毕竟去年刚提出来的概念,模型也还在更新。
@andrewTeller 演示项目 llmrec 那个 tar 包吗?稍等我问问他们客服,放的是内网链接。
5 月 29 日
回复了 Perchouli 创建的主题 程序员 用 AI 写生成长期运行的软件
@409164 不同的大模型是能缓解。也提出对抗独立性是结构层面,最好能有形式层面的独立。大模型训练的数据高度重合,还需要增加非 LLM 的验证机制,比如静态代码分析、形式化验证,最终的人类业务逻辑审查。
@andrewTeller 谢谢,重新看第三章是有问题,本来是推荐系统的图增强检索。都去写 RAG 了基本没提到。我再补充些内容。
mbp m4 ,当时只记得加内存了。
买的 [雷电 4 硬盘盒+NVMe M.2 1T] 的组合,用了 2 年多。等新款出来换更大硬盘
好玩,想起之前看过的一个研究:vetbench.github.io Can Vision-Language Models Solve the Shell Game
它是用三仙归洞的案例,和 [遮挡+目标跟踪] 这个类似。不过它是想说 LLM 对于状态记忆的问题,提出了 SGCoT ,类比麻将就是记住牌的 [物体的运动轨迹] 。40 张麻将牌要复杂得多,我不是做 CV 的,不太懂。
这两家是各种模型——chat/image/video 都有,支持起来才有意义吧。Responses api 做的事情多,还要处理状态,估计兼容成本也不低。
@zhongmingzi 不想有广告嫌疑所以没带地址。要的话这里:lanqiao.cn/courses/52658/ 邀请码:51TA6JLJ
比较标准的选型了。就 AntD + tailwindcss 不太常见,配置不好容易样式冲突。
有个很类似的数据分析的 admin ,是用 Python 开源的 redash 改的,相当于带了一套 BI 了,做内部的分析 admin 平台可以考虑,不过它是 Flask 。
2014 年 7 月 1 日
回复了 puyo 创建的主题 设计 关于中国传统色。
作为第二个网站的作者,简单说明一下:

1. 色彩的名称是按照色谱和中国色名综述比较之后取交集的做法,前人的整理可以参考这篇文章: http://www.douban.com/note/191619407/
2. 颜色值来源[色谱]这本书,首图可以借到,我是买旧书。基本方法是先扫描再用取色器来取,CMYK是根据取出的RGB换算来的。后来根据另一个网站的颜色值做过调整。

整理这个网站是针对网页设计和普通印刷,在做之前我借了蜘蛛做过屏幕校色,尽可能减少色差了。至于标准化,同楼上的观点,这是个大工程,个人做不了。
如果排除版权因素,我能想到的简单标准化方法是按照现有的RGB/CMYK取一个近似的Pantone值。但因为有一年多没做设计,现在打印店具体用的是哪个版本都不熟,所以就搁置了。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3153 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 13:13 · PVG 21:13 · LAX 06:13 · JFK 09:13
♥ Do have faith in what you're doing.