guanwei1225
V2EX  ›  Claude

有人测评过 Claude Fable 5 吗?

  •  
  •   guanwei1225 · 9h 11m ago · 5426 views
    不知道大家有没有开始用了?
    看了一个测评报告,好想用
    https://zhuanlan.zhihu.com/p/2047952434945865695
    28 replies    2026-06-10 16:52:14 +08:00
    Leeeeex
        1
    Leeeeex  
    PRO
       8h 47m ago via iPhone
    这个评测报告一股子 ai slop 味道
    还不如隔壁站真人用过的体验
    hsiafan
        2
    hsiafan  
       8h 46m ago   ❤️ 4
    我现在见到这样的 AI 文风都已经生理不适了,这个文章你是咋看得下去的..
    mnoputd20adfadf3
        3
    mnoputd20adfadf3  
       8h 32m ago   ❤️ 1
    Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 。

    两者用的是同一个底层模型,差别主要不在能力本身,而在开放边界:

    Fable 5 是加了更严格安全措施、面向大众可用的版本。

    Mythos 5 则只向少量可信用户开放,部分高风险领域的限制被解除。

    Anthropic 也借这次发布明确了一件事:Mythos 级已经是高于 Opus 级的新一档模型。

    Fable 5 是他们目前公开可用里最强的模型,任务越长、越复杂,优势越明显。

    软件工程部分最典型的例子来自 Stripe:在一个约 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了原本需要整个团队两个月以上的迁移。

    它在知识工作、图表和表格理解、复杂分析任务上也被认为明显更加健壮。视觉能力则不只是“会看图”,还包括从科学图表中提取精确数据,或仅凭截图重建 web app 源代码。

    长上下文和持续执行能力也是这次发布反复强调的部分。Anthropic 提到,Fable 5 能在数百万 token 的任务里持续推进,还会利用自己留下的笔记改进后续输出。

    文章用 Slay the Spire 和 Pokémon FireRed 这些例子来说明,它在长程任务中的状态维持、自我修正和纯视觉执行能力都比过去强了一截。

    Mythos 5 则更多被放到科研场景里展示。内部蛋白设计团队用它把药物设计中的部分流程提速约 10 倍;在分子生物学盲测里,研究人员大约 80% 的情况下更偏好 Mythos 5 提出的假设。它还做过一项持续一周以上的基因组学研究,整合跨 138 个动物物种、数百万细胞的单细胞数据,设计并训练了一个定制模型,效果超过一篇近期发表在 Science 的模型,而且规模小得多。

    Mythos 级模型在网络安全、生命科学这些领域已经足够强,既能帮助研究和防御,也可能被恶意利用。所以 Fable 5 上线时带了一套新的分类器:一旦请求涉及网络安全、生物与化学、或蒸馏等风险方向,系统就会把请求交给 Claude Opus 4.8 处理,而不是让 Fable 5 直接回答。按官方说法,超过 95% 的 Fable 会话不会触发回退。

    安全安排之外,Anthropic 还调整了数据策略:对 Fable 5 、Mythos 5 以及同等级模型的企业流量,统一要求保留 30 天,用于安全监测和减少误判,不用于训练新模型。

    开放范围上,Mythos 5 目前主要面向 Project Glasswing 的网络安全合作伙伴,之后会逐步扩展 trusted access program ; Fable 5 则从发布当天起全面可用,价格是每百万输入 token 10 美元、每百万输出 token 50 美元。

    订阅侧先在 6 月 9 日到 6 月 22 日向 Pro 、Max 、Team 和 seat-based Enterprise 提供,6 月 23 日后改为 usage credits ,之后再视算力情况调整。
    laimailai
        4
    laimailai  
       8h 29m ago
    给 OP 总结一下:

    526457385
        5
    526457385  
       8h 14m ago
    写个 crud 用得着这么高级的模型,gpt-5.4 完全够用
    skuuhui
        6
    skuuhui  
       8h 4m ago
    @526457385 给公司写的,用智普都大材小用
    wat4me
        7
    wat4me  
       8 hrs ago
    这个文章是用 Fable 5 总结的吗
    Kokomashiro
        8
    Kokomashiro  
       7h 46m ago
    昨天订阅的,今早刚好看到新的 Fable 5 ,试了前端,我是直接把 figma 设计图给他,可以说爆杀 5.5 ,可以做到 1 比 1 像素级还原。
    jsq2627
        9
    jsq2627  
       7h 44m ago
    @laimailai 我现在见到这样的 AI 生图也已经生理不适了
    takanashisakura
        10
    takanashisakura  
       7h 31m ago via iPhone
    @jsq2627 AI 生图说实话比 AI 八股还是好受些的。特别是这类示意图而美术资产的情况,更让人好接受些。
    hellodigua
        11
    hellodigua  
       7h 30m ago
    没有测评,但是在网页上尝试聊了一下,感觉进步很大,已经是我的主力文本对话模型了
    HENQIGUAI
        12
    HENQIGUAI  
       7h 20m ago
    据说前端进步能力巨大!
    EnterpriseD
        13
    EnterpriseD  
       7h 8m ago via iPhone
    生物问题限制是真的严格,随便总结一篇自己发的的 paper 都不给
    dongmian2019
        14
    dongmian2019  
       7h 2m ago
    用了一下,没感觉和 4.8 有什么大的差别
    shyrock2026
        15
    shyrock2026  
       6h 45m ago
    感觉提升巨大,那种轻快的,指哪儿打哪儿的感觉好像飞起来了。。。
    zzzzz024
        16
    zzzzz024  
       6h 40m ago
    早上用了 mythos 一个 codex-review
    直接把 max5 的 5h 额度干没了
    xiangran0028
        17
    xiangran0028  
       6h 37m ago
    早上用了,比较满意,解决了工程中遗留的一个复杂问题,之前 claude 4.8 和 codex 5.5 尝试了几轮都不行。
    qiaobeier
        18
    qiaobeier  
       6h 23m ago
    @zzzzz024 正在用 Fable review 小弟代码,会自动打开 jira 评估原始需求,真是挺厉害的。之前没有这种操作
    tomyark123
        19
    tomyark123  
       5h 27m ago
    刷了下 HN 上的评论都说不错
    widowcat
        20
    widowcat  
       4h 27m ago
    @laimailai 这个是什么生成的
    kkth
        21
    kkth  
       4h 19m ago
    神话级的模型,目前最强,国产估计要明年才能赶上,就看 codex6 有没有机会了,codex6 如果能赶上,那估计就能回到订阅包里,不然就等着猛猛烧钱把
    xyooyx
        22
    xyooyx  
       3h 51m ago
    看了楼主帖子,发现我禁用已久的 claude 删号重创居然可以用了
    xfxz
        23
    xfxz  
       3h 40m ago
    @kkth 奥特曼,就看你的了
    nathandoge
        24
    nathandoge  
       2h 42m ago
    只能用到 22 号,之后就只有 api ,A/就是 A/,希望 gpt 赶紧搞个能竞争过的。
    xajh87
        25
    xajh87  
       2h 2m ago
    @laimailai 请问是什么 llm 生图的,一般提示词是什么
    doinb6686
        26
    doinb6686  
       1h 30m ago
    momo1pm
        27
    momo1pm  
       32 mins ago
    以后按量付费,打的就是代理
    widowcat
        28
    widowcat  
       31 mins ago
    太烧 token 了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5155 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 103ms · UTC 09:23 · PVG 17:23 · LAX 02:23 · JFK 05:23
    ♥ Do have faith in what you're doing.