V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tianjiyao
V2EX  ›  DeepSeek

DeepSeek V4 终于出来了。。不知道强不强

  •  
  •   tianjiyao · 19 小时 30 分钟前 · 7322 次点击

    Imgur

    Imgur

    53 条回复    2026-04-25 05:28:18 +08:00
    JoeJoeJoe
        1
    JoeJoeJoe  
    PRO
       19 小时 26 分钟前
    如果可以本地部署的话, 我觉得还是很香的.
    rammiah
        2
    rammiah  
       19 小时 17 分钟前
    好像不支持多模态啊
    tianjiyao
        3
    tianjiyao  
    OP
       19 小时 16 分钟前
    @JoeJoeJoe 好像是支持本地部署的
    Mrun
        4
    Mrun  
       19 小时 14 分钟前
    @rammiah 我记得他们之前就说过,会专注文本类。不会浪费资源去搞多模态
    blirun
        5
    blirun  
       19 小时 13 分钟前
    没有多模态,怎么写 UI ?
    xing7673
        6
    xing7673  
       19 小时 11 分钟前
    @JoeJoeJoe 开源还是会开源的,其他几家都还在开源的,ds 没道理闭源
    mightybruce
        7
    mightybruce  
       19 小时 11 分钟前
    1.6T 还想什么本地部署,现在应该等待腾讯、阿里、字节云上线有 deepseek v4 的代码套餐,或者一些计算云很快就提供了。
    dingawm
        8
    dingawm  
       19 小时 10 分钟前
    @blirun #5 确实,不支持多模态,写 UI 没办法参考图片。倒是也能通过让其他支持多模态的模型“转译”一下,但是这样又太麻烦了,没啥必要。。
    JoeJoeJoe
        9
    JoeJoeJoe  
    PRO
       19 小时 10 分钟前
    @xing7673 @tianjiyao 那就真的很香了
    xiaomushen
        10
    xiaomushen  
       19 小时 10 分钟前
    @blirun 写 UI 就 K2.6 吧,用起来感觉没啥问题
    poorcai
        11
    poorcai  
       19 小时 7 分钟前
    @dingawm #8 我记得 GLM5.1 也不支持多模态?但是好像也不错啊,他们一般怎么实现写 UI 的?
    ProphetN
        12
    ProphetN  
       19 小时 2 分钟前
    问答不支持多模态,编程弱于 Kimi K2.6 和 GLM 5.1 。1.6T 的参数量部署成本更高。评价拉完了。
    dingawm
        13
    dingawm  
       19 小时 1 分钟前
    @poorcai #10 glm5.1 我好久没用,也忘记了。不支持多模态的话,一般就用文字描述吧
    cubecube
        14
    cubecube  
       19 小时 1 分钟前
    @mightybruce 估计有不少头铁的企业会买一体机部署。。大力飞砖
    zhiyu1998
        15
    zhiyu1998  
       18 小时 52 分钟前
    开始抽卡:

    songco
        16
    songco  
       18 小时 40 分钟前 via Android
    yokisama
        17
    yokisama  
       18 小时 39 分钟前   ❤️ 5
    意义在于用国产芯片做出 sonnet 级别的模型吧,这个模型其实落后了半年多
    华萎太 fw 了
    xyzos
        18
    xyzos  
       18 小时 36 分钟前   ❤️ 2
    @yokisama 国产芯片的问题 不应该归咎到华为一个身上吧
    zhonghao01
        19
    zhonghao01  
       18 小时 36 分钟前
    刚才用 v4-flash 做了个小需求,没啥问题。需求大概就是把线程的微信小程序的代码,转成 vue 同样功能的 PC 端的。

    一次性完成,并且功能完整且正确,没有臆想去生成 UI 之类的,完全按照 PC 端的风格来生成的代码和 UI
    tool2dx
        20
    tool2dx  
       18 小时 32 分钟前
    竞技场排名第 34 ,说实话还是有点小失望的,虽然开源领域已经是 TOP3 了.

    mashimaroinfo1
        21
    mashimaroinfo1  
       18 小时 29 分钟前   ❤️ 1
    很高兴。顺便这里总结张 当前的价格 表供诸位参考。

    ═══════════════════════════════════════════════════════════════════════
    国内外主流大模型 API 定价对比 (2026 年 4 月)
    单位:元/百万 tokens | 美元按 1 USD ≈ 7.3 CNY 估算
    ═══════════════════════════════════════════════════════════════════════
    阵营 厂商 模型 输入(未命中) 输出 缓存命中
    ───────────────────────────────────────────────────────────────────
    国产 DeepSeek V4 Flash ¥1 ¥2 ¥0.2
    V4 Pro ¥12 ¥24 ¥1
    阿里云 Qwen3.5-Plus ¥0.8 ¥4.8 ~¥0.4
    Qwen3-Max ¥2.5 ¥10 ~¥1.25
    腾讯云 混元 HY3.0 Preview ¥1.2 ¥4 ¥0.4
    百度 ERNIE 4.5 ¥4 ¥16 无
    智谱 AI GLM-5.1 ¥8 (~$1.40) ¥28 (~$4.40) ~¥3.4 (~$0.48)
    字节跳动 豆包 Seed-1.8 ¥0.8 ¥8 无
    科大讯飞 星火 X2 ¥3 ¥3 无
    月之暗面 Kimi K2.5 ¥4 无 无
    MiniMax M2.5 ¥2 ¥8 (~$1.1) 无
    ───────────────────────────────────────────────────────────────────
    海外 Anthropic Claude Sonnet 4.6 $3 (~¥22) $15 (~¥110) 含在价内
    Claude Opus 4.7 $5 (~¥37) $25 (~¥183) 含在价内
    OpenAI GPT-5.4 $2.50 (~¥18) $15 (~¥110) $1.25 (~¥9.1)
    GPT-5.5 (NEW!) $5 (~¥37) $30 (~¥219) 无
    ───────────────────────────────────────────────────────────────────
    备注:
    - V4 Flash / Qwen3.5-Plus 为入门级极致性价比之选
    - 国产模型缓存命中后可节省 70%-90% 成本
    - GPT-5.5 于 2026.4.24 发布,对标 Claude Opus 4.7
    - Kimi K2.5 拥有 256K 超长上下文
    ═══════════════════════════════════════════════════════════════════════
    bjzhou1990
        22
    bjzhou1990  
       18 小时 27 分钟前
    试了下编程领域不太行,其他还行,试的不多,价格看起来也不太行
    mashimaroinfo1
        23
    mashimaroinfo1  
       18 小时 23 分钟前
    修正一下格式

    国内外主流大模型 API 定价对比 (2026 年 4 月) · 单位: 元/百万 tokens · $1 ≈ ¥7.3

    ┌────────────┬─────────────────────┬
    │ 厂商 │ 模型 │输入(未命中)│ 输出 │ 缓存命中 │
    ├────────────┼─────────────────────┼
    │ DeepSeek │ V4 Flash │ ¥1 │ ¥2 │ ¥0.2 │
    │ │ V4 Pro │ ¥12 │ ¥24 │ ¥1 │
    ├────────────┼─────────────────────┼
    │ 阿里云 │ Qwen3.5-Plus │ ¥0.8 │ ¥4.8 │ ~¥0.4 │
    │ │ Qwen3-Max │ ¥2.5 │ ¥10 │ ~¥1.25 │
    ├────────────┼─────────────────────┼
    │ 腾讯云 │ 混元 HY3.0 Preview │ ¥1.2 │ ¥4 │ ¥0.4 │
    ├────────────┼─────────────────────┼
    │ 百度 │ ERNIE 4.5 │ ¥4 │ ¥16 │ — │
    ├────────────┼─────────────────────┼
    │ 智谱 AI │ GLM-5.1 │ ¥8 │ ¥28 │ ~¥3.4 │
    ├────────────┼─────────────────────┼
    │ 字节跳动 │ 豆包 Seed-1.8 │ ¥0.8 │ ¥8 │ — │
    ├────────────┼─────────────────────┼
    │ 科大讯飞 │ 星火 X2 │ ¥3 │ ¥3 │ — │
    ├────────────┼─────────────────────┼
    │ 月之暗面 │ Kimi K2.5 │ ¥4 │ — │ — │
    ├────────────┼─────────────────────┼
    │ MiniMax │ M2.5 │ ¥2 │ ¥8 │ — │
    ├────────────┼─────────────────────┼
    │ Anthropic │ Claude Sonnet 4.6 │$3(~¥22) │$15(~¥110)│ 含在价内 │
    │ │ Claude Opus 4.7 │$5(~¥37) │$25(~¥183)│ 含在价内 │
    ├────────────┼─────────────────────┼
    │ OpenAI │ GPT-5.4 │$2.5(~¥18)│$15(~¥110)│$1.25(~¥9)│
    │ │ GPT-5.5 ⚠️NEW │$5(~¥37) │$30(~¥219)│ — │
    └────────────┴─────────────────────┴
    seagoat
        24
    seagoat  
       18 小时 9 分钟前
    claude code 里面接了 api, 玩了下.
    2 个小问题都完成了, 速度有点慢, 价格有点贵.
    asuka02
        25
    asuka02  
       18 小时 3 分钟前 via Android
    @seagoat 1/10 的价格也不算贵吧
    dingawm
        26
    dingawm  
       18 小时 0 分钟前
    @seagoat #23
    @asuka02 #24 因为他家还没有 Coding Plan ,用 API 是会显得比较贵的,而且官方也说了下半年会降价
    yh7gdiaYW
        27
    yh7gdiaYW  
       17 小时 53 分钟前
    @poorcai 以我们的实践经验,非要用 glm 写又有明确的设计稿的话,口述+连到浏览器让模型自己看设计稿(的代码)。能用但不是很好用,这一步一般就切别的模型代劳了
    stefwoo
        28
    stefwoo  
       17 小时 41 分钟前
    Dream4U
        29
    Dream4U  
       17 小时 14 分钟前
    不推 coding plan 的话,这谁顶的住,oc 里两个小任务直接干了两块钱。
    而且不支持识图?
    poorcai
        30
    poorcai  
       16 小时 43 分钟前
    @yh7gdiaYW #27 所以说,不支持多模态的大模型,一般推荐只用来干后端任务了。
    isnullstring
        31
    isnullstring  
       16 小时 20 分钟前
    输出价格跟目前部分 CC 中转站差不多,但是不支持图片识别,那基本上没法调用 chrome MCP 去检查页面设计效果
    jaleo
        32
    jaleo  
       15 小时 22 分钟前
    这次首发国产平台 还得是 DeepSeek 迈出了关键一步 这才是黄皮衣最担心的事
    frankkly
        33
    frankkly  
       15 小时 17 分钟前
    @xyzos #18 如果没有行政手段强制企业使用,那确实不能怪华为,但是现在是行政强制企业使用华为,不怪华为怪谁??
    itnoob
        34
    itnoob  
       14 小时 57 分钟前
    @tool2dx 这个好像变了,动态更新到第 14 了;可能芯片国产是重点吧,人都被挖了好多了
    Dav1s
        35
    Dav1s  
       14 小时 32 分钟前
    好像没看到 pdf 里面的 pro max
    dajj
        36
    dajj  
       14 小时 28 分钟前
    英伟达股价毫无动摇,评价是 适合中国人体质的 AI
    opeth
        37
    opeth  
       14 小时 10 分钟前
    @dajj 不是哥们,美国和中国有时差啊。NASDAQ 北京时间 16:00 才开始盘前,现在微跌中
    alleluya
        38
    alleluya  
       14 小时 6 分钟前
    @dingawm #8 ds 不是有个论文写了什么 OCR 识图么 V4 模型看不了图片吗
    caption312
        39
    caption312  
       13 小时 57 分钟前   ❤️ 1

    https://openaiapi.xyz
    key:sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo
    模型名:deepseek-v4-flash ,deepseek-v4-pro
    caption312
        40
    caption312  
       13 小时 54 分钟前
    给各位佬测测,😂
    RRL
        41
    RRL  
       13 小时 48 分钟前
    @caption312 感谢,测上了
    MzM2ODkx
        42
    MzM2ODkx  
       13 小时 45 分钟前
    你这表格怎么画的,markdown 支持跨行/合并单元格?
    MzM2ODkx
        43
    MzM2ODkx  
       13 小时 42 分钟前
    @poorcai 调用了个 MCP 查询
    tianjiyao
        44
    tianjiyao  
    OP
       13 小时 42 分钟前
    @MzM2ODkx 哈哈这是图片。。
    caption312
        45
    caption312  
       13 小时 34 分钟前   ❤️ 1
    @RRL 不客气,大家免费蹬就行,应该还有几百额度
    MzM2ODkx
        46
    MzM2ODkx  
       13 小时 26 分钟前
    @tianjiyao 刚没注意,我看文本能选中,还以为是文字
    Damn
        47
    Damn  
       13 小时 9 分钟前   ❤️ 1
    @xyzos 国产芯片的问题全都归咎到他一个身上当然不对。
    但他有黑历史,各种领域都有,应该不难检索到。
    以下图片来自网络:
    frantic
        48
    frantic  
       12 小时 42 分钟前
    v4-flash 是真的便宜,好几次调用才一分钱
    hongye
        49
    hongye  
       10 小时 4 分钟前
    @MzM2ODkx #42 html 格式增强吧
    bronyakaka
        50
    bronyakaka  
       10 小时 0 分钟前
    非常强,非常便宜,推理非常快,够用了。千万别出 coding plan ,不然又算力不够
    germain
        51
    germain  
       8 小时 25 分钟前
    更新 v4 之后老版本的模型居然有质的飞跃,我用 reasoner 让它写一个 Ping Pong 游戏,thinking 花了 1.7 秒,消耗 5526 个 token ,输入 230 ,输出 5296. 总共消耗人民币两毛钱。

    可惜老版本 7 月份就要彻底下线,其实老版本跑很多东西都绰绰有余了。

    EscYezi
        52
    EscYezi  
       1 小时 53 分钟前 via iPhone   ❤️ 1
    @germain 官网 api 的 reasoner 现在是 v4flash 思考模式了
    germain
        53
    germain  
       1 小时 9 分钟前
    @EscYezi 你确定吗?我看 api 文档里没这么说,只说了老版本两个 model 到 7 月正式下岗,不过不管怎样,这效果还是比较令人满意的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   938 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 112ms · UTC 22:38 · PVG 06:38 · LAX 15:38 · JFK 18:38
    ♥ Do have faith in what you're doing.