DeepSeek V4 终于出来了。。不知道强不强

59 replies • 2026-04-27 11:53:48 +08:00

1

JoeJoeJoe

PRO

Apr 24

如果可以本地部署的话, 我觉得还是很香的.

2

rammiah

Apr 24

好像不支持多模态啊

3

tianjiyao

OP

Apr 24

@JoeJoeJoe 好像是支持本地部署的

4

LeoWA

Apr 24

@rammiah 我记得他们之前就说过，会专注文本类。不会浪费资源去搞多模态

5

blirun

Apr 24

没有多模态，怎么写 UI ？

6

xing7673

Apr 24

@JoeJoeJoe 开源还是会开源的，其他几家都还在开源的，ds 没道理闭源

7

mightybruce

Apr 24

1.6T 还想什么本地部署，现在应该等待腾讯、阿里、字节云上线有 deepseek v4 的代码套餐，或者一些计算云很快就提供了。

8

dingawm

Apr 24

@blirun #5 确实，不支持多模态，写 UI 没办法参考图片。倒是也能通过让其他支持多模态的模型“转译”一下，但是这样又太麻烦了，没啥必要。。

9

JoeJoeJoe

PRO

Apr 24

@xing7673 @tianjiyao 那就真的很香了

10

xiaomushen

Apr 24

@blirun 写 UI 就 K2.6 吧，用起来感觉没啥问题

11

bytewalk

Apr 24

@dingawm #8 我记得 GLM5.1 也不支持多模态？但是好像也不错啊，他们一般怎么实现写 UI 的？

12

ProphetN

Apr 24

问答不支持多模态，编程弱于 Kimi K2.6 和 GLM 5.1 。1.6T 的参数量部署成本更高。评价拉完了。

13

dingawm

Apr 24

@poorcai #10 glm5.1 我好久没用，也忘记了。不支持多模态的话，一般就用文字描述吧

14

cubecube

Apr 24

@mightybruce 估计有不少头铁的企业会买一体机部署。。大力飞砖

15

zhiyu1998

Apr 24

开始抽卡：

16

songco

Apr 24 via Android

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

看起来不错

17

yokisama

Apr 24

5

意义在于用国产芯片做出 sonnet 级别的模型吧，这个模型其实落后了半年多
华萎太 fw 了

18

xyzos

Apr 24

3

@yokisama 国产芯片的问题不应该归咎到华为一个身上吧

19

zhonghao01

Apr 24

刚才用 v4-flash 做了个小需求，没啥问题。需求大概就是把线程的微信小程序的代码，转成 vue 同样功能的 PC 端的。

一次性完成，并且功能完整且正确，没有臆想去生成 UI 之类的，完全按照 PC 端的风格来生成的代码和 UI

20

tool2dx

Apr 24

竞技场排名第 34 ，说实话还是有点小失望的，虽然开源领域已经是 TOP3 了.

21

mashimaroinfo1

Apr 24

1

很高兴。顺便这里总结张当前的价格表供诸位参考。

═══════════════════════════════════════════════════════════════════════
国内外主流大模型 API 定价对比 (2026 年 4 月)
单位：元/百万 tokens | 美元按 1 USD ≈ 7.3 CNY 估算
═══════════════════════════════════════════════════════════════════════
阵营厂商模型输入(未命中) 输出缓存命中
───────────────────────────────────────────────────────────────────
国产 DeepSeek V4 Flash ¥1 ¥2 ¥0.2
V4 Pro ¥12 ¥24 ¥1
阿里云 Qwen3.5-Plus ¥0.8 ¥4.8 ~¥0.4
Qwen3-Max ¥2.5 ¥10 ~¥1.25
腾讯云混元 HY3.0 Preview ¥1.2 ¥4 ¥0.4
百度 ERNIE 4.5 ¥4 ¥16 无
智谱 AI GLM-5.1 ¥8 (~$1.40) ¥28 (~$4.40) ~¥3.4 (~$0.48)
字节跳动豆包 Seed-1.8 ¥0.8 ¥8 无
科大讯飞星火 X2 ¥3 ¥3 无
月之暗面 Kimi K2.5 ¥4 无无
MiniMax M2.5 ¥2 ¥8 (~$1.1) 无
───────────────────────────────────────────────────────────────────
海外 Anthropic Claude Sonnet 4.6 $3 (~¥22) $15 (~¥110) 含在价内
Claude Opus 4.7 $5 (~¥37) $25 (~¥183) 含在价内
OpenAI GPT-5.4 $2.50 (~¥18) $15 (~¥110) $1.25 (~¥9.1)
GPT-5.5 (NEW!) $5 (~¥37) $30 (~¥219) 无
───────────────────────────────────────────────────────────────────
备注：
- V4 Flash / Qwen3.5-Plus 为入门级极致性价比之选
- 国产模型缓存命中后可节省 70%-90% 成本
- GPT-5.5 于 2026.4.24 发布，对标 Claude Opus 4.7
- Kimi K2.5 拥有 256K 超长上下文
═══════════════════════════════════════════════════════════════════════

22

bjzhou1990

Apr 24

试了下编程领域不太行，其他还行，试的不多，价格看起来也不太行

23

mashimaroinfo1

Apr 24

修正一下格式

国内外主流大模型 API 定价对比 (2026 年 4 月) · 单位: 元/百万 tokens · $1 ≈ ¥7.3

┌────────────┬─────────────────────┬
│ 厂商 │ 模型 │输入(未命中)│ 输出 │ 缓存命中 │
├────────────┼─────────────────────┼
│ DeepSeek │ V4 Flash │ ¥1 │ ¥2 │ ¥0.2 │
│ │ V4 Pro │ ¥12 │ ¥24 │ ¥1 │
├────────────┼─────────────────────┼
│ 阿里云 │ Qwen3.5-Plus │ ¥0.8 │ ¥4.8 │ ~¥0.4 │
│ │ Qwen3-Max │ ¥2.5 │ ¥10 │ ~¥1.25 │
├────────────┼─────────────────────┼
│ 腾讯云 │ 混元 HY3.0 Preview │ ¥1.2 │ ¥4 │ ¥0.4 │
├────────────┼─────────────────────┼
│ 百度 │ ERNIE 4.5 │ ¥4 │ ¥16 │ — │
├────────────┼─────────────────────┼
│ 智谱 AI │ GLM-5.1 │ ¥8 │ ¥28 │ ~¥3.4 │
├────────────┼─────────────────────┼
│ 字节跳动 │ 豆包 Seed-1.8 │ ¥0.8 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ 科大讯飞 │ 星火 X2 │ ¥3 │ ¥3 │ — │
├────────────┼─────────────────────┼
│ 月之暗面 │ Kimi K2.5 │ ¥4 │ — │ — │
├────────────┼─────────────────────┼
│ MiniMax │ M2.5 │ ¥2 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ Anthropic │ Claude Sonnet 4.6 │$3(~¥22) │$15(~¥110)│ 含在价内 │
│ │ Claude Opus 4.7 │$5(~¥37) │$25(~¥183)│ 含在价内 │
├────────────┼─────────────────────┼
│ OpenAI │ GPT-5.4 │$2.5(~¥18)│$15(~¥110)│$1.25(~¥9)│
│ │ GPT-5.5 ⚠️NEW │$5(~¥37) │$30(~¥219)│ — │
└────────────┴─────────────────────┴

24

seagoat

Apr 24

claude code 里面接了 api, 玩了下.
2 个小问题都完成了, 速度有点慢, 价格有点贵.

25

asuka02

Apr 24 via Android

@seagoat 1/10 的价格也不算贵吧

26

dingawm

Apr 24

@seagoat #23
@asuka02 #24 因为他家还没有 Coding Plan ，用 API 是会显得比较贵的，而且官方也说了下半年会降价

27

yh7gdiaYW

Apr 24

@poorcai 以我们的实践经验，非要用 glm 写又有明确的设计稿的话，口述+连到浏览器让模型自己看设计稿（的代码）。能用但不是很好用，这一步一般就切别的模型代劳了

28

stefwoo

Apr 24

https://mp.weixin.qq.com/s/DwleBgjy3EiS7zWqlrsTEw

29

Dream4U

Apr 24

不推 coding plan 的话，这谁顶的住，oc 里两个小任务直接干了两块钱。
而且不支持识图？

30

bytewalk

Apr 24

@yh7gdiaYW #27 所以说，不支持多模态的大模型，一般推荐只用来干后端任务了。

31

isnullstring

Apr 24

输出价格跟目前部分 CC 中转站差不多，但是不支持图片识别，那基本上没法调用 chrome MCP 去检查页面设计效果

32

jaleo

Apr 24

1

这次首发国产平台还得是 DeepSeek 迈出了关键一步这才是黄皮衣最担心的事

33

frankkly

Apr 24

@xyzos #18 如果没有行政手段强制企业使用，那确实不能怪华为，但是现在是行政强制企业使用华为，不怪华为怪谁？？

34

itnoob

Apr 24

@tool2dx 这个好像变了，动态更新到第 14 了；可能芯片国产是重点吧，人都被挖了好多了

35

Dav1s

Apr 24

好像没看到 pdf 里面的 pro max

36

dajj

Apr 24

英伟达股价毫无动摇，评价是适合中国人体质的 AI

37

opeth

Apr 24

@dajj 不是哥们，美国和中国有时差啊。NASDAQ 北京时间 16:00 才开始盘前，现在微跌中

38

alleluya

Apr 24

@dingawm #8 ds 不是有个论文写了什么 OCR 识图么 V4 模型看不了图片吗

39

caption312

Apr 24

1

蹬
https://openaiapi.xyz
key：sk-n9pAA64de311VINBWrIq3n3RISyjelnZuojtvowE3DMTCSvo
模型名：deepseek-v4-flash ，deepseek-v4-pro

40

caption312

Apr 24

给各位佬测测，😂

41

RRL

Apr 24

@caption312 感谢，测上了

42

MzM2ODkx

Apr 24

你这表格怎么画的，markdown 支持跨行/合并单元格？

43

MzM2ODkx

Apr 24

@poorcai 调用了个 MCP 查询

44

tianjiyao

OP

Apr 24

@MzM2ODkx 哈哈这是图片。。

45

caption312

Apr 24

1

@RRL 不客气，大家免费蹬就行，应该还有几百额度

46

MzM2ODkx

Apr 24

@tianjiyao 刚没注意，我看文本能选中，还以为是文字

47

Damn

Apr 24

2

@xyzos 国产芯片的问题全都归咎到他一个身上当然不对。
但他有黑历史，各种领域都有，应该不难检索到。
以下图片来自网络：

48

frantic

Apr 24

v4-flash 是真的便宜，好几次调用才一分钱

49

hongye

Apr 24

@MzM2ODkx #42 html 格式增强吧

50

bronyakaka

Apr 24

非常强，非常便宜，推理非常快，够用了。千万别出 coding plan ，不然又算力不够

51

germain

Apr 24

更新 v4 之后老版本的模型居然有质的飞跃，我用 reasoner 让它写一个 Ping Pong 游戏，thinking 花了 1.7 秒，消耗 5526 个 token ，输入 230 ，输出 5296. 总共消耗人民币两毛钱。

可惜老版本 7 月份就要彻底下线，其实老版本跑很多东西都绰绰有余了。

52

EscYezi

Apr 25 via iPhone

1

@germain 官网 api 的 reasoner 现在是 v4flash 思考模式了

53

germain

Apr 25

@EscYezi 你确定吗？我看 api 文档里没这么说，只说了老版本两个 model 到 7 月正式下岗，不过不管怎样，这效果还是比较令人满意的。

54

5waker

Apr 25

1

@germain 是的，文档写了的`deepseek-chat 与 deepseek-reasoner 两个模型名将于 2026/07/24 弃用。出于兼容考虑，二者分别对应 deepseek-v4-flash 的非思考与思考模式。`

55

Danswerme

Apr 25

1

@germain 官网 `deepseek-chat` 和 `deepseek-reasoner` 这两个模型名为了保持兼容性，目前是 `deepseek-v4-flash` 的别名，将于 2026/07/24 弃用。

Ref: https://api-docs.deepseek.com/zh-cn/

56

germain

Apr 25

@5waker
@Danswerme

多谢，我可能没看到那行小字

57

v400127

Apr 26

@tool2dx 排名只是参考了,现在的排名太多了,排的啥都不晓得,说排名也说不上

58

dajj

Apr 27

@opeth 资本会提前计价的，通常盘前就有征兆了。

59

seagoat

Apr 27

@asuka02 么有 token plan, 单纯 api 烧不起
两个问题 7 块钱烧完欠费了