artemisdiana
V2EX  ›  DeepSeek

DeepSeek 的追赶之路,还要走多久?

  •  
  •   artemisdiana · 5 days ago · 2211 views

    几个小时前,DeepSeek 悄悄开放了识图功能。很多人的第一反应是:终于。第二反应是:才来?


    有人说,晚出来但质量好,一样能赢。

    这个逻辑放在文本领域成立过。R1 横空出世,确实让整个行业重新评估了"强推理"的门槛。但多模态不是一道题,它是一个生态。

    两年时间,GPT-4o 已经在全球积累了大量图文交互的用户习惯;开发者围绕视觉能力搭建了无数产品;企业客户的采购决策早已落定。这些东西不会因为 DeepSeek 识图质量不错就重新洗牌。时间积累出来的生态,靠质量弥补不了。

    何况,DeepSeek 识图上来也不是满分。复杂计数题出错,知识库滞后,视频理解、图像生成一概没有。对手们已经在跑下一圈,它刚刚站上起跑线。


    所以 DeepSeek 做多模态,到底为了什么?

    答案可能是不缺席,而不是称霸。

    它的核心护城河从来不在多模态——是极致的成本效率,是文本推理和代码,是开源策略拉拢的开发者社区,是国内市场的本土优势。视觉能力补上来,是为了不让用户因为"它看不了图"而流失,而不是为了正面击败 chatgpt 。

    按照规划,V4.1 将在 2026 年 6 月加入音频理解,实现文本、图像、音频三合一——但输出依然只有文字。它能看、能听,还不能说、不能画。

    慢点无所谓,希望质量一定要稳住

    19 replies    2026-06-23 00:25:34 +08:00
    icanfork
        1
    icanfork  
       5 days ago
    我觉得很多科技上的东西不是必须追求第一,只要能明显不落后就可以接受了。
    zed1018
        2
    zed1018  
       5 days ago
    识图和多模态还不是一码事。如果只是识别成 prompt 。也只是另一种外挂。真多模态是视觉 token 直接参与的。
    longaiwp
        3
    longaiwp  
       5 days ago
    现在是算力资源短缺,能保持不掉队太多已经可以了,客观因素摆在这。
    artemisdiana
        4
    artemisdiana  
    OP
       5 days ago
    @longaiwp 是的
    dingawm
        5
    dingawm  
       5 days ago
    不能输出非文本还好,现在也不指望 DeepSeek 在这方面有拖入
    但是识图的能力还是要有的,毕竟 Coding 、Agent 的场景都需要,有和没有的区别对这两个场景的使用影响比较大
    qingxia
        6
    qingxia  
       5 days ago
    还是芯片硬件跟不上的主要原因吧,啥时候芯片能独立,软件也好跟进一点
    rxs
        7
    rxs  
       5 days ago
    算力被锁死了,追不上
    lianyue
        8
    lianyue  
       5 days ago
    2023: 最多半年
    gpt5
        9
    gpt5  
       5 days ago
    那是 ds 人应该关注的,咱们 claude 人不必 care
    hefish
        10
    hefish  
       5 days ago
    这识图跟我有啥关系?
    hefish
        11
    hefish  
       5 days ago
    补一句,这标题起的很 cnn 。。。
    utodea
        12
    utodea  
       5 days ago
    基本的识图的能力还是要有的,coding agent 连基本的截图识别都做不了,API 现在还没有开放。搞得现在都用的 OAI 的识图。https://github.com/usewhale/DeepSeek-Code-Whale

    希望早点跟上这些基础的能力。
    stabc
        13
    stabc  
       5 days ago
    deepseek 太能炒作了,b 站搜一下标题全是“震惊世界”,“微软慌了”等标题。国产我更看好 GLM, miniMax 这些。
    jaleo
        14
    jaleo  
       4 days ago
    来自开源的震撼 老外对 ds 的印象最深刻
    saySilence
        15
    saySilence  
       4 days ago
    @stabc minimax 就算了,glm 确实有实力
    unusualcat
        16
    unusualcat  
       4 days ago
    它也就是当初开源那个瞬间震撼了老外一把而已。什么时候追赶上过。经常遇到问个问题都自我阉割,且有得追赶呢。
    wukon
        17
    wukon  
       1 day ago
    @stabc 不是 DeepSeek 炒作,是网友炒的。各家厂商模型发展定位不一样,现在说谁好还为时尚早。
    stabc
        18
    stabc  
       23h 35m ago
    @wukon 现在说不是 DeepSeek 炒作还为时尚早。现在说是网友炒的还为时尚早
    stabc
        19
    stabc  
       23h 34m ago
    @wukon 现在各家厂商模型发展定位不一样还为时尚早
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2524 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 84ms · UTC 16:00 · PVG 00:00 · LAX 09:00 · JFK 12:00
    ♥ Do have faith in what you're doing.