fiht

怎么通俗地和老板解释:国外的旗舰模型到底强在哪里?

  •  
  •   fiht · 1 day ago · 13108 views

    你是研发团队的组长,你想做一笔财务预算采购国外厂商的模型加速研发。 CTO 和 CFO 都过来问了:“国内模型和国外模型编程上有多少差别?买国内的 Coding Plan 可以吗?”

    你的回答:

    115 replies    2026-06-16 13:41:17 +08:00
    1  2  
    idealhs
        1
    idealhs  
       1 day ago   ❤️ 1
    一分钱一分货
    280303
        2
    280303  
       1 day ago
    让 CTO 自己去试试
    akorn
        3
    akorn  
       1 day ago
    你是在问 ai 吗
    turing518
        4
    turing518  
       1 day ago
    不如让你想买的国外旗舰大模型做一下自我推荐?
    xtreme1
        5
    xtreme1  
       1 day ago   ❤️ 6
    CTO 干啥吃的
    Yasuke
        6
    Yasuke  
       1 day ago   ❤️ 2
    CTO 是完全脱离技术了吗
    syubo2810
        7
    syubo2810  
       1 day ago   ❤️ 1
    其实还是钱的问题和风险问题,国外的怎么保证稳定性,差距是不是大到必须要用国外的,即使不稳定价格也贵,还有政策风险
    Charbo
        8
    Charbo  
       1 day ago   ❤️ 20
    不知道还以为你是 CTO
    wqhui
        9
    wqhui  
       1 day ago
    分几个组用不同模型做差不多难度的需求,对比需要几轮完成、单次采纳率是多少
    wangxinpier
        10
    wangxinpier  
       1 day ago
    哈哈,效率高了,人员就过剩了,减员后,成本下降,你为公司着想,还得说服各方,看来还是时机未到呀
    zlhsvc
        11
    zlhsvc  
       1 day ago   ❤️ 1
    CTO 干啥吃的 +1
    Sezxy
        12
    Sezxy  
       1 day ago
    你可以跟 cto 说,你用国外模型一人能顶 10 人,用国内模型,一人能顶一人
    crocoBaby
        13
    crocoBaby  
       1 day ago
    CTO 咨询你技术意见?????
    yanest
        14
    yanest  
       1 day ago
    电脑也应该换国产芯片的
    fiht
        15
    fiht  
    OP
       1 day ago   ❤️ 1
    CTO 吃饭的时候偶遇了你:
    “小刘啊,听说国外大模型发展得很好,但是我看一些 benchmark ,也就比国内的模型高几个点啊”

    你的回答:
    wy315700
        16
    wy315700  
       1 day ago
    @Sezxy 话别说太满,到时候 CTO 一个人出 10 个人的活。
    fredweili
        17
    fredweili  
       1 day ago
    这是在问么?回答可以就行了
    MiHwAppleTslFan
        18
    MiHwAppleTslFan  
       1 day ago   ❤️ 15
    99%和 90%的差别不是 9%,是 1000%,一个需要改 1%,一个需要改 10%
    同理,99%和 99.9%也是
    Sezxy
        19
    Sezxy  
       1 day ago
    @wy315700 #16 反正要通俗
    exploretheworld
        20
    exploretheworld  
       1 day ago via Android
    苹果和安卓
    systemGuest
        21
    systemGuest  
       1 day ago   ❤️ 21
    我强烈建议你,尽量推动他们使用国内模型,合理合法合规,实在犹豫用爱国去绑架,然后你自己用国外的。
    xyooyx
        22
    xyooyx  
       1 day ago
    主要是在 Long-horizon 任务中
    Rorysky
        23
    Rorysky  
       1 day ago
    中国人使用美国模型违反美国法律
    polo3584
        24
    polo3584  
       1 day ago
    让老板自己去试
    billzhuang
        25
    billzhuang  
       1 day ago via iPhone
    醒醒
    jimrok
        26
    jimrok  
       1 day ago   ❤️ 1
    这个时候,你应该做的是套利,自己买国外模型,其他人用国内的模型,省下的时间喝茶不好吗。国内模型也不是不能用,可以锻炼人的判断力。
    imagecap
        27
    imagecap  
       1 day ago
    自作孽不可活
    nomansky
        28
    nomansky  
       1 day ago
    强就强在不会回复:抱歉我无法回答你的问题
    charlie21
        29
    charlie21  
       1 day ago
    甲:本来就是炼丹性质的工作,如何选购炼丹用煤?
    乙:烧这个煤炼出来的丹好,烧这个煤炼出来的丹不好、炼丹速度慢、吃坏了肚子要死人的
    甲:haha 反正不是我吃。哪个便宜用哪个
    wy315700
        30
    wy315700  
       1 day ago
    @Sezxy #19

    通俗的方法就是先采购国内模型,到时候出 BUG 了,或者进度慢,CTO 问就是国内模型不行。
    toexplore
        31
    toexplore  
       1 day ago
    这个问题 Dario 估计也解释不了
    unnamedhao
        32
    unnamedhao  
       1 day ago
    不需要研究,回答应该是“可以的”
    94
        33
    94  
       1 day ago   ❤️ 8
    @fiht #15 ,需要看你们使用 AI 的定位和用途是什么。如果一味的追求 Frontier 并不一定符合公司对于 AI 的定位,容易大炮打蚊子。
    是日常开发工作中当成初中级开发来用,还是在遇到一些复杂问题时当成精通领域的资深开发来解决问题。

    按照我们整体的体验来看结论是:日常业务的开发,国内的模型完全够用的。
    如果是需要用来解决一些疑难问题,同时自己没有对应领域的知识,那么国内模型就很难满足那种“指哪打哪”的爽快感,容易出现一两个小时投入进去啥产出都没有。
    javalaw2010
        34
    javalaw2010  
       1 day ago
    整理几个最权威的 leaderboard, 将数据可量化的提供到领导面前,除此以外,再以实际的场景举例说明海外顶尖模型的性价比,最后,再给到领导一个可选的国产替代方案。
    312ybj
        35
    312ybj  
       1 day ago
    直接做两个 html 给他们看效果就行了, 要不要看看我的 ccmax 网址:aHR0cHM6Ly9hbnl0b2tlbnMuY2Mv
    SilenceLL
        36
    SilenceLL  
       1 day ago
    我们当时是拿我们的项目,定义了一个复杂的任务,基本影响整个系统的那种任务。然 ai 去做,拿结果说话。
    baizhu
        37
    baizhu  
       1 day ago
    你让你们老板看看 spacex 发射的火箭数量,再看看国内航天发射的火箭数量
    coryxu
        38
    coryxu  
       1 day ago   ❤️ 1
    我也遇到你这种情况,CTO 也是不懂的,他平时不写代码不知道哪个好用,平时也是问豆包做 PPT 的。
    我最后是用表格同一个编码问题,用国内模型,和国外模型的效果对比,让整个开发团队过来看哪个模型好,差距有多大,并提出来让大家去试用。你尽量不要说太多,让大家去说。
    最终采购了 GPT
    kuhung
        39
    kuhung  
       1 day ago
    一分钱一分货,要不然就上两套让大家看看调用量和采纳率。
    Seck
        40
    Seck  
       1 day ago   ❤️ 1
    这有啥好解释的

    你就说复杂的需求,国内模型搞不定,国外的可以搞定

    不用,就是搞不定

    把话说死

    和老板说话,目的是关键而不是态度
    xixiv5
        41
    xixiv5  
       1 day ago
    当你在医院选国产货的时候 AI 就可以选国内模型
    zlo309618100
        42
    zlo309618100  
       1 day ago
    基于业务场景搭一个基准测试,看一下各家模型的智力水平吧。
    如果国内模型能够满足你们的业务诉求,那在老板的角度也没必要采购国外的模型。
    lswlray
        43
    lswlray  
       1 day ago   ❤️ 2
    [你想做一笔财务预算采购国外厂商的模型加速研发]

    出发点就错了
    THESDZ
        44
    THESDZ  
       1 day ago   ❤️ 3
    一笔财务预算采购国外厂商的模型加速研发

    你不是做决策的,你是列调查结果的,拿出数据和政策风险,由上面的人决策。
    其他的不是你考虑的。
    tcper
        45
    tcper  
       1 day ago   ❤️ 1
    你老板想听到的就是:国内国外差的不多
    expression
        46
    expression  
       1 day ago
    如果你都说不出来具体的差异,那就代表这个差异和你们无关,随便选就行
    nb85144
        47
    nb85144  
       1 day ago
    如果能满足需求,哪个便宜用哪个

    这是多数公司的采购策略不需要任何解释
    rammiah
        48
    rammiah  
       1 day ago
    这个得量化对比,只靠嘴是不行的,拿出你们的测试用例用国内外大模型都跑一遍,看耗时,正确率,token 消耗,价格就行了,如果你们老板看了之后能接收国产那就选国产吧
    sunpj
        49
    sunpj  
       1 day ago
    cto 是个管理岗位。。不是技术岗位。。
    bigLinux
        50
    bigLinux  
       1 day ago
    这个论坛的回复似乎都看不起国产模型,这也是一种自我贬低,考虑到合规问题,其实可以用国产的模型,大多数人用国产模型就够用了,鼓吹国外模型的人,怕不是有一种莫名的优越感,觉得自己用上了国外模型就很高级。
    Muniesa
        51
    Muniesa  
       1 day ago
    强在复杂、小众需求,如果是一句话许愿式编程,国外模型可以直接生成出一个还凑合的结果,国内模型可能会有各种小问题。但如果业务需求没那么复杂,事先给模型制定好计划,其实差距并不大。

    至于说「强就强在不会回复:抱歉我无法回答你的问题」,这明明是国内模型的强项吧,claude 和 gpt 都会拒绝甚至封号的逆向,国内模型直接就干。
    peter986
        52
    peter986  
       1 day ago
    说实话, 国外模型真没比国内模型强多少, 现在 deepseekv4 和 glm 都是很强的, 不必 claude 差多少, 那些吹国外模型牛逼的,都是带上滤镜了
    a280807225
        53
    a280807225  
       1 day ago
    @peter986 的确是这样 遥遥领先
    yufeng0681
        54
    yufeng0681  
       1 day ago   ❤️ 1
    你有 先入为主的观念了(可能一开始就用了国外大模型)
    公司用,和你个人用是两回事,考虑的维度会多很多; 你还要通俗的解释,这又不是和一个朋友,网友推荐大模型。
    这种调研报告,就应该专项去做,还要各种数据验证, 可持续验证(毕竟大模型还在快速迭代)。

    我从成本这一个维度看, 就能看到:80%的场景用便宜模型,20%的场景用能破局的模型。 这样成本能降低
    bush911
        55
    bush911  
       1 day ago via Android
    @fiht #15 告诉他:实践是检验真理的唯一标准
    boogoogle
        56
    boogoogle  
       1 day ago
    你得听老板的倾向,老板说哪个好就是哪个好,不然最后出问题都是你背锅.
    skills
        57
    skills  
       1 day ago
    https://mp.weixin.qq.com/s/yznqr4EVV_CyU6yEQsSB0g
    找这种模型数据排行的文章,然后整理一些给你领导看就 OK 了啊。
    unusualcat
        58
    unusualcat  
       1 day ago
    形势一片大好,不是小好,是大好。
    弯道超车,遥遥领先。
    赢麻了。
    ooee2016
        59
    ooee2016  
       1 day ago
    直接问 ai 不就行了
    Abirdcfly
        60
    Abirdcfly  
       1 day ago
    如果 CTO 没有脱离一线,没有完全不懂技术,那实际人家问你就表明了人家的态度了。
    chniccs
        61
    chniccs  
       1 day ago
    为什么要用大模型呢,如果他们不主动要求的话,应该现在工作上就别用,自己的事喜欢啥就用啥
    la2la
        62
    la2la  
       1 day ago
    这个看预算吧
    如果预算充足肯定国外模型啊,预算不充足也没啥好选择的,glm qwen3.6 我感觉编程还可以,没有那么大差距
    NoCash
        63
    NoCash  
       1 day ago
    就是钱的问题,钱的问题不是靠你嘴皮子就能解决的,公司就是没钱
    unregister
        64
    unregister  
       1 day ago
    你开发组的组长还来问这种问题?你别当组长了
    lieliew
        65
    lieliew  
       1 day ago
    国内是应届大学生,国外是两年工作经验的工程师
    xFrye
        66
    xFrye  
       1 day ago
    怎么 cto 还来问你?
    mooyo
        67
    mooyo  
       1 day ago
    国内模型落后国外两次迭代的差距
    Fruktozka
        68
    Fruktozka  
       1 day ago
    就用国内的,要不后面一堆合规和稳定性的事情都是你的事情
    Liftman
        69
    Liftman  
       1 day ago
    。。。为什么要来问我们?如果你都说不清这么简单的事情,说明你自己也没用过,也不懂技术,何必呢?用用 glm mimo minimax 挺好的。。。
    gscsnm
        70
    gscsnm  
       1 day ago
    主要得看你们的业务复杂度。
    如果没那么高的话,国内模型就能 ok

    如果高的话,国内就废废
    chunqiuyiyu
        71
    chunqiuyiyu  
       1 day ago
    就用国内吧,预算低,合法。
    Nzelites
        72
    Nzelites  
       1 day ago
    按成本核算国外模型性价比我觉得不咋的 平常业务开发你们都做什么自己心里没个数吗 curd 仔国产模型也轻轻松松解决
    sg552
        73
    sg552  
       1 day ago
    海外的 88 分,国内的 85 分,而且海外的第一名很多时候都被国内的占据。两者效果差不多,但价格上国内是海外的 1/75 ,普遍比国外低很多很多。

    国外评分高,不是因为他们牛逼,而是因为显卡没有对他们禁运,没有对他们禁售,他们起步早一点而已。

    建议老板直接用国内:
    1. 海外不稳定,哪天把我们给封了。
    2. 用国内的话就特别舒服,一直用一直舒服,每天用一个亿的 token 也没几个钱儿。
    3. 还间接爱国,干死那些跪舔海外的。
    jadeborner
        74
    jadeborner  
       1 day ago
    到底哪个是 CTO ?
    YICHUJIFA
        75
    YICHUJIFA  
       1 day ago
    不要说用国外模型你们怎样,要给领导分析,用国外模型,领导能获得什么
    SayHelloHi
        76
    SayHelloHi  
       1 day ago
    国外模型:
    1 天的工作 1 小时可以完成 😀
    yolee599
        77
    yolee599  
       1 day ago via Android
    加速研发事情做完了最后被裁的还不是自己,让它成为自己的护城河不好吗?其他人都用国内模型,你就偷偷用国外模型,你提前把事情做完了就偷偷摸鱼,偷偷提升自己不行吗?
    Cmdhelp
        78
    Cmdhelp  
       1 day ago
    市值
    Sezxy
        79
    Sezxy  
       1 day ago
    @Seck #40 在老板眼里,搞不定就换人
    xuanbg
        80
    xuanbg  
       1 day ago
    那就买国内的!

    解释个毛线啊
    jsq2627
        81
    jsq2627  
       1 day ago
    @sunpj 虽然,但是能问这个问题,明显两耳不闻窗外事
    smlcgx
        82
    smlcgx  
       1 day ago
    老板一听国产这么便宜,你说啥都没用
    tool3d
        83
    tool3d  
       1 day ago
    具体看项目了,天天 WEB 内网开发+CURD,纯国产模型也不是不可以.
    你要来个高科技创新,那只能国外模型了.
    robinlovemaggie
        84
    robinlovemaggie  
       1 day ago
    如果连 CTO 那都需要解释区别,建议跑路~
    ybybwdwd
        85
    ybybwdwd  
       1 day ago
    你们有啥复杂任务需要 chagpt 和 claude ?一般需求明确的任务,国模差距真不大,我司还采购的 lingma 用 qwen3.6plus 呢,配合我自己的 opencode go 的 dsv4 ,日常开发完全足够了,更不用说最新的 glm5.2 、kimi k2.7 编码还比这俩强
    diudiuu
        86
    diudiuu  
       1 day ago
    没用过不知道,听说国外的厉害
    xiaoliuzhenshuai
        87
    xiaoliuzhenshuai  
       1 day ago
    领导说的有道理,平常的垃圾业务需求就直接用国模就行了 当然用起来并不便宜
    lemonfishTBS
        88
    lemonfishTBS  
       1 day ago
    用国外的模型,你可以裁掉一半人,用国内的模型你还要继续付 5 个人的工资
    kakki
        89
    kakki  
       1 day ago
    建议大家都用国内的,我一个人用国外的就行.
    sanqian
        90
    sanqian  
       1 day ago
    CTO 问这问题 也是人才了
    thep
        91
    thep  
       1 day ago
    CTO 和 CFO 都关注,那说明公司对技术没那么激进,说回来其实就是自己想用国外的,自己能兜底就用,否则稳妥就国产
    wysnxzm
        92
    wysnxzm  
       1 day ago
    怎么通俗地和老板解释:国内的旗舰模型到底弱在哪里?
    jadewant
        93
    jadewant  
       1 day ago
    CFO 问能理解,但是 CTO 问,直接暴露职业能力。
    f1001
        94
    f1001  
       1 day ago
    别跟老板犟,老板真的在意哪个强会自己去试
    shenhualv7
        95
    shenhualv7  
       1 day ago via Android
    按我的通俗的说法,就是高中生和大学生的差别,前者知道所学的东西,后者基本上拥有完事的社会观世界观,可以回答学习之外的问题
    cyrivlclth
        96
    cyrivlclth  
       1 day ago
    @ybybwdwd 我也觉得,我一直同时用 glm5.1 和 gpt5.5 进行一些 crud 的开发(反正自己不写一行代码那种),用起来结果大差不差,都是一次性,一个会做错一些,一个会过渡设计多做一些跑偏。反正都需要人再次介入。最终结果都差不多,又不是啥特别困难的需求。整的大家开发都是什么高难度的需求一样,高难度的需求大概率还不是古法上。。。
    zerovoid
        97
    zerovoid  
       1 day ago
    CTO 居然还要问你的意见,梦里啥都有啊。
    Retr0
        98
    Retr0  
       1 day ago
    很明显 op 的 token 不够了。这问题你问国外的旗舰模型两个来回就能有完整答案了,跑来这里吊回答
    lujiaosama
        99
    lujiaosama  
       1 day ago
    你能保证稳定可用吗。看起来国内要稳定用只有投奔中转站这一条路。数据合规都是后话。
    Smilencer
        100
    Smilencer  
       1 day ago   ❤️ 1
    自掘坟墓。。。

    国内大模型的差距,正是你现在还没被裁的护城河 -- 2026 年 6 月
    1  2  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3221 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 287ms · UTC 12:35 · PVG 20:35 · LAX 05:35 · JFK 08:35
    ♥ Do have faith in what you're doing.