V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
reDesign
V2EX  ›  问与答

ChatGPT 的 stt 是用的 whisper 吗? 感觉比所有其他的语音输入都要强

  •  
  •   reDesign · Oct 18, 2024 · 1543 views
    This topic created in 556 days ago, the information mentioned may be changed or developed.
    中英文混输比讯飞强,纯中文和讯飞差不多
    说的是这个东西

    Supplement 1  ·  Oct 18, 2024
    这个跟多模肽有关系么?我记得 GPT 3.5 的时候就有这个功能,现在选择 GPT4 也可以用这个功能。
    4 replies    2024-10-19 19:18:22 +08:00
    malusama
        1
    malusama  
       Oct 18, 2024   ❤️ 1
    这玩意估计就是模型支持语音的输入输出。。毕竟早就是多模态的了
    kyor0
        2
    kyor0  
       Oct 18, 2024
    4o 是多模台的
    cyp0633
        3
    cyp0633  
       Oct 19, 2024
    如果是 whisper ,效果会远不如讯飞
    FlashEcho
        4
    FlashEcho  
       Oct 19, 2024
    官方文档里就有: https://platform.openai.com/docs/guides/speech-to-text

    The Audio API provides two speech to text endpoints, transcriptions and translations, based on our state-of-the-art open source large-v2 Whisper model.
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3375 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 12:46 · PVG 20:46 · LAX 05:46 · JFK 08:46
    ♥ Do have faith in what you're doing.