V2EX › Moear 的所有回复 › 第 1 页 / 共 2 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2

❮

❯

6 月 1 日

回复了 Moear 创建的主题 › 分享创造 › 需要配音,无从下手?一个软件足矣! 欢迎使用 Neiroha--多端接入、多平台适配的配音工作站

@IvenWang 感谢支持🥰

4 月 28 日

回复了 Moear 创建的主题 › 分享创造 › ?!广东人狂喜!?,自制蟑螂幸存者小游戏卵鞘危机 V1.0 版本发布,纯浏览器也能玩的肉鸽小游戏

@ccc00 不是😋

4 月 26 日

回复了 Moear 创建的主题 › 分享创造 › ?!广东人狂喜!?,自制蟑螂幸存者小游戏卵鞘危机 V1.0 版本发布,纯浏览器也能玩的肉鸽小游戏

@xiaoshouchen
对于背景音乐人工使用 minimax 的音乐模型(类似 suno)生成的现在这种音乐模型已经很成熟了
对于音效 cc/codex 有 agent 功能,让他自己上网搜游戏音效免费开源他会自己爬下来当时我给的提示词是"开个 subagent 找找有没有免费 sfx 音效网站我要补齐一下音效如果你能抓取的话那就自动帮我抓" 他找到了 Mixkit 这个网站写脚本自己爬的
对于素材通常是简单的 css + 一些的 svg 矢量图,这种给个图片+需求给强多模态的 ai(比如 gemini 3.1pro 大概花个 8 分像) 而后面 codex 支持了 gpt image 2 就尝试使用了一下来绘制 png 图片作为一些游戏角色的皮肤使用

3 月 6 日

回复了 Moear 创建的主题 › 分享创造 › 写了个 I 站批量下载的 GUI 小工具，单作者/播放列表全搬运

@iamnottsh 因为这相当于要整套重写前端 ui 代码了不过你要是有精力的话可以考虑让 llm vibe 一个 Python Flet 版本的出来

3 月 6 日

回复了 Moear 创建的主题 › 分享创造 › 写了个 I 站批量下载的 GUI 小工具，单作者/播放列表全搬运

@iamnottsh 那没有,做不了一点

3 月 6 日

回复了 digiplanp 创建的主题 › 分享创造 › 做了一个专门翻译漫画图片文字的小工具，分享下实现思路

漫画翻译有开源项目的本地就能直接部署
https://github.com/MashiroSaber03/Saber-Translator
https://github.com/mayocream/koharu

3 月 6 日

回复了 Moear 创建的主题 › 分享创造 › 写了个 I 站批量下载的 GUI 小工具，单作者/播放列表全搬运

@iamnottsh 为什么要有网页版.....pyside6+nuikta 编译后的性能比网页端好太多了

3 月 6 日

回复了 Moear 创建的主题 › 分享创造 › 写了个 I 站批量下载的 GUI 小工具，单作者/播放列表全搬运

@yeqizhang
i 站哪有字幕下载....

2025 年 12 月 18 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Hansah cosyvoice 最长大概 20s 左右吧单句过长了会自动截断分成若干个任务,然后分开跑,当然你也可以自行截断(在文本编辑页面换行然后丢到计划任务里面去), 程序在最后提供了 FFmpeg 一键合成音频的方式,此时从理论上来说无限长度控制符可以看一下 23 楼的那个回答

2025 年 12 月 18 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Hansah 那玩意阿里巴巴没开源😭只开源了 0.5b 参数量的版本

2025 年 12 月 17 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@MindMindMax 苹果大带宽的内存跑 ai 啥的还是挺香的😂

2025 年 12 月 17 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@shuxge1223 理论来说用精细控制模式可以做到但我没咋用过这个精细控制模式
需要额外打标的,标签可以在 https://github.com/FunAudioLLM/CosyVoice/blob/a7d6e2251adb64f7cef595c5c71c5763cb1d162b/cosyvoice/tokenizer/tokenizer.py 里面找到,不过我目前就做了几个简单的打标快捷键,其他的 cosyvoice3 新增的暂时还没拉上来😂
![]( https://raw.githubusercontent.com/Moeary/pic_bed/main/img/202512171832357.png)
![]( https://raw.githubusercontent.com/Moeary/pic_bed/main/img/202512171833035.png)
![]( https://raw.githubusercontent.com/Moeary/pic_bed/main/img/202512171834875.png)
![]( https://raw.githubusercontent.com/Moeary/pic_bed/main/img/202512171834808.png)

2025 年 12 月 17 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@MindMindMax 我自己的显卡是 4070m(笔记本当做 4060ti 8gb 版本就行了) rtf(Real-Time Factor ，实时因子)大致在 0.8~1.6(越低越好说明推理数值越快 rtf 是 1 的话就说明显卡花 1s 的算力可以推理出 1s 的音频来) 纯靠 cpu 的话我用 q1hy(13900hk es)的 rtf 大概是 10,30s 时间能推理出 3s 的音频来

2025 年 12 月 17 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Xhack 可以自行找一段 Moss 的 3s 到 10s 的无底噪的音频截取下来,来源可以是在 b 站搜一下[ [流浪地球①] MOSS/550W 语录/语音集（自存）] 作为参考音频推理使用现在的 tts 模型基本都支持了这种无训练方式复刻音色的功能了

2025 年 12 月 17 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Frankcox 官方的暂时没有😂他只给了一个训练的 train.py 脚本,就是得自己改代码了

2025 年 12 月 16 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Bantes 仁者见仁智者见智可能是你对 tts 不感兴趣吧

2025 年 12 月 16 日

回复了 Moear 创建的主题 › 分享创造 › 阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请你来体验我做的 Windows 端本地 TTS 工具 3s 音频即可复刻音色 4gb 低显存占用!

@Frankcox 不知道建议问问别人 gptsovits 没咋用过