This topic created in 812 days ago, the information mentioned may be changed or developed.
苦于作业太多,而且都是让自己录制非实时,每个 Presentation 作业都要半个小时,但其实重点是 Slides ,自己出镜就是读稿子
假设用自己的数据训练,能否训练出自己的声音+面容,让它帮我朗读,我只要自己写稿子就行了,然后把这段视频和 PPT 录制视频嵌在一起就好了
有哪些开源模型能实现。硬件应该不是问题。
2 replies • 2024-03-22 18:28:21 +08:00
 |
|
1
zapper Mar 22, 2024
可以肯定是可以,只是光朗读又不是什么高难度动作,感觉有点多此一举
|
 |
|
2
love060701 Mar 22, 2024
1 、录制一段你的正面半身视频,可以有手势但不能挡脸,可以全程闭嘴不说话;
2 、使用 GPT-SoVITS 克隆声音(开源,但是有吞字的情况);或者选火山、阿里云、微软的付费语音克隆;输入文字即可生成语音;
3 、使用 wav2lip ,把 1 的视频和 2 的语音合起来,同步嘴型; wav2lip 有很多改良版,需要挑选;
付费服务选 HeyGen ,全套解决。
|