Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

有没有使用该项目的最佳使用方法 #89

Open
TheHonestBob opened this issue Jan 16, 2025 · 6 comments
Open

有没有使用该项目的最佳使用方法 #89

TheHonestBob opened this issue Jan 16, 2025 · 6 comments

Comments

@TheHonestBob
Copy link

想知道该项目开源权重有没有什么限制或者最佳使用方法,例如看issue有人说中文效果不好,又或者说对于视频分辨率太大也达不到最佳效果等等

@endofD
Copy link

endofD commented Jan 16, 2025

潜力巨大。
1 syncnet的 训练需要用新的vae训练 wispher 如果换了 输出的 dim应该变化了 的图应该变化应该对应调整。4090就能训练
2 unet 需要用高清数据集已经中文嘴型来训练 50G显存
3 只能拼凑信息

作者很忙 不会手把手, 毕竟 开源了都在那

@TheHonestBob
Copy link
Author

潜力巨大。 1 syncnet的 训练需要用新的vae训练 wispher 如果换了 melspectrogram的图应该变化应该对应调整。4090就能训练 2 unet 需要用高清数据集已经中文嘴型来训练 50G显存 3 只能拼凑信息

作者很忙 不会手把手, 毕竟 开源了都在那

这句潜力巨大,就能让我少走很多弯路,那我先测测英文效果,如果ok,我就深入搞搞

@syghhhhh
Copy link

项目中对于侧脸情况的处理我觉得可以优化一下

@zhjygit
Copy link

zhjygit commented Jan 26, 2025

中文训练数据集和训练方法有指导吗?只使用4060ti训练第二阶段。

@endofD
Copy link

endofD commented Jan 26, 2025

第二阶段 作者说需要50 G 显存

@zhjygit
Copy link

zhjygit commented Jan 26, 2025

第二阶段 作者说需要50 G 显存
那就没的玩了。主要是中文不行的话国内就很难搞了,如果能提供和wav2lips那样的训练方法何数据集就好了。但两个项目训练数据集显然不一样。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants