一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音
在文本输入的同时立即开始语音合成,无需等待整个文本输入完毕。
一个模型,它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。
一个轻量级的 JavaScript(没有依赖项),为 SVG 设置动画,使它们看起来像是被绘制的
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
文本来生成具有艺术风格的Cinemagraph动态图片