声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
ChatGLM2-Voice-Cloning主要用于进行声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音。
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
一个统一可控的视觉生成模型
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
用户提供一张自己的全身照,就可以获得自己穿上对应服装的样子
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务
一款适用于搭建内部培训平台的开源系统,旨在为企业/机构打造自己品牌的内部培训平台