一个开源工具包,可实现语音、声音和歌唱功能
Amphion是一个开源工具包,可实现语音、声音和歌唱功能。除了文字转语音功能,它还能将一首歌的声音换成另一个歌手的声音,并支持声音转换、歌声合成、文本到音频、文本到音乐等功能。
多语言视觉文本生成和编辑工具,它基于扩散模型,能够在图片中生成或编辑文字
用户提供一张自己的全身照,就可以获得自己穿上对应服装的样子
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间
输入文字即可编辑视频,包括修改风格、修改局部画面、视频混合、视频扩展。
一个实现了在个人电脑上运行 LLM 模型,并集成了服务接口和在线聊天界面的项目。
一个使用类型来构建自然语言界面的库。