一个开源工具包,可实现语音、声音和歌唱功能
Amphion是一个开源工具包,可实现语音、声音和歌唱功能。除了文字转语音功能,它还能将一首歌的声音换成另一个歌手的声音,并支持声音转换、歌声合成、文本到音频、文本到音乐等功能。
一个使用ChatGPT4.0构建自己的AI女友的Python项目
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点
基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
DragGAN 是一个效果惊人的 AI 绘图工具,它让设计师和艺术家交互地、极其精细地调整 AI 绘图过程,和那些输入文本、期待 AI 生成作品、然后一次次痛苦地微调结果的 AI 相比,这领先了一个时代!