一个用于音频处理和生成的深度学习库
Audiocraft是一个用于音频处理和生成的深度学习库。它具有最先进的EnCodec音频压缩器/标记器,以及MusicGen,一个简单和可控的音乐生成LM,具有文本和旋律调节功能。
基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
使用文本描述创建动态电影艺术图像
一个用于图像和视频修复的应用程序,它使用ESRGAN模型进行训练,该模型使用合成数据进行图像和视频的恢复
一个带有提示构建器的MidJourney提示数据库。您可以选择所有的MidJourney提示设置,并从风格、艺术家、主题等中选择,以根据您的需求制作完美的提示。它完全免费使用,并产生惊人的效果。
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个多代理框架,可根据一行要求生成 PRD(产品需求文档)、设计、任务和存储库