一个用于音频处理和生成的深度学习库
Audiocraft是一个用于音频处理和生成的深度学习库。它具有最先进的EnCodec音频压缩器/标记器,以及MusicGen,一个简单和可控的音乐生成LM,具有文本和旋律调节功能。
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
搜索 1000 万+ 提示,并通过 Stable Diffusion、DALL·E 2 生成 AI 艺术和 AI 图像。
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。
轻松构建LLMs应用程序开源UI可视化工具