一个用于音频处理和生成的深度学习库
Audiocraft是一个用于音频处理和生成的深度学习库。它具有最先进的EnCodec音频压缩器/标记器,以及MusicGen,一个简单和可控的音乐生成LM,具有文本和旋律调节功能。
Rope AI换脸工具
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
自由节点搭建方法
提供IDE风格的下拉菜单式自动补全功能
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
一个可以控制多个视觉基础模型的集中式系统