一个用于音频处理和生成的深度学习库
Audiocraft是一个用于音频处理和生成的深度学习库。它具有最先进的EnCodec音频压缩器/标记器,以及MusicGen,一个简单和可控的音乐生成LM,具有文本和旋律调节功能。
LlamaIndex 推出聊天机器人应用,支持设置prompt、上传文件聊天、分享聊天,基本是一键部署。
讯飞听见依托科大讯飞的语音识别技术,打造智慧办公服务平台,提供语音转文字、录音转文字、视频会议、视频转文字、视频加字幕、同声翻译、语音翻译等服务,可满足多样化的语音转文字需求,致力于提高办公效率。
自由节点搭建方法
纯 C 语言实现的 Llama 2 推理引擎
从照片到 3D 头像
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!