支持文字生成视频和图片生成视频。
开放扩散模型用于高质量视频生成。
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
Facebook Research开发的Audiocraft音频处理和生成库
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。