输入文字即可编辑视频,包括修改风格、修改局部画面、视频混合、视频扩展。
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
借助大语言模型(LLM)处理音频的工具
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
一个强大的自动化视频制作工具,它可以自动采集素材、编辑视频、配音、生成字幕,从而简化了视频创建过程
一个开源的文本转语音工具
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。