通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
牛津大学的研究人员提出了Farm3D:一个人工智能框架,可以通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
讯飞听见依托科大讯飞的语音识别技术,打造智慧办公服务平台,提供语音转文字、录音转文字、视频会议、视频转文字、视频加字幕、同声翻译、语音翻译等服务,可满足多样化的语音转文字需求,致力于提高办公效率。
一个第三方开源工具,用于调用LLM,实现文档语义对话
一个集视频听翻、直播听翻、语音转写、文档直翻功能为一体的AI智能语音转写听翻平台
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
Facebook Research开发的Audiocraft音频处理和生成库
通过将静态内容与时间变形结合,为视频处理提供了新的视角和工具