给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
免魔法使用搭载联网GPT4的NewBing
51CTO人工智能专区是人工智能相关技术、资讯、热点、访谈的集聚地。主要包含人工智能、深度学习、机器学习、神经网络、语音识别、语义识别、人脸识别、无人驾驶、无人机、机器人等内容。
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间
从照片到 3D 头像
一个第三方开源工具,用于调用LLM,实现文档语义对话