Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
macOSpilot 是 Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
一个开源的文本转语音工具
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个开源的聊天用户界面,基于OpenAI聊天模型搭建的高级聊天机器人套件
51CTO人工智能专区是人工智能相关技术、资讯、热点、访谈的集聚地。主要包含人工智能、深度学习、机器学习、神经网络、语音识别、语义识别、人脸识别、无人驾驶、无人机、机器人等内容。
Giiso写作机器人,一款内容创作AI辅助工具
一个使用自然语言进行交流的应用程序,它是通过 OpenAI Functions 和 Vercel AI SDK 构建的