声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
ChatGLM2-Voice-Cloning主要用于进行声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音。
SceneXplain 是一项尖端的 SaaS 服务,它使用先进的 AI 技术为上传的图像和视频生成全面而复杂的文本描述。
一个可以控制多个视觉基础模型的集中式系统
一个开源项目,它可以实现 API 形式的调用 AI 绘图。
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
搜索 1000 万+ 提示,并通过 Stable Diffusion、DALL·E 2 生成 AI 艺术和 AI 图像。
文本来生成具有艺术风格的Cinemagraph动态图片