EchoMimicV2利用参考图像、音频剪辑和一系列手势来生成高质量的动画视频,确保音频内容和半身动作之间的连贯性。
HivisionIDPhoto 是一款基于 AI 的轻量级证件照制作工具,能智能识别和抠图,快速生成符合多种规格的证件照。支持自定义背景色和尺寸,未来还将推出美颜和智能换正装功能。用户可通过 Docker 部署,轻松搭建本地服务。GitHub 上提供源代码和在线体验。
MiniCPM3-4B!该模型的表现超越 Phi-3.5-mini-instruct 和 GPT-3.5-Turbo-0125,并且能够比肩 Llama3.1-8B-Instruct、Qwen2-7B-Instruct、GLM-4-9B-Chat 等多个 7B-9B 参数量的模型。
一款轻量级的开源标注工具,,LabelU 提供了多种标注工具和功能,支持图像、视频、音频标注。
Modelscope-Agent 是一个可自定义且可扩展的代理框架。单个代理具有角色扮演、LLM 调用、工具使用、计划和记忆等功能
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频
支持gpu,可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
基于Whisper的GUI软件:Buzz:离线语音转文字(字幕)
MaterialSearch是一个支持中文的本地素材搜索工具,可以扫描本地图片和视频,并支持自然语言进行搜索。可以文字搜图、以图搜图、文字搜视频、以图搜视频、图文相似度计算、Pexels视频搜索
CapsWriter 的离线版,一个好用的 PC 端的语音输入工具、字幕转录工具。
IOPaint 是一款免费、开源且完全可自行托管的修复/修复工具,由最先进的 AI 模型提供支持。您可以在 IOPaint 中使用各种模型来更改图像,包括修改、擦除
在此次Qwen1.5版本中,我们开源了包括0.5B、1.8B、4B、7B、14B和72B在内的6个不同规模的Base和Chat模型,并一如既往地放出了各规模对应的量化模型
OpenVoice 是 myshell ai 开源的一款基于人工智能技术的语音克隆工具。
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。
一个增强版免费开源的ChatGPT程序,LibreChat 是一个免费开源的聊天机器人平台,集成了多种 AI 模型。
一个开源的聊天机器人Web UI框架,Chatbot UI提供 OpenAI 的 ChatGPT UI 的改进版本。提供了一个简单的用户界面,具有新对话、新聊天、导入数据、导出数据、设置和插件键等功能。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化。
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型。(基于 LangChain 实现插件功能)
GeminiProChat是GeminiPro的最小化Web界面,提供简洁有效的聊天体验。它支持通过环境变量来控制网站,允许使用者通过Docker部署,并提供易于部署的Vercel和Railway选项。
一个功能强大的视频处理工具,可满足用户在视频翻译、配音和编辑等方面的需求。
很棒的 ChatGPT API,Github项目,精选的应用程序和工具列表,不仅使用新的 聊天GPT API ,还允许用户配置自己的 API 密钥 ,从而可以免费和按需使用自己的配额。
Github上的chatgpt prompts英文提示库
多语言视觉文本生成和编辑工具,它基于扩散模型,能够在图片中生成或编辑文字
自动为视频生成高亮字幕
将屏幕截图转换为清洁的HTML / Tailwind / JS代码
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务
一款应用程序,一次提问向多个大模型AI机器人聊天(包括ChatGPT,bing,Bard,文心,讯飞,360 智脑等)
一个将稳定扩散模型引入Web浏览器的项目
帮助你发现优秀中文项目,可以无语言障碍地、更高效地吸收优秀经验成果
ChatGPT 中文指南项目旨在帮助中文用户了解和使用ChatGPT。我们收集了各种免费和付费的ChatGPT资源,以及如何更有效地使用中文与 ChatGPT 进行交流的方法。在这个仓库中,您将找到丰富的 ChatGPT工具、应用和示例。
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点
Faiss 是一个用于高效相似性搜索和密集向量聚类的库。它包含算法,可以在任何大小的向量集中进行搜索,直到可能不适合RAM的向量。它还包含用于评估和参数调整的支持代码。
Milvus 向量数据库专为向量查询与检索设计,能够为万亿级向量数据建立索引。与现有的主要用作处理结构化数据的关系型数据库不同,Milvus 在底层设计上就是为了处理由各种非结构化数据转换而来的向量而生。
SiliconCloud 是硅基流动推出的一站式大模型 API 平台,提供了多种顶尖开源大模型的API服务,邀请码:KwzzG0LV
星火大模型API具备强大的语义理解、文本生成、情感分析等能力,可广泛应用于智能客服、内容创作、舆情监控等多个领域。API具有高度的可定制性和扩展性,
Suno 音乐生成的非官方api接口
AI chatgpt中转站支持GPT-3.5、GPT-4、Claude3等模型,支持多模态,价格实惠
SceneXplain 是一项尖端的 SaaS 服务,它使用先进的 AI 技术为上传的图像和视频生成全面而复杂的文本描述。
零一万物的 Yi 大模型 API 开放平台,开放三个版本的模型,模型API名额限量开放中,新用户赠送60元。
基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式
“大模型+大算力”是商汤科技在通用人工智能领域
允许开发者通过一个简单的API接口来访问超过100种不同的大语言模型。包括OpenAI、Anthropic、Mistral、LLama2、Anyscale、Google Gemini等。
一个提供稳定扩散和Dreambooth API的网站。
WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。
一款提供语音识别、语音合成和自然语言处理等技术的开放平台
一个由人工智能驱动的语义搜索引擎,为用户提供创新的搜索体验
提供语音识别、说话人检测、语音摘要等AI模型的平台
为企业家和销售团队打造的视频开发平台,根据不同的联系人生成个性化的视频。
LOVO AI 是一款下一代的AI画外音&文本到语音平台,它提供了超过180个仿真度高,类似人类的声音库,涵盖了33种语言。
一款基于AI和Web3技术的智能聊天机器人平台,用户可以在这里创建自己的聊天机器人,并且可以分享给朋友和社区使用。
AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。
一个基于AI的平台,提供了多样化的自然语言处理(NLP)功能,包括文本分析、语音转换、摘要等。
一款文本转语音工具,支持65种语言和400多种不同的声音。
是一家提供聊天机器人创建和管理平台的公司。该平台具有简单易用、灵活可定制、可扩展性强等特点。其最大亮点是采用了人工智能技术,使得聊天机器人能够更加智能化,具备自学习能力,能够为企业提供更加高效的客户服务和营销支持。
一个快速且价格实惠的AI图像生成API,使用稳定扩散技术
一款先进的AI模型,专注于为加密货币和区块链技术领域的个人和企业提供全方位的支持
一种新的与 API 交互的方式
Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。
一款功能强大的人工智能(AI)绘图工具
一个API,所以你可以专注于构建下一代人工智能产品,而不是维护GPU。
使用您的数据创建自己的聊天机器人,并将其发布到您的网站上
与AI对话生成思维导图
提供一键部署算法绘图环境、提供AI开发环境和终端模拟器等功能的平台。同时还有即将上线的超级AI绘图工具、大语言模型、私域视频创作工具等应用。
一家专注于将非结构化数据(如照片、视频和其他传感器模态)转换为3D模型的技术公司。通过AI技术帮助用户从真实世界的对象、场景、位置等方面获取信息
无需下载、无需配置、无需设置。 Node.js 代码可通过浏览器立即运行,并具有内置数据库和文件存储。然后只需单击一下即可交付生产就绪的 API
免费批量图像背景去除器
一款通过API提供即时、高质量的网站和HTML转换为PDF的工具
打造你的专属个人知识库
Semi 设计稿转代码(Semi Design to Code,或简称 Semi D2C),是由抖音前端 Semi Design 团队推出的全新的提效工具。Semi D2C 可以一键将 Figma 设计稿转为前端代码,帮助研发侧快速实现 UI 还原工作,提升研发侧需求交付速度。
CodeFun 是光速软件推出了首款产品,通过 AI 算法,它可以一键将 UI 设计稿(Sketch、Figma、Photoshop)转换成如工程师手写一般的源代码。
即时AI通过自然语言描述,来生成与需求相匹配的设计稿。包含APP、web设计稿
京东推出的设计稿一键生成多端代码工具
阿里推出的免费设计稿智能生成前端代码
基于商汤自研大语言模型的智能编程助手,支持Python、Java、JavaScript、C++、Go、SQL等30+主流编程语言和VS Code、IntelliJ IDEA等主流IDE(集成开发环境)
通义灵码,国内使用规模第一的AI编码工具
字节旗下推出的免费AI编程助手,提供智能 AI IDE 和 AI 编程助手,带给你全新的编码体验。AI IDE 提供开箱即用的开发环境,AI 编程助手提供代码生成、代码解释、单测生成和问题修复等功能,支持上百种编程语言和主流开发环境。
腾讯云 AI 代码助手是由腾讯云自研的一款开发编程提效辅助工具,开发者可以通过插件的方式将 AI 代码助手安装到编辑器中辅助编程工作(VSCode 或者 JetBrian 系列 IDE)
GitHub 和 OpenAI 合作开发的一个 AI 工具,可以提供实时代码建议和自动代码补全。它可以帮助开发人员快速编写代码,并提高编码效率。
Devin是由人工智能初创公司Cognition推出的全球首个全自主的AI软件工程师智能体,具备强大的编程和软件开发能力,能够在多个方面协助或完全独立地完成软件开发任务
非十科技基于自研代码大模型推出了AI代码助手Fitten Code
"AskYourDatabase" 是一个针对 SQL 和 NoSQL 数据库的 ChatGPT 功能界面。它允许用户通过对话的方式与他们的数据库进行各种交互
CodeFuse 蚂蚁在自研的智能研发助手,希望提升开发者效率,让写代码变得更简单。
AICodeConvert(AI 代码转换器 |代码转换器 AI) 通过集成 AI 代码转换器和 AI 代码生成器来简化 AI 编码。
AI生成前端React/UI组件,由Vercel推出
使 GPTs 组成软件公司,协作处理更复杂的任务,MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等
斑头雁提供简单、易用的AI 应用开发平台,全新交互形式,API无缝集成至企业系统,帮助企业实现AI生产力革命。
CodeWhisperer 是一种亚马逊推出的AI 编程服务,个人用户免费使用
国产,开源,CodeGeeX是一个基于AI大模型的编程辅助工具,可以实现自动代码生成、代码翻译、自动编写注释等功能,支持20多种编程语言。
iFlyCode 是一款 AI 编程工具,专注于代码层面,工具基于讯飞星火 V2.0 大模型,具备代码生成、代码补齐、代码纠错、代码解释、生成单元测试等功能。
华为云推出的国产化的AI代码辅助编程工具
可以使用GPT4的AI代码辅助编程开发工具。
使用Cursor可以毫不费力地重构、理解和编写代码。
codeium 可以通过AI帮助开发者生成代码,目前已支持Visual Studio、JetBrains等多个常见IDE以及多个浏览器。目前个人使用免费
devv.ai 是一款面向程序员且最懂程序员的新一代 AI 搜索引擎
文心快码是百度推出的AI编程工具,基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,为开发人员生成更符合实际研发场景的优质代码
海量 AI 应用免费用,图文、音视频生成等全领域覆盖。