
通义万相是什么
通义万相AI视频是阿里推出的一款完全免费的AI图像和视频生成工具,支持图像生成、文生视频和图生视频、数字人,4种方式
通义万相的主要功能
核心创作能力
图片生成
- 文生图:仅通过文字描述,创作出想要的图片。
- 图像编辑与参考:通过文本指令,可以轻松进行图像编辑或以现有图像为参考进行创作。
- 创作模型 (图片):提供多种不同特性的模型以供选择。
- 万相2.5 Preview:通过文本指令,轻松进行图像编辑或图像参考。
- 万相2.2 专业:更强的指令遵循能力,更美的画面结构,并支持文字生成。
- 万相2.2 极速:具备更强的指令遵循和更美的画面结构,同时速度更快。
- 万相2.1 专业:专业的画质,支持复杂的构图,并提供丰富的风格选择。
- 万相2.1 极速:稳定的指令理解,速度快。
- 万相2.0 极速:擅长人像艺术摄影,速度快。
视频生成
- 文生视频:仅通过文字描述,创作出一段全新的视频。
- 图生视频:给定一张图片,通过提示词来描述希望图片达到的运动效果,从而获取一段全新的视频。
- 首尾帧生视频:给定视频的开始和结束画面,通过提示词辅助生成中间的过渡视频。
- 图像参考:参考你提供的1-2张图像中的关键元素(如主体),生成一段全新的视频。
- 视频重绘:对给定的视频进行全面的风格或内容改变。
- 局部编辑:修改视频画面中的指定区域,并保持其他部分不变。
- 视频特效:为上传的图片一键添加酷炫的动态视觉特效。
- 文生视频模型 :提供针对视频生成的专业模型。
- 万相2.5 Preview:支持声音生成和声画同步。
- 万相2.2:具备影视质感和细腻的动态表现。
- 万相2.1 专业:支持复杂运动和物理规律还原,同时支持文字生成。
- 万相2.1 极速:流畅动态,物理规律还原。
- 万相2.0:丰富的风格表现。
数字人
- 功能描述:给定一张图片和音频,生成高品质的人物动态演讲视频。
- 上传角色图:支持本地上传或从平台作品资产中选择图片。角色图片支持肖像、半身、全身等任意画幅,以及卡通、动物等形象。
- 上传音频:支持本地上传音频,或直接使用TTS(文本转语音)功能生成。TTS功能提供多种音色选择,并支持音频裁剪。
创作辅助与控制
- 多模态输入:支持通过提示词撰写、图片/视频上传和智能扩写等方式,精确控制生成结果。
- 提示词撰写:提示词是控制画面内容与效果的关键因素。平台提供提示词公式(AI性作画)、提示词公式(AI性视频)等参考,帮助提升画面品质感与控制力。
- 智能扩写:可以根据输入的简单提示词,通过语义分析衍生出丰富的内容和描述,并在提示词后主动触发使用。
- 创作模型选择:用户可选择不同的创作模型,这些模型在生成速度、擅长品类、细节品质、语义理解、风格泛化性等方面均有不同表现。
- 创意模板:可以选择预设模板,让生成的内容直接套用模板中的效果。
- 比例选择:支持16:9、4:3、1:1、3:4、9:16等多种预设比例,以适应不同场景和终端的差异化使用诉求。
创作管理
- 查看与筛选:在“创作”页面,用户可以查看和管理所有创作任务结果。支持按“视频”或“图片”进行任务类型筛选,也可以只显示收藏的作品。
- 结果操作:对生成的作品进行处理,包括点赞、收藏、下载和发布。
- 作品详情查看:可以了解作品的详细生成参数,如文字描述、使用的模型等。
- 作品编辑与二次创作:
- 作品编辑:以当前作品为基础,进行二次创作,例如视频重绘、局部编辑,或将作品送入项目集。
- 复用创意:点击后,当前作品的所有参数会自动填入新的创作卡片,方便快速发起新创作。
- 再次生成:使用与上次完全相同的参数再生成一次。
通义万相的官网地址
相关导航
暂无评论...