阿里巴巴发布了一款全新的多模态模型Qwen-Image,这款模型拥有200亿参数,专为解决“图中写字”这一难题而生。
Qwen-Image是一个200亿参数的MMDiT模型,可生成写实、动漫、赛博朋克、科幻、极简、复古、超现实、水墨等几十种类型的图片,支持图片的风格迁移、增删改、细节增强、文字编辑,人物姿态调整等常规操作。
在复杂文本渲染和精准图像编辑方面取得了显著进展。实验表明,该模型在图像生成和编辑方面均具有强大的通用能力,并且在文本渲染方面表现出色,尤其对中文文本渲染尤为出色。
Qwen-Image也可以生成OpenAI的GPT-4o爆火全网的吉卜力风格图片。根据「AIGC开放社区」实际测试二者差距很小,尤其是在超复杂中文提示词理解、文字嵌入方面Qwen-Image更好。
根据阿里公布的测试数据显示,Qwen-Image在GenEval、DPG、OneIG-Bench以及GEdit、ImgEdit和GSO测试中,图片生成、编辑能力非常出色,大幅度超越了文生图开源大黑马FLUX.1 [Dev],成为中文最好的文生图模型。
免费在线体验地址:
2:魔搭社区在线体验 https://www.modelscope.cn/aigc/imageGeneration
3:liblib体验地址 https://www.liblib.art/models/Qwen-Image
4:吐司ai:https://tusi.cn/models/893830375145520880
开源地址:
huggingface:https://huggingface.co/Qwen/Qwen-Image
相关导航
暂无评论...