今日凌晨,阿里巴巴正式发布其全新图像编辑模型Qwen-Image-Edit。
该模型基于200亿参数规模的Qwen-Image架构构建而成,在保留原图整体风格的基础上可精准完成文本修改。
通过将输入图像同时送入负责视觉语义控制的Qwen2.5-VL和负责视觉外观控制的VAE Encoder模块中实现双通道处理机制。
据官方介绍该模型具备三大核心特性:首先在视觉维度上既支持对元素增删改等低层次外观调整(要求非目标区域绝对保真),也具备IP创作、物体旋转等高层次语义迁移能力(允许全局像素变化但需保持语义一致性)。
其次针对图文内容提供中英双语文字处理方案,在不改变原有字体样式和排版格式的前提下可直接执行文字增删改操作。
经多组公开基准测试验证显示其在图像生成质量评估指标上达到当前最优水平(SOTA),展现出强大的基础模型能力。
具体应用场景涵盖原创IP设计调整、视角转换重构、艺术风格迁移等专业需求;
既可完成新增/消除/重绘等基础操作又支持人物背景替换、服装细节修改等复杂任务;
特别针对图文混排场景实现了中英文海报的文字内容精准修改功能;
甚至能通过多步骤链式编辑实现连续性创作流程。
有体验者评价称”这款AI工具几乎让Photoshop成为历史”。
用户可通过访问Qwen Chat平台(chat.qwen.ai)启用「图像编辑」功能进行体验: ModelScope官方地址: https://modelscope.cn/models/Qwen/Qwen-Image-Edit Hugging Face仓库: https://huggingface.co/Qwen/Qwen-Image-Edit GitHub开源项目: https://github.com/QwenLM/Qwen-Image
评论列表 (0条):
加载更多评论 Loading...