去年,微软宣布推出其自研图像生成模型 MAI-Image-Annual-1。该模型在 Arena 的图像竞技场(Image Arena)中首次亮相时排名仅为第 9 位,显著落后于其他 AI 实验室的模型。随后,微软将该模型提供给 Bing.com/create 网站及必应移动应用的用户使用。
今年 3 月,微软 AI 团队推出了第二代图像生成模型 MAI-Image-2。该模型实现了显著改进,能够生成具有更逼真的自然光、更准确的肤色等效果的图像。MAI-Image-2 首次亮相便取得了第 3 名的成绩,仅次于 Google 的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity。
该模型被集成在 Copilot 和必应图像创建器(Bing Image Creator)中,同时通过微软 Foundry 的 API 向开发者开放。
今天,微软 AI 团队宣布推出其最新型文生图模型 MAI-Image-2.5。根据 Arena 最新的文生图排行榜,该模型目前已位列第三。目前排名第一的是 OpenAI 的 gpt-image-2,得分为 1388。
据微软介绍,新的 MAI-Image-2.5 模型在广泛的图像风格上表现更佳。该模型旨在更紧密地遵循提示词(prompt),更可靠地渲染文本,并生成细节更丰富、连贯性更强的图像。微软还表示,该模型具备更强的视觉推理能力,能够更好地理解物体、光照、比例、场景结构和空间关系。
微软特别强调,新模型在文本渲染、风格化插图和商业图像方面实现了最大的提升。这使用户能够生成更优质的海报、包装效果图、品牌概念图和产品宣传图。生成图像中的文本将更清晰锐利,布局将更稳定,以品牌为中心的视觉元素将呈现得更精致。
与之前的微软 AI 模型一样,新的 MAI-Image-2.5 模型今天已在 Arena 上开放给任何人试用。预计在未来两周内,该新图像生成模型也将在 MAI Playground 和微软 Foundry 上线。