美团海报生成 AIGC 技术创新与实践
·
一张商业海报,对设计师来说可能是半天工作;对百万中小商家来说,却可能是一道迈不过去的门槛。外包一张专业海报,少则数百、多则数千元;临时促销要求分钟级交付,传统设计流水线却要1到3天;好不容易批量生产出来,质量又参差不齐——这是美团平台上数百万商家每天都在面对的真实困境。AIGC 给了我们一个新的答案,但「生成一张看起来还行的图」和「生成一张真正可用的商业海报」之间,横亘着精准文字渲染、和谐版式布局、多任务统一支持、质量可量化评估等多项相互交织的技术挑战。过去两年,美团智能创作团队围绕这一问题,构建了覆盖「能生成、能编辑、能评判」的完整技术体系: PosterCraft(ICLR 2026):摒弃模块化流水线,端到端统一优化文字、视觉与版式,在文字渲染准确率上接近Top级别的闭源商业系统; PosterOmni(CVPR 2026):单一模型覆盖扩图、补全、比例调整、风格迁移等六类设计任务,更接近”基于参考稿工作的智能设计助手”; PosterReward(CVPR 2026):首个专门面向海报质量评估的奖励模型,在专项评测基准上达到 86% 准确率,远超现有基线,既驱动生成模型持续进化,也承担线上质检把关。 三者形成「生成-编辑-评判」的技术闭环,相互支撑、持续自我进化。目前三项工作均已全部开源于 MeiGen-AI 仓库,并在美团外卖套餐图生成、品牌 IP 袋鼠团团、点评信息流治理等多个真实业务场景中完成落地。本文将系统拆解这套技术体系的核心思路、关键创新与实战经验。 一、背景与挑战 1.1 业务背景:百万商家的”创意平权”难题 美团连接数百万商家与数亿消费者,海报作为核心视觉营销载体,贯穿商家日常运营全场景。然而,百万商家普遍面临四重困境: 设计资源匮乏:专业营销海报外包动辄数百至数千元,中小商家难以承受;即便是大型连锁品牌,面对多城市、多门店的差异化营销需求,设计师团队同样捉襟见肘。 时效性要求苛刻:天气突变、突发热点、临时促销等本地生活场景要求海报”分钟级”交付,传统设计流水线 1–3 天的周期已严重脱节。 内容同质化严重:大量商家依赖固定模板做简单文字替换,海报千篇一律,在信息爆炸时代难以触达消费者,营销转化率持续走低。 批量生产质量失控:从精雕细琢转向规模化生产后,如何保证每张海报达到商业可用标准,成为新的运营难题。 1.2 技术挑战:高质量海报生成的多维难题 AIGC 为上述问题提供了新思路,但高质量海报生成远非简单的文生图任务,面临五大相互交织的技术挑战。 挑战一:精准的文字渲染 海报文字要求”零容错”——任何错误、缺失或模糊都导致整张海报不可用。主流扩散模型在多行文字、中文字符和小字号文本上仍有明显短板,中文场景下难度尤甚。 挑战二:和谐的版式布局 优秀海报遵循对比、重复、对齐、亲密性等设计原则,这种”设计感”难以规则化,更多依赖对大量优秀作品的隐式学习,是一个开放性难题。 挑战三:统一的美学风格 色彩和谐、视觉层次、品牌调性等多维度共同构成美学判断,且不同行业标准迥异:餐饮要”食欲感”,美妆要”精致感”,科技要”未来感”。模型需在保持整体美学水准的同时适配多样化风格需求。 挑战四:多任务场景的统一 真实设计需求横跨”局部编辑”(文字排版叠加、局部填充)和”全局创作”(风格迁移、版式重组)两大范畴,如何在单一模型中同时支持所有场景,是模型设计和训练策略上的重大挑战。 挑战五:质量评估的可量化 现有图像质量指标(FID、IS 等)无法捕捉海报特有的排版质量、文字准确性和设计规范性,而人工评估成本高昂且难以规模化。我们需要一套既能驱动模型优化(作为 RL 奖励信号),又能承担线上质检的自动化评估体系。 1.3 我们的解法:构建”生成-编辑-评判”技术闭环 面对上述挑战,我们团队围绕海报生成构建了一套完整的技术体系,覆盖基础模型能力提升、多任务统一模型融合和质量评估模型三大核心环节,形成了”能生成、能编辑、能评判”的技术闭环。 能生成:端到端高美感海报生成,精准文字渲染;技术方案→ PosterCraft|Code(ICLR 2026) 能编辑:六大任务统一,局部编辑与全局创作融合;技术方案→ PosterOmni|Code(CVPR 2026) 能评判:真实海报结构化解析 + 生成海报偏好评估;技术方案→营销海报结构化 + PosterReward(CVPR 2026)