MMTryon

5天前发布 2 00

MMTryon 是由中山大学和字节跳动智创数字人团队开发的先进虚拟试穿框架。它打破了传统试穿的界限,让用户无需实际试穿即可预览多样服装搭配效果。通过输入多张服装图像及简单的文...

收录时间:
2024-11-29
MMTryonMMTryon
MMTryon

MMTryon 是由中山大学和字节跳动智创数字人团队开发的先进虚拟试穿框架。它打破了传统试穿的界限,让用户无需实际试穿即可预览多样服装搭配效果。通过输入多张服装图像及简单的文本指令,MMTryon能够瞬间生成高保真度的试穿结果,从外套的拉链开闭到上衣的穿着方式,细节处理无微不至。

MMTryon凭借其强大的服装编码器和多模态图文注意力模块,支持复杂换装场景及任意服装款式,让每一次试穿都充满无限可能。无需依赖精细的服装分割,只需简单操作,即可享受个性化的时尚搭配体验。

MMTryon – 字节跳动推出的多服装组合虚拟试穿框架

MMTryon的主要功能特点

  • 多件衣服组合试穿:MMTryon实现了从输入多张服装图像和简单的文本指令到一键生成高保真度试穿结果的功能。用户无需实际试穿,即可预览多种服装搭配效果,极大地提升了购物和设计的便捷性。
  • 复杂换装场景支持:该框架设计了一个强大的服装编码器,能够处理各种复杂的换装场景和任意服装款式。无论是简单的T恤牛仔裤,还是复杂的礼服套装,MMTryon都能准确地进行虚拟试穿,展现出真实自然的换装效果。
  • 无需精细服装分割:传统的虚拟换装算法通常依赖于对服装的精细分割,而MMTryon则打破了这一限制。它能够通过文本指令从多张服装参考图像中选择需要试穿的服装及对应的穿法,无需对服装进行精细分割,即可生成高质量的试穿结果。
  • 多模态图文注意力机制:MMTryon引入了多模态图文注意力模块,该模块利用详细的文本描述与图像信息相结合,通过clip编码来控制多样的试穿风格。用户可以通过简单的文本指令来指定着装风格,如外套拉上拉链、上衣塞入裤子等,从而实现更加个性化的试穿效果。
  • 多参考图像处理能力:为了支持多件服装的组合试穿,MMTryon设计了多参考图像注意力模块。该模块能够将多张服装图像的特征注入到目标人物图像中,实现多件服装的同时试穿。用户可以选择多件服装进行搭配,并查看整体效果,从而更加全面地评估服装搭配的合适性。
  • 数据扩增技术:为了解决组合换装数据获取成本高的问题,MMTryon采用了基于大模型的数据扩增技术。通过构建大规模的增强数据集,并与原始数据一起用于训练,提高了模型的稳定性和性能。这使得MMTryon能够在更广泛的场景下展现出优秀的试穿效果。

MMTryon和其他虚拟试穿技术的对比优势

MMTryon在单件衣服上的试穿效果都是要优于现有的虚拟试穿技术的。

通过对比,我们可以很明显的看到,第一件衣服中手臂侧边的白色条纹只有MMTryon能很好地体现,而其他试穿技术都难以体现。

对第二件衣服在色彩和图案细节上的体现也明显优于其他现有试穿技术。而MMTryon的亮点还远不止于此。

MMTryon最大的特色就是多模型和多参考的注意机制。这是现有的试穿技术所实现不了的。

什么意思呢,就是你原来去服装店买衣服的时候,一次只能试穿一件,要么试上衣,要么试裤子。想要知道它们组合起来什么样,就只能自己在脑海里凭空想象。

但是现在不一样了。你可以一下试穿两件衣服,裤子和上衣一起试穿,搭配效果一目了然,简单方便。

现有的试穿技术,是无法做到裤子上衣还有包同时放到一个人的身上的,但MMTryon就能很好地做到这一点。

通过对比,我们可以看到只有MMTryon能够完整准确地将几件衣服搭配到一个人身上。而且,MMTryon不止能将现实的衣服放到人的身上,它还能将动漫人物的衣服放到人身上,甚至还能将动植物转化为衣服!

在这一方面
MMTryon
仍然是吊打其他现有的技术!

你以为这就是全部了吗?那你可就双错了!

MMTryon还还还有其他功能!MMTryon能够识别复杂指令,生成试穿图片。

如果你在试衣服时想把拉链打开或者把包拿在手里甚至将上衣掖到裤子里也能做到!也就是说你在试衣服时可以完全按照自己平时的穿衣风格来搭配衣服。

可以看到,本来闭合的风衣变成敞开的了,能更好地看出日常穿衣的效果!

看到这我就想大喊一句,还有谁!!

这样的虚拟试衣技术堪称是懒人的福利,既不用出门,还能享受到实体店试穿的便利,一个字,爽!!

数据统计

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...