手机版

首页 > 情感 > 内容

阿里 FashionAI 数据集:用知识重建构造「时尚+A(2)

发布时间:2021-11-12   来源:网络整理    
字号:

  阿里巴巴资深算法专家雷音(贾梦雷)所带领的阿里巴巴「图像和美」团队从 10 年前就开始在淘宝做图像的检测和搜索,彼时主要针对的是商家图片版权保护、虚假广告宣传等。

  正如庄卓然所言,「识别」只是计算机视觉的一部分。如果要进一步做到感知和交互,进一步拉通消费和生产,只靠技术是远远不够的。雷音也深刻地意识到淘宝今天所面临的困境,是消费者和平台、和商家无法用达成共识的语言沟通商品需求的问题。「单单连衣裙类目就有 2000 万件商品,产品数量非常庞大,但还是有很多用户抱怨找不到自己想要的商品,」雷音介绍道,阿里巴巴在时尚角度的数据重组依然有很大的提升空间,这样才能让消费者很好地表达自己的需求,并通过这些表达接触到对应的数据。

  数据重组是 FashionAI 的重要组成部分。只有让机器能理解人类所表达的内容,把数据进行有效的分类,才能让消费者熟悉穿搭行业的认知,进行更有效的需求表达。

  在一个主观的世界里去做客观的事情并不容易,而首当其冲的便是要让机器懂得时尚界的语言。

  「让机器理解衣服,核心是制作服饰图像数据集。[3] 」 雷音认为,将从业者的知识转化为机器可以理解的逻辑语言,首先要从数据集入手,用足够的数据让机器明白各种服饰的区别和特性。

  而要构建一个时尚与人工智能结合的数据集,让机器拥有「时尚之心」,便涉及到 FashionAI 要做的核心内容:知识重建。原有的时尚知识体系仅停留于专业人士之间的沟通和交流,往往存在不完备和二义性两大问题。也就是说,同一层次的概念可能存在不少模糊地带,而且不一定能覆盖实用场景的各种情况,这是追求逻辑的机器绝对不能「理解」和「容忍」的问题。更棘手的是,专业人士与非专业人士的认知并不统一,存在工业设计知识、平台运营知识及大众营销知识标准不统一的问题。

  在整个知识体系的重建中,雷音总结了三条重要的经验,这不仅对于时尚行业,对于任何一个传统行业用 AI 赋能的过程都具有借鉴意义。

  首先是,知识要实现人和人的沟通,既要符合行业常识,也要符合消费者的认知。「图像和美」团队希望能够将这套知识体系做到「通用」,做到可沟通可理解,因此与香港理工大学及其它专业院校进行了密切合作,力求在消费者和专业人士的沟通中寻求知识体系的统一和平衡。以「波西米亚风」为例,虽然行业的风格体系中存在这个类目,但由于消费者缺乏相应的概念和认知,团队最终并没有将这一风格纳入分类定义中。

  其次,知识要方便机器与人的沟通,尽量实现逻辑上的互斥和完备。机器是 0 和 1 的世界,因此要尽可能地消除中间的模糊地带,并且能涵盖所有可能的情况。比如,半身裙的定义是「下半身穿着服饰,最上不超过下胸线,裆部以下中线无收紧缝合」,而裤子的定义是「下半身穿着服饰,最上不超过下胸线,裆部以下中线有收紧缝合」,这就能满足逻辑完备和互斥的情况。

  第三点是理解「视觉可分」和「感官可分」的区别。一种体系如果没有足够多的合适样本进行学习,那么团队也需要做出取舍。以「西装领」为例,从专业人士的角度可划分为 9 种领子,但「图像和美」团队与香港理工大学团队考虑到,对于普通消费者而言,肉眼看不出这 9 款领子的区别,且无法找到这么多细粒度过高的数据,因此在分类上也做出了取舍。另外,女性服饰的视觉刺激点非常多,可以在西装领的分类上适当精简,但男士服饰视觉刺激点较少,领子的分类需要更加细化,这也是「图像和美」团队与专业人士进行反复协调和沟通所达成的共识。

  此外雷音也提及了非常重要的一点是,这个过程中要避免结构化噪声的情况。比如在夏天搜索「圆领」的衣服,结果可能会大量呈现「T 恤」,这便是结构化噪声的问题,为了将「圆领」与冬天的「毛衣」数据也能相关联,需要保证「圆领」在各种类别的服饰中均得到采样。在这个过程中,团队需要借助知识和模型校验检查是否引入不合理的相关性,并借助共性部分与标签相关性的强弱来判定是否为噪声。

  为了更好地理解时尚行业,原本只穿运动服的典型程序员雷音飞到上海定制了几万元的高定西装,第一次懂得了什么叫「适合自己的衣服」;跑遍了杭州银泰城的每一家服装店,和店员们聊穿衣搭配的经验体会……由于深入了解了时尚行业对于材质和面料的垄断「潜规则」,这几年来雷音再也没买过打折的衣服。对于时尚的理解一天天加深,雷音也感慨,「机器能学到的是规则,学不到的是创意,我们希望能在这个过程中让消费者能逐渐从熟悉规则到欣赏创意。如果机器能更好地用机器语言理解 Fashion,实际上也是帮助更多的消费者提升审美水平,增进对时尚行业的理解。」而 FashionAI 全球挑战赛的应运而生,也是希望能让更多的人关注到这个将改变行业的数据集,一同携手关注机器认知时尚的基础问题,共同推动AI 技术在时尚产业的落地。

图说天下

×
织梦二维码生成器