如何找到明星同款衣服?
作为一个在时尚圈摸爬滚打多年的“老司机”,找明星同款对我来说简直是小菜一碟! 首先我们要明确一件事——并不是找明星穿过的同款衣服。因为在现实生活中,明星们往往不会再穿第二次的衣服。我们之所以能买到他们的同款,是因为有人专门为他们准备了一批同款的衣鞋包用品……
当然这些商品不会出现在普通的购物网站上面,要想买得到都必须得有内部人员引荐才行,我一般都是让助理先替我打听好,然后自己去专柜试穿或是直接网购(因为有些品牌会有网上商城)。
比如我想买王凯今年春天拍摄的某广告片中的白衬衫,就可以这样操作: 王凯今年的春季广告大片中穿了无数的白衬衣,想要买其中一款显然是不太可能的。但我们可以把条件缩小到与王凯身高相近、季节相似的男明星身上——比如李现 在《我是你的大明星》这部剧中,李现在片中也穿过好几件白色T恤,不过由于年代久远且没有品牌的线索,如果要购买的话还是有一定难度的。 但只要掌握方法,一切问题迎刃而解!例如可以搜索李现在该剧拍摄时所留的头发长度,再结合他的身高体重等数据,通过大数据算法就能精准地筛选出与之匹配的时尚单品(我们工作室就有一个专门负责算法的老师) 最后发现,李现在剧中的白T恤品牌是Billionaire,而且这个服装品牌也是专门为影视剧组打造贴身衣物,所以购买起来并不难。 除了去淘宝外,还可以关注各大明星私服博主,如扒衣狂魔、搭搭、VogueMe等,他们往往会第一时间分享各大明星的私服穿搭,堪称淘金宝典!
随着影视行业发展越来越好,无论是电视还是电影都不断的呈上升趋势,而且质量也是越来越好,这也让部分演员获得了更多的关注度,不少的粉丝在追剧的时候不仅关注剧情的发展同时也更关注演员的穿搭。虽然说很多明星的私服不能完全的同款复刻,但是剧中出现的服饰还是能买到的。那么如何去找到明星同款衣服呢?
随着互联网的发展,影视作品中的同款可以通过平台检索的方式快速找到,而且这些平台都比较大型,比如有专门售卖服饰的淘宝,有视频网站的优酷,当然更多的是垂直于影视剧同款的购物平台。不管什么样性质的平台,想要找到同款服饰都是可以的,那么这些同款是怎么找到并推荐给用户的呢?今天给大家讲讲技术角度该如何检索出影视剧中的同款服饰,并给用户提供相关的推荐。
问题可以拆解为两种类型:人穿衣和衣穿人。人穿衣:给定一张人带衣服的图片,检索出所有该衣服出现的场景图片。比如赵薇穿着这件大衣的各种场景图片检索出来。衣穿人:给定一张衣服的图片,检索出所有穿这件衣服的场景图片。比如一张衣服的图片检索出来赵薇和胡歌等都穿过这件衣服的画面。
解决方案有两种:
无监督对比学习方案:该模型仅用对比学习做训练,不使用标注数据,成本较低,模型迭代速度较快。有监督孪生网络方案:该模型在无监督训练的基础上,再加上标注数据用交叉熵损失做监督训练。模型成本较高,训练迭代速度较慢,但效果更好。在实际工程落地中,因为标注成本过高,我们最后主要采用了无监督对比学习的方案。下面对两种方案分别进行讲述。
对比学习模型结构:对比学习模型,就是让模型去识别两幅图是否是同类,损失为交叉熵,如果相似度高但不是同类,损失就很大;如果相似度低但同类,损失也很大,这样就可以不断地优化模型。通过这个模型结构,可以不断地让同类特征拉近,让不同类的特征分离开,最终达到比较好的聚类效果。
1)样本构建思路:人穿衣的样本构建,我们用人的身体区域和带人的图像做正样本,用该图像的其它图像做负样本。比如下图:第一行、第二行相同区域为同类,第三行与前两行不同类,所以第一、二行两两之间为正样本,第一行和第三行之间为负样本。
因为人穿衣的场景中,同一件衣服,人换了,但衣服是没变的,所以在人的区域做正样本,把人替换掉,衣服的区域不变也做正样本。因为人的区域特征一般较为接近,为了增大样本区分度,将人的区域的上下左右扩了个边框。如下图所示绿色区域为人区域,将人区域做一个border 扩展,红色区域为该样本的区域。
2)模型训练推断过程:模型训练时,对于一个人穿衣服的场景,从该画面和所有其它画面构建了一个mini batch,然后把这个mini batch输入到模型去识别是否是同类关系,模型会不断地迭代优化。模型推断时,需要进行两次推理。第一次推理出人体的区域,然后以此区域为基础,推理出同一件衣服在不同人的身上出现的场合。
1)样本构建思路:衣穿人的样本构建,我们用衣服区域和带衣服的图像做正样本,其它图像做负样本。因为衣穿人的场景中,同一个人,不同的时候穿了同一套衣服,人的身体区域是没变的,而在衣服区域做了正样本,把衣服的区域替换掉,人身区域不变也做正样本。如下图所示,第一、二行的场景中人体的区域相似,与不同衣服的区域为正样本。第三行与第一、二行不同类,与该行任意区域都为负样本。2)模型训练推断过程:衣穿人的模型训练过程和人穿衣一样,但采样的方式不同。人穿衣的样本采集是把人区域替换成其它人的区域;而衣穿人的样本采集是把衣服区域替换成其它衣服的区域。模型推理过程与人穿衣一样,需要推理两次,第一次推理出衣服区域,然后以此区域为基础,推理出同一套衣服在不同场合出现的场合。
相比无监督的模型,有监督模型准确率会好一些,但是迭代速度和成本较高。有监督模型,我们在无监督模型的基础上,增加一些标注,然后再去优化模型,通过这种方式,可以平衡成本和精度。模型结构上使用了孪生网络的结构,孪生网络可以看作对比学习中双塔模型的有监督版本。孪生网络主要用