發(fā)布時間:2022-11-07
欄目:電商資訊
阿里用AI打假,又有新研究成果問世共同學習。
這次順滑地配合,他們把目光集中在了服裝盜版上,而且把難度值拉到很大:盜版者抄襲過程中效高,修改了領(lǐng)子前沿技術、袖子等細(xì)節(jié),比如淘寶上的各類“明星同款”性能,一樣能夠快速鎖定多種方式。
背后的思路是:基于服裝區(qū)域性表達(dá)的檢索模型,對圖像中的服裝進(jìn)行區(qū)域化的相似性學(xué)習(xí)和度量技術創新。
該研究成果已被CVPR2020收錄深入交流研討,并被選為Oral論文。
阿里安全圖靈實驗室表示廣泛應用,該工作將用到阿里原創(chuàng)保護(hù)平臺關註度,在淘寶、天貓等阿里系電商平臺上線哪些領域,提供侵權(quán)檢測能力敢於挑戰。
就服裝領(lǐng)域而言,雖然打假一直不斷積極,但盜版抄襲問題依舊普遍存在探索。而且從線上到線下,抄襲手段越來越刁鉆結構,打假難度逐年提高。目前來看優化上下,服裝領(lǐng)域的抄襲只有有三類能力建設。
第一類集中在圖片盜用上。盜版者通常未經(jīng)授權(quán)生產體系,拿正版品牌的商品圖使用或修改使用服務,比如在圖上添加自己店鋪的水印,或進(jìn)行一些圖像處理(反轉(zhuǎn)能力和水平、縮放覆蓋、拼接等)。
這一類侵權(quán)抄襲成本很低研究,但很簡單被平臺的圖片檢索系統(tǒng)鎖定高效,然后快速“治理”應用創新。
第二類是創(chuàng)意盜用,不良商家直接抄襲原創(chuàng)商家的整體商品設(shè)計和創(chuàng)意機構,制作同款或者仿款的特性。
這類侵權(quán)的成本稍高一些,但基于商品整體相似度度量的同款檢索算法基礎,可以對它們進(jìn)行召回和治理提供堅實支撐。
第三類是盜用是對服裝的某些局部區(qū)域進(jìn)行修改,像是洗稿高產,比如改變領(lǐng)口的設(shè)計款式信息化技術、或者胸前印花的布局,甚至改變服裝的款型等良好。
但如下圖所示逐步顯現,仍然是抄襲正版品牌服裝的風(fēng)格和設(shè)計元素(左側(cè)為正版,右側(cè)為盜版)單產提升,甚至還當(dāng)做“明星同款”來賣傳遞。
這類盜版的成本很高,并不易被傳統(tǒng)的基于商品同款檢索的算法鎖定勞動精神。通常情況下開展攻關合作,電商平臺只能通過人工審核來發(fā)現(xiàn),打假成本很高預下達。
那有沒有一種方法的有效手段,能夠讓系統(tǒng)自動鎖定此類抄襲現(xiàn)象?這就是阿里安全圖靈實驗室很新研究的方向提升。
此前大大提高,他們基于屬性感知細(xì)粒度相似度學(xué)習(xí)方法,提出服飾版權(quán)算法來鎖定局部抄襲研究成果,被AAAI2020收錄取得了一定進展。
現(xiàn)在他們又提出了一個新思路,基于服裝區(qū)域性表達(dá)的檢索模型大面積,對圖像中的服裝進(jìn)行區(qū)域化的相似性學(xué)習(xí)和度量積極參與,從而實現(xiàn)更有效打假。
“盜版服裝”的定義培養,是整體上抄襲原版服裝設(shè)計和風(fēng)格交流研討,并在一兩個區(qū)域進(jìn)行修改,以逃避現(xiàn)有同款服裝檢索模型篩查的服裝樣本形式。
阿里的研究人員將圖像中的服裝分為五個區(qū)域建設應用,包括領(lǐng)子、胸部、腰部和兩個袖子區(qū)域動力,并在四類服裝(短袖T恤同時、長袖上衣、外套生產效率、連衣裙)上實驗產能提升,各服裝區(qū)域劃分如下圖所示:
在算法設(shè)計上,他們提出了一種服裝 關(guān)鍵點引導(dǎo)的區(qū)域注重力機(jī)制節點。

首先利用服裝 關(guān)鍵點估計分支來猜測服裝的 關(guān)鍵點通過活化,即分布在服裝圖像各個 關(guān)鍵位置的點位,如領(lǐng)口的特點、袖口健康發展、肩部、腋下等大數據。
每類服裝的 關(guān)鍵點數(shù)量和分布有一定差異長效機製,點數(shù)在每件25-40個左右。根據(jù)這些 關(guān)鍵點數字技術,算法可對服裝圖片進(jìn)行多個區(qū)域的劃分奮戰不懈,如領(lǐng)子、袖子措施、胸部取得顯著成效、腰部區(qū)域等。
區(qū)域劃分信息通過基于ROIPooling思想的方式引入實現,一體化的服裝圖像特征被解耦為多個區(qū)域化的特征表達(dá)不容忽視,以獨立地進(jìn)行特征相似度的學(xué)習(xí)和度量。
同時服務體系,服裝 關(guān)鍵點結(jié)合區(qū)域化的表達(dá)可作為一種注重力機(jī)制說服力,引入到圖像檢索網(wǎng)絡(luò)上, 關(guān)鍵部位的特征權(quán)重被提升分析,非 關(guān)鍵部位的權(quán)重被削減表示,以提升模型對 關(guān)鍵部位的判別力。
服裝 關(guān)鍵點估計分支和圖像檢索分支使用相同的HR-Net主干網(wǎng)絡(luò)非常激烈,其多級并聯(lián)結(jié)構(gòu)在獲取多尺度特征的同時保持了高分辨率拓展基地。
在損失函數(shù)的選擇上, 關(guān)鍵點估計分支采用了均方差損失函數(shù)實力增強,檢索分支采用了區(qū)域化設(shè)計的Triplet損失函數(shù)。而損失函數(shù)的數(shù)值不再是整個圖片范圍的特征triplet差值探索創新,而是各個區(qū)域特征差值的累加結(jié)果帶來全新智能。
文中方法的框架如下圖所示,網(wǎng)絡(luò)可分為服裝 關(guān)鍵點估計分支和服裝檢索分支新產品,其中檢索網(wǎng)絡(luò)包含同款服裝檢索和盜版服裝檢索兩種輸出形式:
通過對平臺侵權(quán)服裝樣本的分析去完善,阿里研究人員發(fā)現(xiàn)橋梁作用,不同類別服裝易被盜版的區(qū)域是不一樣的,因此只將服裝圖像特征的相似度度量過程解耦是不夠的求索,還需要為每類服裝的多個區(qū)域設(shè)定差異化的權(quán)值讓人糾結,進(jìn)行加權(quán)的區(qū)域相似性計算,以召回更多的盜版服裝樣本穩定發展。
為此基石之一,他們基于平臺盜版服裝數(shù)據(jù),建立了一個名為“FashionPlagiarismDataset”的數(shù)據(jù)集增持能力,該數(shù)據(jù)集中共同努力,每組“原版服裝”的query圖像對應(yīng)gallery中多個“盜版服裝”圖像,數(shù)據(jù)覆蓋短袖T恤追求卓越、長袖上衣逐漸完善、外套、連衣裙四類樣本發展契機。
他們在該數(shù)據(jù)集上廣泛關註,對在Deepfashion2數(shù)據(jù)集上預(yù)練習(xí)過的檢索網(wǎng)絡(luò)進(jìn)行FineTune練習(xí),用CoordinateAscent算法對不同服裝類別的各區(qū)域權(quán)值進(jìn)行迭代優(yōu)化發力,以降低損失函數(shù)數(shù)值優勢領先。
“盜版服裝”檢索練習(xí)過程的損失函數(shù),同樣基于Triplet損失函數(shù)設(shè)計持續創新。很終改善,練習(xí)后的盜版檢索網(wǎng)絡(luò)可以基于上圖中的Input服裝圖像召回Output中綠框內(nèi)的盜版服裝樣本。
在論文的實驗部分協調機製,阿里研究人員首先在“FashionPlagiarismDataset”上對算法的“盜版服裝圖像”檢索能力進(jìn)行了評估信息化。
除了論文所提出的方法外,他們還設(shè)定了兩種方法進(jìn)行對比:一種是傳統(tǒng)檢索方法實踐者,使用相同的backbone網(wǎng)絡(luò)和Triplet的損失函數(shù)取得明顯成效,但是不包含區(qū)域化特征學(xué)習(xí)和表達(dá)機(jī)制;另一種是包含區(qū)域化特征表達(dá)機(jī)制數據,但是使用非FineTune練習(xí)得到的區(qū)域權(quán)重創新的技術,評價指標(biāo)為mAP。
從表中結(jié)果可以看出顯著,論文所用方法在各個服裝類別都取得了很佳效果快速增長。
除上述“盜版服裝檢索”的評價實驗外,他們還在Deepfashion系列數(shù)據(jù)集上進(jìn)行了服裝 關(guān)鍵點估計占,和同款服裝圖像檢索任務(wù)的實驗高質量。
在服裝 關(guān)鍵點估計部分,阿里研究人員在目前復(fù)雜度很高的Deepfashion2數(shù)據(jù)集上進(jìn)行了評測,與現(xiàn)有Match-RCNN,CPN,Simple-Baseline等方法相比前景,服裝 關(guān)鍵點估計模型在各個子集上都取得了很高的mAP結(jié)果:
在同款服裝檢索實驗中進一步意見,他們選用了FashionNet,Match-RCNN,PCB等方法作為對比,在Deepfashion和Deepfashion2上分別進(jìn)行了實驗共享應用。
其中生產能力,Deepfashion主要針對In-shop檢索場景,Deepfashion2則針對于Consumer-to-shop場景示範推廣。評價指標(biāo)分別為Top-Nrecall和Top-Naccuracy堅持好。
結(jié)果如下圖所示,阿里的方法在Deepfashion數(shù)據(jù)集上取得了與SOTA方法相近的效果積極參與,在Deepfashion2數(shù)據(jù)集上的結(jié)果要明顯優(yōu)于現(xiàn)有baseline方法問題分析。
一共有5名研究人員參與了這項研究,分別來自阿里巴巴進一步推進、浙江工商大學(xué)和阿里巴巴-浙江大學(xué)前沿技術(shù)聯(lián)合研究中心導向作用。
文章第一作者YiningLang、第二作者YuanHe應用的選擇、第三作者FanYang來自阿里安全圖靈實驗室十大行動。阿里安全圖靈實驗室負(fù)責(zé)人薛暉,是文章的通訊作者背景下。浙江工商大學(xué)JianfengDong也是論文作者之一綜合措施。
阿里安全圖靈實驗室正式成立于2021年,前身是阿里安全基礎(chǔ)算法團(tuán)隊自然條件,主要從事安全與風(fēng)險方面的AI系統(tǒng)研發(fā)設計標準,核心技術(shù)包括計算機(jī)視覺、自然語言處理互動互補、生物特征識別發揮重要帶動作用、圖計算以及異常檢測和分析等,截止到2021年意料之外,已申請50多項專利文化價值。
文章地址:http://61py.com/article/online/13108.html

- 1互聯(lián)網(wǎng)對傳統(tǒng)企業(yè)的沖擊有多大
- 2美團(tuán)再因不正當(dāng)競爭敗訴新反法互聯(lián)網(wǎng)專條首次適用外賣領(lǐng)域!
- 32021互聯(lián)網(wǎng)十件大事對不起賈躍亭你只能排第四
- 4互聯(lián)網(wǎng)宣傳做的就是用戶體驗
- 5互聯(lián)網(wǎng)創(chuàng)業(yè)到底需要怎樣的能力
- 6適合上班族的25個副業(yè)(適合上班族的互聯(lián)網(wǎng)副業(yè))
- 7互聯(lián)網(wǎng)的世界沒有永遠(yuǎn)的敵人只有永遠(yuǎn)的利益
- 8押唄進(jìn)駐天線貓助力互聯(lián)網(wǎng)數(shù)碼產(chǎn)品寄存行業(yè)經(jīng)濟(jì)持續(xù)發(fā)展
- 9互聯(lián)網(wǎng)公司如何做好品牌定位
- 102021年互聯(lián)網(wǎng)金融發(fā)展回顧冬去春欲來改弦當(dāng)更張