新聞中心
大數(shù)據(jù)中怎么解決長(zhǎng)尾分布問題以及解耦類別特征并實(shí)現(xiàn)空間增廣,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
成都創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站制作、洪澤網(wǎng)絡(luò)推廣、微信小程序、洪澤網(wǎng)絡(luò)營銷、洪澤企業(yè)策劃、洪澤品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);成都創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供洪澤建站搭建服務(wù),24小時(shí)服務(wù)熱線:18982081108,官方網(wǎng)址:www.cdcxhl.com
現(xiàn)實(shí)世界的數(shù)據(jù)通常遵循長(zhǎng)尾分布,也就是說每個(gè)類的數(shù)量通常是不同的。例如,數(shù)據(jù)集頭部類中樣本數(shù)很多,而尾部類中樣本數(shù)很少。然而我們希望模型是能夠公平的表示整個(gè)數(shù)據(jù)集,而不是偏向某些樣本多的類。解決長(zhǎng)尾問題的各種方法中,類平衡損失、重采樣和數(shù)據(jù)增廣是比較常見的方法。但是對(duì)于尾部類來說,我們不得不考慮一些其他知識(shí)來彌補(bǔ)丟失的信息。在本文中,作者提出了一種新的方法來解決長(zhǎng)尾問題——在特征空間中將頭部類的特征增廣到尾部類特征上。具體來說是將每個(gè)類的特征解耦成類特有和類共有特征,將尾部類的類特有特征和頭部類的類共有特征進(jìn)行融合,從而實(shí)現(xiàn)特征空間的增廣。該方法在iNaturalist, ImageNet-LT, Places-LT 和長(zhǎng)尾的CIFAR集四個(gè)數(shù)據(jù)集上都取得了不錯(cuò)的效果。
簡(jiǎn)介
長(zhǎng)尾分布廣泛存在于視覺任務(wù)中。如圖所示在分類和檢測(cè)任務(wù)中存在長(zhǎng)尾分布問題。
長(zhǎng)尾分布帶來的主要問題是在訓(xùn)練時(shí),因?yàn)?strong>尾部類數(shù)據(jù)量少,統(tǒng)計(jì)信息不夠豐富,因而模型并不能很好的表達(dá)尾部類。現(xiàn)有的方法主要有數(shù)據(jù)增廣,下采樣,過采樣,和平衡損失函數(shù)的構(gòu)建等。但是這些方法當(dāng)尾部類數(shù)量極少時(shí),性能并不理想。如下圖所示。
本文提出了在特征空間中,將頭部類的信息遷移到尾部類上,具體方法如下。
本文方法
本文首先用CAM方法提取注意力區(qū)域,得到每個(gè)類的類特有特征和類共有特征。之后將尾部類的類特有特征和頭部類的類共有特征進(jìn)行融合。
首先來介紹一下CAM(Class Activation Map)。
M是我們得到的高亮圖。c是類別,x,y是像素位置,k是通道,w是權(quán)重,f是特征向量。當(dāng)M越大,意味著x,y處的特征對(duì)于c這一類別來說越發(fā)重要。之后我們將M歸一化到0-1,給一個(gè)閾值,通過下面的公式,我們就能得到類特有特征(s代表specific)和類共有特征(g代表generic)。
其中,代表Hadamard乘積,而當(dāng)x大于等于0時(shí),sgn(x)=1,小于0時(shí),sgn(x)=0。
之后我們來看整體的訓(xùn)練流程。第一步是進(jìn)行全部數(shù)據(jù)的訓(xùn)練,得到提取特征的子網(wǎng)絡(luò)和基礎(chǔ)分類器,用于之后的步驟中。第二步是根據(jù)剛剛得到的提取特征網(wǎng)絡(luò)和分類器,以及之前的CAM,進(jìn)行尾部類的增廣??梢钥吹?,第二步進(jìn)去一張尾部類圖片和一張頭部類圖片,選取頭部類圖片時(shí)是選取的與尾部類距離較近,容易混淆的頭部類(根據(jù)置信度排序得到)。
第三步則是微調(diào)。注意第三步和第二步是同步進(jìn)行的,統(tǒng)稱為第二階段。第二階段整體算法流程如下。
數(shù)據(jù)集: Long-tailed CIFAR-10 and CIFAR-100, ImageNet-LT and Places-LT Dataset,iNaturalist 2017 and 2018.
對(duì)比實(shí)驗(yàn):
消融實(shí)驗(yàn)
結(jié)果分析
看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。
分享文章:大數(shù)據(jù)中怎么解決長(zhǎng)尾分布問題以及解耦類別特征并實(shí)現(xiàn)空間增廣
分享鏈接:http://ef60e0e.cn/article/pjeosc.html