首页
/
每日頭條
/
生活
/
如易視覺識别算法
如易視覺識别算法
更新时间:2024-07-23 10:25:13

日前,全球最負盛名的 AI 學術會議之一NeurIPS(Neural Information Processing Systems)公布了2022年論文接收結果。創新奇智投稿論文 《An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning》成功被NeurIPS 2022接收。

作為當前全球最負盛名的 AI 學術會議之一,NeurIPS 是每年學界的重要事件。NeurIPS全稱是 Neural Information Processing Systems,神經信息處理系統大會,通常在每年 12 月由 NeurIPS 基金會主辦。大會讨論的内容包含深度學習、計算機視覺、大規模機器學習、學習理論、優化、稀疏理論等衆多細分領域。 今年 NeurIPS 已是第 36 屆,将于 11 月 28 日至 12 月 9 日舉行,為期兩周。第一周将在美國新奧爾良 Ernest N.Morial 會議中心舉行現場會議,第二周改為線上會議。NeurIPS 2022 論文投稿早已在 5 月 19 日截止,今日官方終于公布了錄用結果。根據官網郵件中給出的數據,本屆會議共有 10411 篇論文投稿,接收率為 25.6%,略低于去年的 26%。

如易視覺識别算法(NeurIPS2022)1

論文解讀:

如易視覺識别算法(NeurIPS2022)2

圖1:論文概要

論文概述:

本文提出了一種基于反标簽學習的半監督少樣本圖像分類學習方法,包括以下步驟:構造元任務,使用預訓練的神經網絡作為特征提取器,提取元任務中支持集、查詢集以及無标簽圖像數據集對應的特征,并在支持集上訓練一個分類器用于後續分類任務;反标簽學習模塊以較高正确率給無标簽數據打上反标簽,分類器在反标簽上進行學習更新,不斷疊代直到無法選出反标簽。正标簽學習模塊,在反标簽模塊疊代結束之後,得到類别均衡且正确率較高正标簽,并用分類器進行學習更新。

本文通過卷積神經網絡提取元任務中對應數據的特征,通過反标簽構造模塊以較高正确率利用無标簽數據,并用分類器在反标簽數據上進行學習更新,進行疊代之後設計正标簽學習模塊獲得類别均衡且正确率較高的正标簽,用分類器在正标簽數據上進行學習更新,以更加充分且高質量的利用無标簽數據,可以獲得更高的少樣本學習圖像分類準确率。

創新背景:

随着深度學習的發展,卷積神經網絡在多個圖像任務上已經超過了人類的水平,但是這些模型的訓練依賴大量的數據,在現實生活中有些數據的采集難度較大,例如對液晶顯示屏幕所有種類缺陷數據的采集,另外這些數據的标注也需要耗費大量的人力和财力。 相比之下,人類視覺系統可以從少量的例子中快速學習到新的概念和特征,然後在新的數據中識别相似的對象。為了模仿人類的這種快速學習的能力,減少方法對于數據的依賴,少樣本學習近年來受到了越來越多的關注。少樣本學習旨在結合先驗知識快速地泛化到隻包含少量有監督信息的樣本的新任務中,在此設定下識别每個類别僅需要極少甚至一張帶标簽的樣本,所以可以極大地減少人工标注成本。

基于少樣本學習這樣數據量較少的設定,一個需要面臨的問題就是,在極少的帶标注數據上,很難讓模型較好的拟合到數據的分布。因此為了解決這樣的問題,少樣本學習中出現了結合半監督的研究方向。另外為了解決數據标注困難的問題,反标簽學習的方法也應運而生。反标簽顧名思義就是給數據打上相反的标簽,是一種間接的方式代表該數據不屬于某個類别。這樣的做法可以大大降低數據标注的錯誤,例如對于一個5分類問題來說,給數據打真實标簽即正标簽錯誤的概率為給數據打反标簽錯誤概率的4倍。另外在半監督少樣本學習當中,由于帶标簽數據很少,因此模型在初始階段很難有好的效果。用這樣的模型給無标簽數據标記僞标簽将會出現大量的錯誤以及類别不平衡的現象。在這樣的情況結合反标簽學習的方法就可以解決這樣的問題。本發明研究的基于反标簽學習的半監督少樣本學習方法,針對半監督少樣本學習,設計适合的反标簽标注方法,并結合反标簽學習解決半監督少樣本學習中出現的無标簽數據利用不充分等問題。

目前,出現了許多研究半監督少樣本學習的方法,但依然存在一些問題: 1)給無标簽數據标注僞标簽的正确率較低,錯誤标記的樣本會影響最後的結果;2)無标簽數據上标注的僞标簽存在類别不平衡現象;3)方法較為複雜。

本論文主要貢獻:

本論文提出了一種基于反标簽學習的半監督少樣本圖像分類學習方法。 方法具體如下:

步驟1,構造元任務,使用預訓練的神經網絡作為特征提取器用來提取圖像數據,提取元任務中支持集、查詢集以及無标簽數據集對應的特征,并在支持集上訓練一個分類器,用于後續圖像分類任務;

如易視覺識别算法(NeurIPS2022)3

步驟2,反标簽學習模塊以較高的95%正确率給無标簽圖像數據打上反标簽,用分類器在反标簽上進行學習更新,通過不斷疊代直到無法選出反标簽;

步驟3,正标簽學習模塊得到類别均衡且正确率高達85%的正标簽,并用分類器進行學習更新;

步驟4,用訓練好的分類器在查詢集上預測得到最後圖像分類的類别結果。

本文提出的方法與已有技術相比,其顯著優點為:

(1)本發明設計的反标簽學習模塊,通過給無标簽圖像數據标注反标簽并進行學習的方式,在模型效果還不好的初始階段,大大降低給無标簽圖像數據标注标簽的錯誤率;

(2)經過反标簽學習模塊之後,本發明設計的正标簽學習模塊可以得到正确率高且類别均衡的正标簽,繼續對模型進行訓練;

(3)本發明提出的方法相較于之前的方法流程簡單,可以更充分且高質量利用無标簽圖像數據進行學習,最後在圖像分類任務上得到了更好的效果。

如易視覺識别算法(NeurIPS2022)4

創新奇智CTO張發恩(論文作者之一)表示:“當前的深度學習技術對人工标注的數據樣本(也即帶标簽數據樣本)數量具有很大依賴性,如何減少對帶标簽數據樣本的依賴,利用較少的帶标簽數據樣本訓練出理想的視覺算法模型成為當下亟待突破的技術難點。 少樣本學習旨在從已有類别的數據中學習先驗知識,然後利用極少的标注數據完成對新類别的識别,打破了樣本數據量的制約,在傳統制造業等樣本普遍缺失的領域具有實用價值,有助于推動AI落地。”

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
可再生能源發電比例排名
可再生能源發電比例排名
圖為水力發電樞紐21世紀以來,随着全球工業化進程的進一步加快,各國對于煤炭,石油等資源的需求也逐步加大,但人類在開發和利用這些資源的過程中,不僅對生态環境造成了嚴重的破壞,而且使得地球的非可再生資源也面臨日益短缺的現狀,因此,近年來,世界上...
2024-07-23
黑魚兩吃這道菜的具體做法
黑魚兩吃這道菜的具體做法
黑魚兩吃這道菜的具體做法?用料:黑魚一條、鹽适量、姜片适量、胡椒粉适量、香菜末适量、雪菜适量豆腐适量、芡粉适量、蛋清1隻,我來為大家科普一下關于黑魚兩吃這道菜的具體做法?以下内容希望對你有幫助!黑魚兩吃這道菜的具體做法用料:黑魚一條、鹽适量...
2024-07-23
韋魯斯黑科技手遊
韋魯斯黑科技手遊
網易3D動作MOBA《無盡戰區》今日更新了全新遊戲版本,新英雄斯芬克斯啟動測試周期,玩家可以通過自定義遊戲和練習場體驗該英雄。另外吉格控的福利來了,《無盡戰區》還更新了一套全新的吉格時裝-勝利女神,西部牛仔風吉格變身希臘戰神。《無盡戰區》新...
2024-07-23
三個人的友誼總有一個會被排擠
三個人的友誼總有一個會被排擠
01圖片來源于網絡,侵删我們三個是小學同學,初高中校友。但真正交好是在高中,和其中一位,因為我們成為了同班同學且還是室友。我心思比較敏感,性格也很内向,不過在高中室友多次示好後我們走到了一起,成為了好朋友。之後因着是同村的,加上有小學同班,...
2024-07-23
蔡徐坤一首歌漲粉
蔡徐坤一首歌漲粉
[海峽網]在2018年國内興起了很多選秀綜藝節目,很多節目大獲成功,打造出了衆多流量明星,因此這一現象也一直持續到了2019年。其中在2018年的《偶像練習生》裡以C位出道的蔡徐坤更是被太多人關注,可謂“出道即巅峰”,還拿下了NBA新春賀歲...
2024-07-23
Copyright 2023-2024 - www.tftnews.com All Rights Reserved