三分鐘看懂深度學習標籤平滑（Label Smoothing）技巧

深度學習盜夢空間人工智能電腦數據學習DataLearner 2019-06-28

交叉熵（Cross-Entropy）損失函數是分類模型中的一種非常重要的目標函數。在二分類問題中，交叉熵損失函數的形式如下：

−[ylogp+(1−y)log(1−p)]

如果分類準確，交叉熵損失函數的結果是0（即上式中p和y一致的情況），否則交叉熵為無窮大。也就是說交叉熵對分類正確給的是最大激勵。換句話說，對於標註數據來說，這個時候我們認為其標註結果是準確的（不然這個結果就沒意義了）。但實際上，有一些標註數據並不一定是準確的。那麼這時候，使用交叉熵損失函數作為目標函數並不一定是最優的。

在早期的神經網絡研究中，也有發現，一些非標準的交叉熵損失函數表現會更好一點。

對於這個問題，我們還可以這麼去理解。在分類任務中，我們通常對類別標籤的編碼使用[0,1,2,…]這種形式。在深度學習中，通常在全連接層的最後一層，加入一個softmax來計算輸入數據屬於每個類別的概率，並把概率最高的作為這個類別的輸入，然後使用交叉熵作為損失函數。這會導致模型對正確分類的情況獎勵最大，錯誤分類懲罰最大。如果訓練數據能覆蓋所有情況，或者是完全正確，那麼這種方式沒有問題。但事實上，這不可能。所以這種方式可能會帶來泛化能力差的問題，即過擬合。

在2016年，Szegedy等人提出了inception v2的模型（論文：Rethinking the inception architecture for computer vision.）。其中提到了Label Smoothing技術，用以減輕這個問題。

我們先來看一下原理。假設我們的分類只有兩個，一個是貓一個不是貓，分別用1和0表示。Label Smoothing的工作原理是對原來的[0 1]這種標註做一個改動，假設我們給定Label Smoothing的值為0.1：

[0,1]×(1−0.1)+0.1/2=[0.05,0.95]

可以看到，原來的[0,1]編碼變成了[0.05,0.95]了。這個label_smoothing的值假設為ϵ，那麼就是說，原來分類準確的時候，p=1，不準確為p=0，現在變成了p=1−ϵ和ϵ，也就是說對分類準確做了一點懲罰。

Label Smoothing在很多問題上對模型都有一定的提升。

在Tensorflow中使用方法時候只要在損失函數中加上label_smoothing的值即可，如下：

tf.losses.softmax_cross_entropy(
 onehot_labels,
 logits,
 weights=1.0,
 label_smoothing=0,
 scope=None,
 loss_collection=tf.GraphKeys.LOSSES,
 reduction=Reduction.SUM_BY_NONZERO_WEIGHTS
)

相關推薦

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'手機數據線怎麼選？三分鐘讓你掌握選購技巧'

"說起數據線，相必大家都不陌生。現在手機可以說人手一部，手機功能雖然越發強大，但是有些功能還是得通過用數據線連接電腦才能實現。另外，數據線也是我們為手機充電的必要裝置。下面小編就來講講數據線的選購指南吧~數據線的作用數據線是用來連接移動設備和電腦的，來達到數據傳遞或通信目的...

電腦原汁原味的德系SUV 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'又有一本深度學習方面的入門書要與您見面啦'

"小編告訴您一個好消息，有一本最新的深度學習入門書即將要與您見面。喜歡深度學習的朋友們可以關注一下。深度學習案例精粹（Deep Learning By Example）使用TensorFlow框架，輕鬆理解深度學習算法包含大量案例，快速動手實現深度學習任務可下載配套源碼+...

深度學習人工智能算法機器學習自然語言處理電腦人生第一份工作生物醫學 CNN 讀書 2019-09-13

'「專利解密」騰訊遊戲是如何利用深度學習技術的'

"集微網消息，2019世界人工智能大會在上海開幕。會上，騰訊董事會主席兼CEO馬化騰在開幕式演講上重點講了關於AI的內容。他表示，一年來，在上海地區，騰訊在人工智能、雲計算等領域都有大幅投入。去年此時，騰訊華東總部在上海成立，目前已擁有超5000人團隊。騰訊電競的6大職業賽...

深度學習騰訊遊戲騰訊 2019世界人工智能大會技術上海人工智能王者聯盟雲計算通信算法馬化騰機器人 2019-09-12

'深度學習的完整硬件指南'

"原標題 | A Full Hardware Guide to Deep Learning作者 | Tim Dettmers 譯者 | linlh、呀啦呼（Tufts University）、Ryan222（重慶郵電大學）深度學習是非常消耗計算資源的，毫無疑問這就需要多核高...

深度學習 GPU 中央處理器硬件技術跳槽那些事兒德州儀器 Linux 心理學 Kaggle 市場營銷重慶 2019-09-12

'「雜談」什麼是我心目中深度學習算法工程師的標準'

"有三AI平臺只專心做原創輸出很少扯淡也不蹭熱點，不過最近詢問的朋友多了，不得不統一寫篇文章來回答一下這個大家都很關心的問題，當然，這僅僅是個人觀點。作者&編輯 | 言有三目前利用深度學習這個工具可以做很多事情，各大領域(圖像，語音，NLP等)，各大行業(娛樂，金融...

人工智能算法工程師人生第一份工作 Python 招聘文章技術設計金融不完美媽媽 C語言 GitHub 數學麻將大眾汽車 Linux 2019-09-11

'基於深度學習的人臉檢測和識別方法介紹'

"關注微信公眾號：人工智能前沿講習，重磅乾貨，第一時間送達人臉識別分人臉驗證（face verification）和人臉確認（face identification）；前者是指兩個人是不是同一個人，即1-to-1 mapping，而後者是確定一個人是一群人中的某個，即1-t...

深度學習人臉識別算法設計歐幾里得人工智能照相機大和族 Branch CNN 2019-09-11

'孩子成績不好的原因終於找到了，原來是沒有養成深度學習的習慣'

"有一個科學研究表明，98%的孩子的智力相差並不大，但為什麼面對新知識的時候，有的孩子一點就透，有的孩子卻怎麼教都不會呢？很多家長認為這還是孩子笨的證明，數萌在線要告訴大家的是，這種情況，是因為孩子欠缺深度學習的習慣。每一個孩子都擁有自己的天賦，也都擁有無限的可能，教育最大...

不完美媽媽人工智能 2019-09-09

'原來學習遊戲原畫這麼簡單，就5個技巧，小白必看'

"1，要有繪畫功底現在遊戲原畫都是在電腦上製作的，自然要有很強的繪畫功底。比如美術裡面的寫生，素描，光暗對比，黑白過渡，人物和環境的契合等等。2、靜物色彩:人物的色彩處理是非常重要的，色彩處理包括，固有色，冷暖色，過渡色，環境色等等。三、線造型:大家做畫的時候都知道，這...

原畫素描寫生設計美術武器最in買手君電腦文章 2019-09-09

'5分鐘內看懂機器學習和深度學習的區別'

"在本文中，我們將研究深度學習和機器學習之間的差異。我們將逐一瞭解它們，然後討論他們在各個方面的不同之處。除了深度學習和機器學習的比較外，我們還將研究他們未來的趨勢和走向。深度學習 VS 機器學習深度學習與機器學習簡介一、什麼是機器學習？通常，為了實現人工智能，我們使用機器...

人工智能算法自然語言處理技術信息檢索 GPU 人生第一份工作市場營銷隨機森林 2019-09-09

'深度解讀服裝設計，想學習服裝設計的看過來吧'

" 注頭條號：培根服裝，私信回覆“服裝”，即可免費獲得零基礎服裝教程”服裝設計師(Apparel Designer)直接設計的是產品，間接設計的是人品和社會。隨著科學與文明的進步，人類的藝術設計手段也在不斷髮展。信息時代，人類的文化傳播方式與以前相比有了很大變化，嚴格的行業...

服裝服裝設計設計工業設計設計師最in買手君藝術水彩畫插畫素描時尚電腦男裝婚紗時裝自然科學經濟文化美術 2019-09-07

'深度學習框架Keras與Pytorch對比'

"對於許多科學家、工程師和開發人員來說，TensorFlow是他們的第一個深度學習框架。TensorFlow 1.0於2017年2月發佈，可以說，它對用戶不太友好。在過去的幾年裡，兩個主要的深度學習庫Keras和Pytorch獲得了大量關注，主要是因為它們的使用比較簡單。本...

人工智能程序員 Python Facebook 工程師 2019-09-05

'2019深度學習語音合成指南'

"雷鋒網AI科技評論編者按：人工合成人類語音被稱為語音合成。這種基於機器學習的技術適用於文本轉換語音（text-to-speech）、音樂生成、語音生成、語音支持設備、導航系統以及為視障人士提供無障礙服務。在這篇文章中，我們將研究基於深度學習而進行的研究或模型框架。在我們正...

語音合成深度學習人工智能跳槽那些事兒技術數據庫 Google 文章音樂機器學習算法 2019-09-05

'韓語學習：零基礎學習韓語的一些小技巧'

"首先，對於一個韓語小白來說，發音是最難的，也是最先開始的部分。韓語屬於表音文字，意思就是組成韓字的每個“偏旁部首”都有與之相對應的音，這就表明認識所有的偏旁部首就可以讀所有的韓語字了。韓語的偏旁部首就包括3部分，元音、輔音、和收音。元音和輔音一共40個，收音包括7種。元音...

英語人工智能韓國 2019-09-05

'阿里架構師深度解析java技術原理，小白如何學習java到架構師'

"一、Java 運行原理1、高級語言運行過程在程序真正運行在CPU上之前，必須要讓OS的kernel理解我們在編輯器或者IDE里根據每種語言的語法規則敲入的源代碼，kernel才能做出相關的調度，所以需要先將源代碼轉化成可執行的二進制文件，這個過程通常由編譯器完成。有些編譯...

Java Java虛擬機技術中央處理器電腦編譯器程序員 ARM 虛擬機集成開發環境操作系統英特爾硬件人生第一份工作 2019-09-04

'揭祕人工智能深度學習算法的奧祕'

"話說當前最熱門的技術是什麼？我想非人工智能莫屬。雖說大導演斯皮爾伯格在2001年就拍攝了好萊塢大片《人工智能》，但他怎麼又能想到十幾年後人類在人工智能領域紮紮實實得走出了一大步——以阿爾法機器人為代表的人工智能橫空出世，在圍棋上戰勝了人類最強棋手。具備學習思考能力的機器人...

人工智能深度學習算法電腦機器學習技術機器人九陽神功文章 2019-09-03

'深度學習：徹底解決你的知識焦慮（筆記）'

"過目不忘的祕密“記性好”所需要的能力是：將原本沒有任何含義的信息賦予一定的意義、仔細觀察並找出重要信息、將眼前的信息與頭腦中已有的信息庫相對照等能力。無法利用圖式的學習如果頭腦中沒有圖式，即使理解了字面意思，也無法理解其內在含義。已經掌握的舊知識，對於學習新知識有著重要的...

深度學習讀書啤酒 2019-09-02

推薦中...