機器學習-邏輯迴歸

機器學習算法數學腫瘤人工智能早報 2019-04-28

1. 邏輯迴歸的應用背景

主要解決問題：分類問題---二分類問題

如果需要解決多分類問題--- softmax 迴歸

什麼是分類？

分類是監督學習的一個核心問題，在監督學習中，當輸出變量Y取有限個離散值時，預測問題便成為分類問題。這時，輸入變量X可以是離散的，也可以是連續的。監督學習從數據中學習一個分類模型或分類決策函數，稱為分類器。分類器對新的輸入進行輸出的預測，稱為分類。

與線性迴歸的區別：線性迴歸預測輸出的是（-∞,+∞）

而邏輯迴歸輸出的是{0,1}，這裡面0我們稱之為負例，1稱之為正例。

如果分類器用的是迴歸模型，並且已經訓練好了一個模型，可以設置一個閾值：

如果

，則預測

，既y屬於正例

如果

，則預測

，既y屬於負例

但是對於二分類問題來說，線性迴歸模型的輸出值

可以大於1也可以小於0，所以我們需要一個函數，將輸出轉換到0和1之間。這裡我們引入一個函數，sigmoid函數

這裡g代表的就是這個函數：

圖像如下：

這個函數的導數：

1.1 為什麼要用 sigmoid 函數

我們可以從熵的角度，來理解一下這個問題。熵原本是信息熵中的概念，用在概率分佈上可以表示這個分佈中所包含的不確定度，熵越大不確定度越大。所以大家可以想象到，均勻分佈熵最大，因為基本新數據是任何值的概率都均等。

而我們現在關心的是，給定某些假設之後，熵最大的分佈。也就是說這個分佈應該在滿足我假設的前提下越均勻越好。比如大家熟知的正態分佈，正是假設已知均值和方差後熵最大的分佈。

回過來看邏輯迴歸，這裡假設了什麼呢？首先，我們在建模預測

，並認為

服從伯努利二項分佈，所以我們只需要知道

；其次我們需要一個線性模型，所以

。接下來我們就只需要知道

是什麼就行了。而我們可以通過最大熵原則推出的這個

，就是

函數。其實還有一種解釋可以看成伯努利二項分佈的指數族形式，也就是

函數。

2. 邏輯迴歸

邏輯迴歸的數學表達模型：

其中

是參數，輸出的直觀解釋：

對於給定的輸入

，

時估計的概率

例如：對於腫瘤問題（惡性/良性），輸入變量為腫瘤的大小

，表示的是病人的腫瘤有70%的可能是惡性的。

較正式的說法可以如下表示：

給定輸入

，參數化的

(參數空間)，

時的概率。數學上可以如下表示：

2.1 損失函數

這裡我們選擇對數似然損失函數作為邏輯迴歸的損失函數

損失函數為：

前面的

可以去掉，化簡為：

注意中括號中的公式正是對邏輯迴歸進行最大似然估計中的最大似然函數

將兩個合在一起

有了這個我們可以求出邏輯迴歸的最大似然函數

對數似然函數為：

對數似然取最大值等價於損失函數取最小值

2.2 梯度下降法

算法流程：

(1)初始化

(隨機初始化)

(2)進行迭代，新的

能夠使得

更小

(3)如果

能夠繼續減小，返回(2)

其中，

稱為學習率或步長

這其中最主要的就是求解

的梯度，即梯度方向

注意，這個算法和線性迴歸裡的梯度下降算法幾乎是一致的，除了

的表示不同。

2.3 為什麼損失函數不用最小二乘

也就是損失函數為什麼不應平方損失而是選擇用交叉熵。原因是平方損失在訓練的時候會出現一定的問題。當預測值與真實值之間的差距過大時，這時候參數的調整就需要變大，但是如果使用平方損失，訓練的時候可能看到的情況是預測值和真實值之間的差距越大，參數調整的越小，訓練的越慢。

如果使用平方損失作為損失函數，損失函數如下

其中

表示真實值，

表示預測值。

對參數求梯度

由此可以看出，參數

除了跟真實值與預測值之間的差距有關外，還和激活函數的該點的導數有關，跟激活函數的梯度成正比，常見的激活函數是

函數，當這個點越靠近上邊或者下邊的時候梯度會變得非常小，這樣會導致當真實值與預測值差距很大時，參數變化的非常緩慢，與我們的期望不符合。

而使用交叉熵損失在更新參數的時候，當誤差越大時，梯度也就越大，參數調整也能更大更快。

相關推薦

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'一位好父親教育孩子的十八招！本文非常值得學習，可傳導子孫'

"Hello大家好，歡迎關注笑看世界育兒說，我們專注兒童心理與營養健康領域。如果你在育兒的過程中有疑問的話，可以隨時來探討。第一招：孩子兩歲了，有一天，不小心頭撞在桌角上，並長出了一個大包，非常難過，哭得很傷心。我向桌子走過去，大聲問”桌子呀，是誰把你撞疼了？哭得這麼傷心...

不完美媽媽服裝數學發現佩奇麥當勞游泳 2019-09-19

'機器速記上馬服務奧運會：訊飛成北京冬奧會自動語音轉換供應商'

"2019年9月16日，北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商發佈會在北京冬奧組委園區舉行。科大訊飛股份有限公司正式成為北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商。北京冬奧組委專職副主席、祕書長韓子榮，科大訊飛董事長劉慶峰，中國奧...

冬季奧林匹克運動會奧林匹克運動會科大訊飛技術語音合成機器學習劉慶峰語音識別技術國家電網中國石油化工集團自然語言處理體育喻紅招聘青島中國石油 2019-09-19

'高一到高三10點注意事項，附高中生必須糾正的12大學習問題'

"高中三年，學生生涯中至關重要的三年時光。每個人都希望用自己的努力和汗水換來一個美好的結果，進入一個理想的大學。但是，一些同學會在學習方法、學習目標以及同學關係、師生關係等方面會出現不同程度的問題。本篇為所有高一新生總結了以下十點，相信你看完一定會有所收穫的～高中課業學習...

大學英語語文數學高考音樂讓夢發生中考體育文學藝術 2019-09-19

'一旦邏輯奇點下移，原有系統就被打破'

"關注並標星↑↑[混沌大學]每晚8點，捕獲前沿商業洞察基於第一性原理，你可以找到一個系統的邊界，然後把這個系統全部定義出來。——李善友1 如何建立一個系統？最好的方法是建立這個系統的第一性原理。一旦建立這個系統的第一性原理，所有的內容都會生髮出來。如何建立一個系統的第一性原...

歐幾里得亞當·斯密大學創業經濟阿爾伯特·愛因斯坦亞里士多德數學亞當歷史倫理 2019-09-18

'“網紅”名師張雪峰衡中演講，關於早戀、分數、大學、學習'

"之前，考研名師、“網紅”張雪峰在衡水中學舉行了至少三場演講。張雪峰對將來同學們高考志願填報，說出了自己的看法。張雪峰說，年輕的時候聽不進大人的勸告，等真的過了那一階段，才知道，大人們說的話，全是對的。讓我們都來聽聽張雪峰的演講，就會感到，他講的都是親身經驗，沒有一點唬人的...

大學高考演講不完美媽媽西南大學中國研究生入學考試服裝蘭州大學經濟數學讓夢發生齊齊哈爾黑龍江省蘇州鄭州大學戀愛蘭州大連青島 2019-09-18

'二年級孩子數學學習方法（最後兩點建議非常重要）'

"更多資料請關注微信公眾號：小學資源園地對於小學低年級孩子來說，如何學好數學對今後的能力養成十分重要，尤其是在思維水平和分析能力上。那麼小學低年級數學的學習方法是什麼呢？又需要孩子養成什麼樣的能力呢？1、養成良好的作業習慣貪玩是孩子的天性，大多數孩子缺少自我控制能力，所以需...

數學不完美媽媽赫爾曼·艾賓浩斯 2019-09-18

'投資10億，機器人造機器人！全球最大機器人工廠落戶上海'

"近日，由上海建工五建集團承建的ABB機器人未來工廠項目舉行了開工奠基儀式。建成後，該項目為ABB公司在全球範圍內最大、最先進、最具柔性的機器人工廠。該工廠預計將於2021年投入運營，總投資額達1.5億美元（約10億人民幣）。ABB機器人未來工廠項目舉行開工奠基儀式該工程由...

機器人上海技術上海建工集團機器學習跳槽那些事兒投資 2019-09-18

'學習珠心算對孩子以後的數學有沒有什麼影響？'

"珠心算是一類技能表演型項目，跟數學思維啟智沒有關聯，具體影響的話，會混淆數學基礎算理，浪費時間。我是王老師，專注於小學數學，很高興為您答疑解惑，分享解題策略，推廣趣味數學，提供家庭輔導建議，歡迎您的關注。珠心算與數學思維啟智無關單一計算技能練習是比較落伍的方法！計算是數學...

數學不完美媽媽小升初文化 2019-09-18

'數學老師說：學習習慣養成五招就行'

"更多資料請關注微信公眾號：小學資源園地孔子曰“少年若天性，習慣成自然。” 佚名說：“ 良好的習慣能改變我們的人生，一旦養成，便可終身受益。”如果孩子能夠在少年時期養成良好的學習習慣，那麼他便會將追求知識、努力學習當成生活中重要的一件事情來對待。老師說“要培養學生良好的數學...

數學不完美媽媽藝術設計算法 2019-09-17

'兒童英語學習網站有哪些？這些免費的趕緊記牢了'

"很多父母都會想辦法讓孩子在很小的時候接觸英語，畢竟，英語在社會中的應用越來越廣泛，早期接觸英語對孩子很有好處。像兒童英語學習網站就是一個很好的學習途徑，如果你是一個想幫助孩子學習英語但由於工作而沒有時間教孩子的父母，或者如果你的英語水平太差，不能親自教孩子，這裡有一些免費...

英語不完美媽媽數學人生第一份工作讀書 2019-09-17

'家長還在為孩子不愛學習而發愁？學會這幾點，讓孩子愛上學習'

"很多家長往往是隻知道要孩子去學習，卻不知道如何教孩子學習，當然，這並不能真正起到關心孩子學習的作用，我們遇到過很多小學生厭學的現象。案例一：班裡有個孩子（小林），性格比較內向，課堂上沉默寡言，注意力不集中，一二年級成績其實也還可以，自從上了三年級之後，成績直線下降，他的父...

不完美媽媽好好學習大學人生第一份工作數學抑鬱症發現佩奇 2019-09-17

'語文學習是一項長效投資！讓孩子愛上它不難，但需父母做對1件事'

"本文原創首發於今日頭條，第三方平臺轉載請聯繫作者進行授權，否則將追究法律責任。全文一共2850字，閱讀大約需要11分鐘。文 | 名師講學習方法我們的學生，如何學好語文？全國知名語文特級教師，於永正曾對此作出回答：想要學好語文，就要少做題，多讀書！近幾年來，隨著全國中小學語...

語文不完美媽媽讀書高能小子終極裝備大學投資數學人生第一份工作法律英國文章敏感期 2019-09-17

'幼兒園以玩為主，以非正規形式的學習方式，更符合孩子的認知發展'

"在很多人眼裡，特別是農村的老人，他們都會覺得把孩子送去幼兒園都是去玩兒了、看電視的，說白了，就是學不到東西。為什麼很多家長會有這樣的想法呢？其實很簡單，就是因為他們發現幼兒園都是以玩為主，很少正式的、系統的上課，導致了他們有這樣的想法。然而有很多幼兒園，為了擴大招生，他們...

幼兒園不完美媽媽語文數學文化蘋果市場營銷農村 2019-09-17

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'高一到高三需注意這十點附高中生必須糾正的12大學習問題'

"更多精彩，請微信搜索“名校名師教育”公眾號關注我們！數學肖老師說高中三年，學生生涯中至關重要的三年時光。每個人都希望用自己的努力和汗水換來一個美好的結果，進入一個理想的大學。但是，一些同學會在學習方法、學習目標以及同學關係、師生關係等方面會出現不同程度的問題。下面要說的，...

大學數學語文英語讓夢發生高考中考藝術 2019-09-16

'孩子不愛數學、數學不好，給他適當壓力和混亂，讓他自覺學習'

"“一切自下而上的事物，在適量的壓力和混亂下，反而能蓬勃發展。”紐約大學庫朗數學研究所研究員塔勒布，在他那本影響世界的書《反脆弱》中說過這麼一句話。這句話可以讓孩子學好數學，不會輕易放棄數學。（一）自下而上自覺學習所謂“自下而上”，是和自上而下反著的。“自上而下”指的是，...

數學不完美媽媽好好學習人生第一份工作化學設計 2019-09-16

'遊戲論·文化的邏輯丨機制與意義：作為數字現實的電子遊戲'

"在本文的第一部分，我們試圖強調遊戲過程中，玩家在現實層面的行為與經歷。尤其是對《The Witness》的分析，將其建構的“虛擬”空間理解為一種真實的、物質性的數字環境，而將玩家“控制”的形象理解為玩家用來同這個數字環境交互的數字義肢。但如何將這種數字真實與新的物質性觀念...

文化電子遊戲自動機馮諾伊曼宇宙物理電腦數學約翰·何頓·康威 2019-09-16

'請告訴孩子，在最該學習的年紀選擇放棄，你輸的不只是一紙學歷'

"最可怕的是，你一事無成，還安慰自己平凡可貴。我們現在所處的時代，是最公平的時代，也是最不公平的時代。它給予不同行業的人相同的尊重，也允許不同學歷的人通過努力和勤勞獲得滿意的回報。可同樣必須要承認的是，學歷高的人得到回報的機會更大。安徽衛視一檔節目，《學霸是怎麼煉成的》。一...

不完美媽媽人生第一份工作大學公務員北京大學耶魯大學跳槽那些事兒馬雲招聘數學金融安徽讀書市場營銷文章 2019-09-16

'高一到高三不注意這十點！附高中生必須糾正的12大學習問題'

"高中三年，學生生涯中至關重要的三年時光。每個人都希望用自己的努力和汗水換來一個美好的結果，進入一個理想的大學。但是，一些同學會在學習方法、學習目標以及同學關係、師生關係等方面會出現不同程度的問題。下面要說的，對一個想考上理想大學的高中生很重要，仔細看~ 還有，千萬不要再問...

大學語文英語數學讓夢發生高考中考藝術體育 2019-09-16

推薦中...