機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

機器學習技術銀桑的AI智能銀桑的AI智能 2017-10-07

回顧logistic損失函數

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

上圖是logistic迴歸的一般形式，其中L(a,y)是loss function，具體原因如下圖，詳情可看我之前寫的其他文章。

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

單樣本的梯度下降

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

要想計算損失函數L的導數，首先我們要向前一步計算損失函數的導數，即求”da”=dL(a,y)/da，即對a求偏導數。根據logx導數為1/x，結果為-y/a+(1-y)/(1-a)。現在求得關於變量a的導數，現在可以向後計算一步求”dz”，”dz”=dL(a,y)/dz，計算過程如下：

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

其中，左邊-y/a+(1-y)/(1-a)部分已經在之前計算了，右邊部分為邏輯迴歸映射函數a=1/(1+e^(-z))，求導後得a*(1-a)。這就是反向求導的”鏈式法則”。

特別地：

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

所以，在更新w1，w2，b時：

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

以上就是單個樣本實例一次梯度更新步驟和整個流程的演算圖。

m樣本的梯度下降

當然這只是單個樣本情況下，對於m個實例，全局成本函數(cost function)是一個求和結果，實際上是1到m項損失函數(loss function)和的平均數。

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

在上述反向求導中，我們已經知道損失函數(loss function)單個樣本如何更新w1,w2以及b。那麼如何計算m個樣本的反向求導呢？很簡單，在成本函數(cost function)中，只需對每個樣本進行以上步驟得到各項參數的梯度值後加總求平均，就會得到各項參數的全局梯度值。

具體算法

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

如上圖所示，初始化J=0，dw1=0，dw2=0，db=0，for循環遍歷訓練集，訓練集的個數為m，同時計算相應的每個訓練樣本的導數，然後把它們加起來求平均，求得該批次樣本的梯度值。最後利用圖中右側公式，對w1，w2，b進行更新，即完成了一次梯度下降。

通過不斷重複梯度下降算法，中止條件如下：

1.迭代次數達到限制次數；

2.訓練集中無可供更新的樣本集；

3.loss不再下降或反而上升。

總結

對於梯度下降算法，有批量梯度下降法(Batch Gradient Descent)，隨機梯度下降法(Stochastic Gradient Descent)和梯度下降法(Gradient Descent)。

以上解析的是批量梯度下降法。即用了一些小樣本來近似全部的樣本，其本質就是我1個指不定不太準，那我用個30個或50個樣本那比隨機的要準不少了吧，而且批量的話還是非常可以反映樣本的一個分佈情況的。

隨機梯度下降：由於多了隨機兩個字，也就是說我隨機用樣本中的一個例子來近似我所有的樣本，來調整θ，因而隨機梯度下降是會帶來一定的問題，因為計算得到的並不是準確的一個梯度，容易陷入到局部最優解中。

梯度下降：在原始的梯度下降中，對於θ的更新所有的樣本都有貢獻，也就是參與調整θ，其計算得到的是一個標準梯度。理論上來說一次更新的幅度是比較大的。在樣本不多的情況下，收斂的速度會更快。

機器學習：Deeplearning.ai筆記——logistic迴歸梯度下降法

相關推薦

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'分佈式機器學習之——Spark MLlib並行訓練原理'

"這裡是王喆的機器學習筆記的第二十五篇文章。接下來的幾篇文章希望與大家一同討論一下機器學習模型的分佈式訓練的問題。這個問題在推薦、廣告、搜索領域尤為突出，因為在互聯網場景下，動輒TB甚至PB級的數據量，幾乎不可能利用單點完成機器學習模型的訓練，分佈式機器學習訓練成為唯一...

Spark 機器學習分佈式計算並行計算大數據 GPU 算法 Docker 中央處理器工程師文章物理 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'機器學習：準確率、精確率、召回率、F1，選擇正確的模型評估指標'

"常用的分類算法評估指標大多如上，在具體模型評估指標使用時，並非一味的套用指標計算公式，給出計算結果，還需要結合算法模型的應用場景、數據集等等，比如我們習慣於使用準確率來評價分類算法，一方面是因為我們熟悉它，同時它也是一個很直觀的評價指標，但有些場景下，準確率高並不能代表這...

機器學習 F1賽車算法地震海嘯維基百科 2019-09-14

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'對話Swami：為什麼數萬個客戶選擇AWS實施機器學習？'

"作者|小葳8月底，以“智聯世界無限可能”為主題的2019世界人工智能大會（WAIC）成為科技界最受關注的盛會。AI應用落地成為今年WAIC的最大亮點之一。目前，中國人工智能產業正進入落地實踐階段。據相關機構測算，到2020年我國人工智能產業規模有望突破1600億元，帶動...

機器學習 2019世界人工智能大會 Amazon EC2 技術大數據亞馬遜公司虛擬機設計雲計算工程師算法無人駕駛 NoSQL 數據庫 SaaS 2019-09-08

'數據科學家不可不知的10種機器學習方法'

"作者 | CDA數據分析師10 machine learning methods that every data scientist should know機器學習是研究和工業中的熱門話題，新方法一直在發展。該領域的速度和複雜性使得即使對於專家而言也難以跟上新技術 - 並...

機器學習算法技術可視化技術人工智能數學隨機森林貨車建築 2019-09-07

'最新版《機器學習數學基礎》發佈，417頁PDF免費下載'

"【新智元導讀】《機器學習數學基礎》最新版 417 頁 pdf 版本已經放出，本書旨在激勵人們學習數學概念，包括數學基礎知識和使用數學基礎知識進行機器學習算法示例兩部分，值得收藏學習！由 Marc Peter Deisenroth，A Aldo Faisal 和 Cheng...

機器學習數學算法讀書歷史物理設計技術大學編程語言高中數學收藏 2019-09-07

'機器學習在ABR算法中的應用縱覽'

"本文整理自LiveVideoStack線上分享第三季，第五期，由清華大學計算機系網絡技術研究所博士生王莫為為大家介紹近些年ABR算法的發展，探討基於機器學習的ABR算法的優劣勢，並結合AiTrans比賽分析其在直播場景中的應用問題。文/王莫為整理/LiveVideoSta...

算法機器學習技術深度學習愛奇藝清華大學 YouTube 創作者來直播人工智能歷史 2019-09-07

'全棧工程師必備的進階教材：Python+數據分析+機器學習全套無償送'

"全棧工程師是指掌握多種技能，並能利用多種技能獨立完成產品的人。也叫全端工程師(同時具備前端和後臺能力)，英文Full Stack developer。什麼樣的人適合學習“ Python全棧 ”？一、零基礎、邏輯思維能力強如果你認為自己的邏輯思維能力很強，想通過學一門技術來...

Python 工程師機器學習數據庫技術人工智能物理數學編程語言大學 Linux 跳槽那些事兒彙編語言網絡爬蟲 SQL 英語大數據物聯網 2019-09-06

'每個數據科學家都應該知道的10種機器學習方法'

機器學習算法技術可視化技術人工智能數學貨車隨機森林建築 2019-09-06

'2019年，機器學習的10種方式正在革新制造業'

"作者 | Louis Columbus來源 | CDA數據分析師10 Ways Machine Learning Is Revolutionizing Manufacturing In 2019人工智能有可能在全球業務的營銷和銷售中創造1.4T至2.6T的價值，在供應鏈管...

機器學習人工智能麥肯錫公司技術波士頓諮詢公司 Azure 投資算法德勤無人駕駛區塊鏈市場營銷原汁原味的德系SUV 微軟深度學習 2019-09-04

'聊一聊大家都關注的機器學習的可解釋性，這個太重要了'

"隨著AI和機器學習的發展，越來越多的決策會交給自動化的機器學習算法來做。但是當我們把一些非常重要的決定交給機器的時候，我們真的放心麼？當波音飛機忽略駕駛員的指令，決定義無反顧的衝向大地；當銀行系統莫名其妙否決你的貸款申請的時候；當自動化敵我識別武器系統決定向無辜平民開火的...

機器學習算法人工智能技術可視化技術 2019-09-04

'影響未來的十大算法之一：機器學習與數據挖掘的PageRank算法'

"由於公司架構調整和業務方向的轉變，我所在的項目組即將接手一個機器學習和數據挖掘的項目，為了後續更好地開展工作，也為了能提高自己的專業技能，我決定開始學習機器和數據挖掘方面的知識。那麼，問題就來了：到底應該從哪裡開始學起呢？最開始我也買了一些機器學習相關的入門書籍，跟著聽一...

算法機器學習數據挖掘 Google 拉里·佩奇斯坦福大學 Python 發現佩奇在線教育 2019-09-03

'使用Python進行機器學習的假設檢驗（附鏈接&代碼）'

"作者：Jose Garcia翻譯：張睿毅校對：張一豪本文約3800字，建議閱讀10分鐘。作者給出了假設檢驗的解讀與Python實現的詳細的假設檢驗中的主要操作。也許所有機器學習的初學者，或者中級水平的學生，或者統計專業的學生，都聽說過這個術語，假設檢驗。我將簡要介紹一下這...

Python 機器學習讀書大學 2019-09-03

'三分鐘快速理解人工神經網絡，分享機器學習資料'

"概念認識隨著機器學習和神經網絡兩個不同學科的獨立發展，兩個學科碰撞出了火花--就是我們說的深度學習，深度學習借鑑了神經元的模型，通過模擬多個神經元的連接運算進行訓練學習，實際上深度學習指的就是人工神經網絡，為什麼叫人工呢？這是因為它與神經網絡事有區別的，神經網絡並沒有層的...

人工智能機器學習深度學習大數據 2019-09-02

'4 種你在書裡也學不到的機器學習技能，精髓值得分享'

"在過去幾年，機器學習非常火熱。你可能要問為什麼？其實很簡單，因為它確實對我們的生活很有用。最新的機器學習研究取得了很多突破，在某些任務上的表現甚至已經超越了人類。而且，這個領域也受到了大量資本的青睞，越來越多的從業者積極地投身於這個行業。毋庸置疑，這是一個非常有發展空間的...

機器學習技術算法 MOOC 人工智能深度學習大學設計算法設計軟件跳槽那些事兒 Python 文章 2019-08-24

'npj: 機器學習—焊接的空隙形成條件'

"海歸學者發起的公益學術平臺分享信息，整合資源交流學術，偶爾風月摩擦攪拌焊接（FSW）是一種相對較新的固態焊接工藝，現已廣泛應用於航空航天、造船、汽車和其他行業。在此過程中，憑壓力將具有肩部和焊銷的旋轉剛性工具插入接頭中。工具和工件之間的摩擦產生的熱量使合金軟化但不熔化。軟...

機器學習人工智能算法物理讀書英語力學 2019-08-23

推薦中...