阿里算法工程師：深度學習這些必懂的面試題

深度學習跳槽那些事兒工程師人工智能 Word CNN AI智能者 2019-04-26

前言

在這個崗位不知不覺數十年了，每年大大小小的面試已經數不清了，這些問題當然也是我最喜歡問他們的問題，要說難，肯定不會出那些都不會的難題，但是說每個人都會那肯定也是不可能的。那這些面試題又有多少人能夠清楚的表達出來。

1、神經網絡基礎問題

（1）BP，Back-propagation（要能推倒）

後向傳播是在求解損失函數L對參數w求導時候用到的方法，目的是通過鏈式法則對參數進行一層一層的求導。這裡重點強調：要將參數進行隨機初始化而不是全部置0，否則所有隱層的數值都會與輸入相關，這稱為對稱失效。

大致過程是:

首先前向傳導計算出所有節點的激活值和輸出值，

計算整體損失函數：

然後針對第L層的每個節點計算出殘差（這裡是因為UFLDL中說的是殘差，本質就是整體損失函數對每一層激活值Z的導數），所以要對W求導只要再乘上激活函數對W的導數即可

（2）梯度消失、梯度爆炸

梯度消失：這本質上是由於激活函數的選擇導致的，最簡單的sigmoid函數為例，在函數的兩端梯度求導結果非常小（飽和區），導致後向傳播過程中由於多次用到激活函數的導數值使得整體的乘積梯度結果變得越來越小，也就出現了梯度消失的現象。

梯度爆炸：同理，出現在激活函數處在激活區，而且權重W過大的情況下。但是梯度爆炸不如梯度消失出現的機會多。

（3）常用的激活函數

（4）參數更新方法

（5）解決overfitting的方法

dropout， regularization， batch normalizatin，但是要注意dropout只在訓練的時候用，讓一部分神經元隨機失活。 Batch normalization是為了讓輸出都是單位高斯激活，方法是在連接和激活函數之間加入BatchNorm層，計算每個特徵的均值和方差進行規則化。

2、CNN問題

（1）思想

改變全連接為局部連接，這是由於圖片的特殊性造成的（圖像的一部分的統計特性與其他部分是一樣的），通過局部連接和參數共享大範圍的減少參數值。可以通過使用多個filter來提取圖片的不同特徵（多卷積核）。

（2）filter尺寸的選擇

通常尺寸多為奇數（1，3，5，7）

（3）輸出尺寸計算公式

輸出尺寸=(N - F +padding*2)/stride + 1

步長可以自由選擇通過補零的方式來實現連接。

（4）pooling池化的作用

雖然通過.卷積的方式可以大範圍的減少輸出尺寸（特徵數），但是依然很難計算而且很容易過擬合，所以依然利用圖片的靜態特性通過池化的方式進一步減少尺寸。

（5）常用模型，這個最好能記住模型大致的尺寸參數。

3、RNN

（1）RNN原理：

在普通的全連接網絡或CNN中，每層神經元的信號只能向上一層傳播，樣本的處理在各個時刻獨立，因此又被成為前向神經網絡(Feed-forward+Neural+Networks)。而在RNN中，神經元的輸出可以在下一個時間戳直接作用到自身，即第i層神經元在m時刻的輸入，除了（i-1）層神經元在該時刻的輸出外，還包括其自身在（m-1）時刻的輸出。所以叫循環神經網絡

（2）RNN、LSTM、GRU區別

RNN引入了循環的概念，但是在實際過程中卻出現了初始信息隨時間消失的問題，即長期依賴（Long-Term Dependencies）問題，所以引入了LSTM。

LSTM：因為LSTM有進有出且當前的cell informaton是通過input gate控制之後疊加的，RNN是疊乘，因此LSTM可以防止梯度消失或者爆炸。推導forget gate，input gate，cell state， hidden information等因為LSTM有進有出且當前的cell informaton是通過input gate控制之後疊加的，RNN是疊乘，因此LSTM可以防止梯度消失或者爆炸的變化是關鍵，下圖非常明確適合記憶：

GRU是LSTM的變體，將忘記門和輸入們合成了一個單一的更新門。

（3）LSTM防止梯度彌散和爆炸

LSTM用加和的方式取代了乘積，使得很難出現梯度彌散。但是相應的更大的機率會出現梯度爆炸，但是可以通過給梯度加門限解決這一問題。

（4）引出word2vec

這個也就是Word Embedding，是一種高效的從原始語料中學習字詞空間向量的預測模型。分為CBOW(Continous Bag of Words)和Skip-Gram兩種形式。其中CBOW是從原始語句推測目標詞彙，而Skip-Gram相反。CBOW可以用於小語料庫，Skip-Gram用於大語料庫。具體的就不是很會了。

3、GAN

（1）GAN的思想

GAN結合了生成模型和判別模型，相當於矛與盾的撞擊。生成模型負責生成最好的數據騙過判別模型，而判別模型負責識別出哪些是真的哪些是生成模型生成的。但是這些只是在瞭解了GAN之後才體會到的，但是為什麼這樣會有效呢？

假設我們有分佈Pdata(x)，我們希望能建立一個生成模型來模擬真實的數據分佈，假設生成模型為Pg(x;θθ)，我們的目的是求解θ的值，通常我們都是用最大似然估計。但是現在的問題是由於我們相用NN來模擬Pdata(x)，但是我們很難求解似然函數，因為我們沒辦法寫出生成模型的具體表達形式，於是才有了GAN，也就是用判別模型來代替求解最大似然的過程。

在最理想的狀態下，G可以生成足以“以假亂真”的圖片G(z)。對於D來說，它難以判定G生成的圖片究竟是不是真實的，因此D(G(z)) = 0.5。這樣我們的目的就達成了：我們得到了一個生成式的模型G，它可以用來生成圖片。

（2）GAN的表達式

通過分析GAN的表達可以看出本質上就是一個minmax問題。其中V(D, G)可以看成是生成模型和判別模型的差異，而minmaxD說的是最大的差異越小越好。這種度量差異的方式實際上叫做Jensen-Shannon divergence。

（3）GAN的實際計算方法

因為我們不可能有Pdata(x)的分佈，所以我們實際中都是用採樣的方式來計算差異（也就是積分變求和）。具體實現過程如下：

有幾個關鍵點：判別方程訓練K次，而生成模型只需要每次迭代訓練一次，先最大化（梯度上升）再最小化（梯度下降）。

但是實際計算時V的後面一項在D(x)很小的情況下由於log函數的原因會導致更新很慢，所以實際中通常將後一項的log(1-D(x))變為-logD(x)。

實際計算的時候還發現不論生成器設計的多好，判別器總是能判斷出真假，也就是loss幾乎都是0，這可能是因為抽樣造成的，生成數據與真實數據的交集過小，無論生成模型多好，判別模型也能分辨出來。解決方法有兩個：1、用WGAN 2、引入隨時間減少的噪聲

（4）對GAN有一些改進

有引入f-divergence，取代Jensen-Shannon divergence，還有很多，這裡主要介紹WGAN

（5）WGAN

上面說過了用f-divergence來衡量兩個分佈的差異，而WGAN的思路是使用Earth Mover distance (挖掘機距離 Wasserstein distance)。

面試題全集

你想了解這些面試寶典全集，關注小編並私信“面試寶典”瞭解面試寶典進群阿里

相關推薦

'最懂“文娛”的馬雲走了，阿里的大文娛誰來拯救？'

"馬雲昨天正式退休了，他在阿里乾的最後的一項工作，是舉辦一個超大型Party，除了阿里的員工，現場也不乏合作伙伴、投資人、媒體、明星、行業大佬。在6萬人的捧場下，馬雲也“放飛自我”，梳了髒辮、穿了鉚釘皮衣、揹著電吉他，以一副硬核金屬朋克的造型，豪情演唱汪峰《我想要怒放的生命...

阿里巴巴集團馬雲騰訊高曉鬆網易雲音樂俞永福優酷土豆宋柯 QQ音樂體育古永鏘音樂蝦米音樂騰訊遊戲酷我音樂盒天天動聽盛大文學騰訊QQ 騰訊視頻 UC瀏覽器高德軟件螞蟻金服愛奇藝跳槽那些事兒盜墓筆記智能手機網易雷軍 YouTube 酷狗音樂馬化騰天貓汪峰淘寶網李彥宏週末綜藝指南支付寶 UGC Netflix 朋克搖滾 2019-09-17

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'馬雲卸任，從阿里巴巴集團的商業版圖看這些年馬雲打下的\'江山\''

"2019年9月10日，阿里巴巴成立20週年，55歲的馬雲卸任阿里巴巴集團董事局主席。9月10日之後，馬雲將繼續擔任阿里巴巴集團董事會成員，直至2020年阿里巴巴年度股東大會。阿里方面已經重申，馬雲這次卸任並非退休，他依然是阿里巴巴一號員工。2014年9月，成立15週年的阿...

阿里巴巴集團馬雲航天信息網易金融跳槽那些事兒天貓海康威視首次公開募股人生第一份工作華泰證券視覺中國青島海爾東軟集團萬達集團分眾傳媒淘寶網華數傳媒上汽集團華誼兄弟萬物嚐鮮節四維圖新衛士通 2019-09-16

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'阿里巴巴Python工程師推出了的一份Python學習清單，絕對經典'

Python MySQL 工程師數據庫 Linux 程序員讀書面向對象程序編程 CSS Django HTML JavaScript MongoDB 阿里巴巴集團人工智能 jQuery 編程語言路由器算法硬件物聯網 2019-09-14

'人工智能算法是如何從數據中學習規律的'

"⾸先我們來看⼀下最常⻅的⼈⼯智能算法是什麼樣的：⼈⼯智能算法包括⼏個部分： x是模型的輸⼊，y是模型的輸出，模型就是對輸⼊轉化為輸出的計算。⽐如輸⼊x可以是⼀張圖⽚（如貓的照⽚），模型對圖⽚進⾏計算處理，然後輸出這張圖⽚上對應的物品的類別（貓）。我們可以把算法理解成⼀...

人工智能算法數學 2019-09-13

'又有一本深度學習方面的入門書要與您見面啦'

"小編告訴您一個好消息，有一本最新的深度學習入門書即將要與您見面。喜歡深度學習的朋友們可以關注一下。深度學習案例精粹（Deep Learning By Example）使用TensorFlow框架，輕鬆理解深度學習算法包含大量案例，快速動手實現深度學習任務可下載配套源碼+...

深度學習人工智能算法機器學習自然語言處理電腦人生第一份工作生物醫學 CNN 讀書 2019-09-13

'深度-裡皮仍要面臨四大挑戰艾克森進球之外蘊藏更大潛力'

"5-0，國足以一個乾淨利落的比分完勝馬爾代夫，為自己世界盃的征程開了個好頭。雖然對比2001年西安那場10-1的大勝，國足沒有創造更大分差的紀錄，但對比日韓澳伊這些亞洲一流豪強，國足竟然是本輪贏球比分最大的種子球隊。艾克森的到來起到了立竿見影的作用，他在自己的國足首秀中上...

馬爾切洛·裡皮中國男足足球武磊世界盃足球賽中國足球超級聯賽埃爾克森馬爾代夫楊旭韋世豪上海綠地足球俱樂部孫興民大迫勇也體育歷史跳槽那些事兒 2019-09-13

'2019WAIC 算法產業化落地，思必馳劍指AI語音未來'

"前沿算法探索和實踐不僅是純學術性的研究，更是引領人工智能產業化落地方的風向標，前沿算法的產業化落地變得尤為重要。人工智能60多年的發展歷程中，算法一直推動學術和產業向前發展的核心力量。今天，人工智能已經從價值驗證期走向規模化落地期。2019世界人工智能大會於8月29-31...

算法 2019世界人工智能大會技術人工智能語音識別技術機器人耳機硬件智能硬件人機交互音箱機器學習上海餐飲 2019-09-12

'阿里巴巴P6級前端工程師面試經驗'

"一般阿里社招都是招3-5年的P6+高級工程師，當初自己一年經驗也沒有想過有這個面試機會。雖然沒想著換工作，但是經常關注一些招聘網站的信息，某一天，在某boss上有個人找我，叫我發一下簡歷，我一看是阿里的某技術專家，雖然之前也有阿里的在某boss上給我要簡歷，但是我深知自己...

人生第一份工作 JSON 工程師阿里巴巴集團技術瀏覽器電腦文章 2019-09-12

'彭蕾：阿里巴巴的現實與理想，深度好文'

"阿里巴巴是一傢什麼樣的公司？是什麼成就阿里夢想？彭蕾表示，阿里巴巴是一家很現實的公司，又是一家特別富有理想主義色彩的公司。彭蕾 | 作者阿里鐵軍 | 素材來源核心觀點 1.阿里巴巴既現實又理想：阿里巴巴是一家很現實的公司，當然，它又是一家特別富有理想主義色彩的公司。2....

阿里巴巴集團彭蕾人生第一份工作跳槽那些事兒不丹最in買手君 2019-09-12

'「雜談」什麼是我心目中深度學習算法工程師的標準'

"有三AI平臺只專心做原創輸出很少扯淡也不蹭熱點，不過最近詢問的朋友多了，不得不統一寫篇文章來回答一下這個大家都很關心的問題，當然，這僅僅是個人觀點。作者&編輯 | 言有三目前利用深度學習這個工具可以做很多事情，各大領域(圖像，語音，NLP等)，各大行業(娛樂，金融...

人工智能算法工程師人生第一份工作 Python 招聘文章技術設計金融不完美媽媽 C語言 GitHub 數學麻將大眾汽車 Linux 2019-09-11

'阿里巴巴程序員推出了的一份Linux 學習清單，這一定是你最需要的'

"第一階段Linux+搜索+hadoop體系Linux基礎→shell編程→高併發架構→lucene,solr搜索→hadoop體系→HDFS→mapreduce→hbase→zookeeper→hive→flume→sqoop→項目實戰第二階段機器學習R語言→mahout...

Linux Spark 程序員 HDFS MapReduce Hadoop 大數據 HBase Storm 阿里巴巴集團 Java 工程師機器學習算法雲計算 Lucene Python Docker Hive 好好學習網絡硬盤 Solr 數據庫 R語言數據挖掘 2019-09-09

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'從希望之星變棄子！網易考拉20億美元賣身阿里，打的什麼算盤？'

"跨境電商行業最大的一場變局落定：網易考拉正式加入阿里動物園。編輯 | Arti本文僅為信息交流之用，不構成任何交易建議9月6日早間，網易與阿里巴巴共同宣佈達成戰略合作，阿里巴巴集團以20億美元全資收購網易旗下跨境電商平臺考拉。同時，阿里巴巴作為領投方參與了網易雲音樂7億美...

阿里巴巴集團網易樹袋熊網易新聞天貓丁磊網易遊戲螞蟻金服萬物嚐鮮節跳槽那些事兒網易雲音樂張勇大潤發上海銀泰商業 B2B 動物螞蟻新聞河馬投資 4月吃什麼 2019-09-08

'零基礎自學python，如何學習最為快速？阿里大佬：這套教程請收好'

"1.Python的設計目標1999年，吉多*範羅蘇姆向DARPA提交了一條名為”Computer Programming For Everybody”的資金申請，並在後來說明了他對Python的目標：1.一門簡單直觀的語言並與主要競爭者一樣強大2.開源，以便任何人都可以為...

Python 設計機器學習數據庫 Java 算法工程師人工智能 2019-09-07

'機器學習在ABR算法中的應用縱覽'

"本文整理自LiveVideoStack線上分享第三季，第五期，由清華大學計算機系網絡技術研究所博士生王莫為為大家介紹近些年ABR算法的發展，探討基於機器學習的ABR算法的優劣勢，並結合AiTrans比賽分析其在直播場景中的應用問題。文/王莫為整理/LiveVideoSta...

算法機器學習技術深度學習愛奇藝清華大學 YouTube 創作者來直播人工智能歷史 2019-09-07

'京東算法工程師分享—最全面的算法和數據結構知識（附帶學習資料'

"數據結構鏈表鏈表是一種由節點（Node）組成的線性數據集合，每個節點通過指針指向下一個節點。它是一種由節點組成，並能用於表示序列的數據結構。單鏈表：每個節點僅指向下一個節點，最後一個節點指向空（null）。雙鏈表：每個節點有兩個指針p，n。p指向前一個節點，n指向下一個節...

數據結構算法工程師京東商城 2019-09-07

'面試季馬上就要到了，數據結構和算法你都掌握了嗎'

"什麼是數據結構？簡單說，數據結構就是一個容器，以某種特定的佈局存儲數據。這個“佈局”使得數據結構在某些操作上非常高效，在另一些操作上則不那麼高效。你的目標就是理解數據結構，這樣就能為手頭的問題選擇最優的數據結構。為什麼我們需要數據結構？由於數據結構用來以有組織的形式存儲數...

數據結構跳槽那些事兒算法編程語言 2019-09-05

推薦中...