生物僧也可以懂的「深度學習」智能算法入門

最近人工智能非常火爆,大有取代一切工作的可能,作為高度重複性的生物研究生,我們自然也會心裡犯嘀咕,是不是也得學點人工智能,深度學習。當然瞭解深度學習的一些算法對我們生物研究本身也很重要,畢竟現在已經到了各種組學時代,隨著各種數據的不斷開拓,可以預見未來深度學習等將成為我們和PCR一樣的工具。

今天我們一起來了解一些深度學習的入門背景。


從神經網絡到深度學習

  • 機器學習:機器學習是現在人工智能的主要研究方向。機器學習從學習樣本的特點來分類可以分為監督學習(有標註),無監督學習(無標註),半監督(部分標註),強化學習(沒有樣本)。在實現算法上有:

  • 決策樹

  • 支持向量機

  • 聚類

  • 人工神經網絡:如第一個人工神經網絡-感知器(感知器與神經網絡)

  • 馬爾可夫鏈

  • 等等

  • 神經網絡:機器學習算法的一種。

  • 深度學習:對機器學習中神經網絡算法的優化與發展。近年來計算性能(GPU)的快速提升,互聯網大量數據的產生,使得深度學習成為可能。同時,使用深度學習算法在諸多任務中均取得了耀眼的成績(圖像識別,自然語言處理),使它成為最火熱的研究方向。

所以要理解深度學習必先了解神經網絡:

生物僧也可以懂的「深度學習」智能算法入門

上面就是一個神經網絡,這個我們生物僧很懂,神經元有各種樹突軸突,然後之間有連接,其中每個圓圈代表神經元。

每條線表示神經元之間的連接。我們可以看到,上面的神經元被分成了多層,層與層之間的神經元有連接,而層內之間的神經元沒有連接。最左邊的層叫做輸入層,這層負責接收輸入數據;最右邊的層叫輸出層,我們可以從這層獲取神經網絡輸出數據。輸入層和輸出層之間的層叫做隱藏層。

那麼如何計算神經網絡那?


生物僧也可以懂的「深度學習」智能算法入門

需要首先將輸入向量的每個元素的值賦給神經網絡的輸入層的對應神經元,然後依次向前計算每一層的每個神經元的值,直到最後一層輸出層的所有神經元的值計算完畢。最後,將輸出層每個神經元的值串在一起就得到了輸出向量。

神經網絡的訓練


神經網絡的訓練是反向傳播算法,反向傳播算法的本質是將錯誤回傳,修改參數。

卷積神經網絡


目前最火爆的是卷積神經網絡,更適合圖像、語音識別任務的神經網絡結構——卷積神經網絡(Convolutional Neural Network, CNN)。說卷積神經網絡是最重要的一種神經網絡也不為過,它在最近幾年大放異彩,幾乎所有圖像、語音識別領域的重要突破都是卷積神經網絡取得的,比如谷歌的GoogleNet、微軟的ResNet等,打敗李世石的AlphaGo也用到了這種網絡。

生物僧也可以懂的「深度學習」智能算法入門

我們可以發現卷積神經網絡的層結構和全連接神經網絡的層結構有很大不同。全連接神經網絡每層的神經元是按照一維排列的,也就是排成一條線的樣子;而卷積神經網絡每層的神經元是按照三維排列的,也就是排成一個長方體的樣子,有寬度、高度和深度。

卷積這個詞大家不懂沒有關係,說的直白一點,卷積的含義,可以理解成提取某一特徵,也就是說只看某一方面,比如100個人各種各樣,我們只看每個人的性格,這也就是用性格對每個人做了一個卷積,如果我們把100個人分成10個組,只看每個組的卷積,這樣就可以有效的合併樣本和周圍樣本的信息。

生物僧也可以懂的「深度學習」智能算法入門

卷積神經網絡在處理圖像上展現了強大的力量。

而處理自然語言等序列問題時候,循環神經網絡和遞歸神經網絡則展現了強大的力量。這裡就不再一一展示了。

TensorFlow 簡介

tensorflow是用數據流表示計算的一種方式,這個跟咱們生物裡面一個一個實驗室的屋子一樣,先做PCR,然後酶切,然後轉化,這些過程都是流程化的,數據也可以流程化,在一個節點內進行計算,類似於反應,然後在節點的連接之間,好比把產物送到不同的實驗室屋子裡面。

TensorFlow是深度學習非常有用的計算框架。

一些使用深度學習的生物信息學文章舉例:

Deep Learning based multi-omics integration robustly predicts survival in liver cancer.

Chaudhary K, Poirion OB, Lu L, Garmire LX.

Clin Cancer Res.

Reconstructing cell cycle and disease progression using deep learning.

Eulenberg P, Köhler N, Blasi T, Filby A, Carpenter AE, Rees P, Theis FJ, Wolf FA.

Nat Commun. 2017

Deep learning and 3D-DESI imaging reveal the hidden metabolic heterogeneity of cancer.

Inglese P, McKenzie JS, Mroz A, Kinross J, Veselkov K, Holmes E, Takats Z, Nicholson JK, Glen RC.

Chem Sci. 2017

(整理自網絡)

相關推薦

推薦中...