'華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的'

"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這也就意味著,人們可以使用連接到其他神經元的少數神經元在視覺世界中生成所有的方向。

但視覺並不僅僅是邊緣檢測。

2018年,三位科學家發表了第二篇論文,他們用進行邊緣檢測的視覺模型再現了大腦皮質中伽馬神經振盪的整體模式,從而證明了這一數學模型的合理性。

而在尚未發表的第三篇論文當中,科學家們還將解釋視覺皮層是如何感知對比度變化的。這涉及興奮神經元加強彼此活動的機制。

CNN

如果你覺得神經科學的理論太難理解,不妨看一下CNN的工作原理。CNN和人眼處理圖像數據有很多相似之處,二者同樣簡化了圖像與處理過程之間的連接。

對人工神經網絡而言,如果對圖像逐點處理,數據量將是巨大的。即使是最簡單的MNIST數據集為例,圖像分辨率只有28×28,直接用神經網絡來處理,也有784個權重之多。

為此,CNN會先對圖像做卷積處理,用卷積核找到圖像的邊緣,這部分才是處理MNIST所關心的信息。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這也就意味著,人們可以使用連接到其他神經元的少數神經元在視覺世界中生成所有的方向。

但視覺並不僅僅是邊緣檢測。

2018年,三位科學家發表了第二篇論文,他們用進行邊緣檢測的視覺模型再現了大腦皮質中伽馬神經振盪的整體模式,從而證明了這一數學模型的合理性。

而在尚未發表的第三篇論文當中,科學家們還將解釋視覺皮層是如何感知對比度變化的。這涉及興奮神經元加強彼此活動的機制。

CNN

如果你覺得神經科學的理論太難理解,不妨看一下CNN的工作原理。CNN和人眼處理圖像數據有很多相似之處,二者同樣簡化了圖像與處理過程之間的連接。

對人工神經網絡而言,如果對圖像逐點處理,數據量將是巨大的。即使是最簡單的MNIST數據集為例,圖像分辨率只有28×28,直接用神經網絡來處理,也有784個權重之多。

為此,CNN會先對圖像做卷積處理,用卷積核找到圖像的邊緣,這部分才是處理MNIST所關心的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


在圖像處理中有一個著名的“索伯濾波器”,可以分別檢測到物體垂直和水平的邊緣,與視覺神經何其相似。


"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這也就意味著,人們可以使用連接到其他神經元的少數神經元在視覺世界中生成所有的方向。

但視覺並不僅僅是邊緣檢測。

2018年,三位科學家發表了第二篇論文,他們用進行邊緣檢測的視覺模型再現了大腦皮質中伽馬神經振盪的整體模式,從而證明了這一數學模型的合理性。

而在尚未發表的第三篇論文當中,科學家們還將解釋視覺皮層是如何感知對比度變化的。這涉及興奮神經元加強彼此活動的機制。

CNN

如果你覺得神經科學的理論太難理解,不妨看一下CNN的工作原理。CNN和人眼處理圖像數據有很多相似之處,二者同樣簡化了圖像與處理過程之間的連接。

對人工神經網絡而言,如果對圖像逐點處理,數據量將是巨大的。即使是最簡單的MNIST數據集為例,圖像分辨率只有28×28,直接用神經網絡來處理,也有784個權重之多。

為此,CNN會先對圖像做卷積處理,用卷積核找到圖像的邊緣,這部分才是處理MNIST所關心的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


在圖像處理中有一個著名的“索伯濾波器”,可以分別檢測到物體垂直和水平的邊緣,與視覺神經何其相似。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


經過卷積運算後,我們會發現圖像中的相鄰像素一般又具有相似的值,卷積層的輸出也會產生相似的值,輸出中包含的大部分信息都是冗餘的。

引入池化層可以解決這個問題。所謂池化就是將卷積層輸出的結果進一步壓縮,取近鄰之間的平均值或者最大值,減少輸出數據的數量。

作者簡介

楊麗笙(Lai-Sang Young)1952年出生於香港,現在是美國紐約大學科朗數學研究所的教授。她的研究方向包括動力系統、遍歷理論、混沌理論、概率論、統計力學和神經科學。

"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這也就意味著,人們可以使用連接到其他神經元的少數神經元在視覺世界中生成所有的方向。

但視覺並不僅僅是邊緣檢測。

2018年,三位科學家發表了第二篇論文,他們用進行邊緣檢測的視覺模型再現了大腦皮質中伽馬神經振盪的整體模式,從而證明了這一數學模型的合理性。

而在尚未發表的第三篇論文當中,科學家們還將解釋視覺皮層是如何感知對比度變化的。這涉及興奮神經元加強彼此活動的機制。

CNN

如果你覺得神經科學的理論太難理解,不妨看一下CNN的工作原理。CNN和人眼處理圖像數據有很多相似之處,二者同樣簡化了圖像與處理過程之間的連接。

對人工神經網絡而言,如果對圖像逐點處理,數據量將是巨大的。即使是最簡單的MNIST數據集為例,圖像分辨率只有28×28,直接用神經網絡來處理,也有784個權重之多。

為此,CNN會先對圖像做卷積處理,用卷積核找到圖像的邊緣,這部分才是處理MNIST所關心的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


在圖像處理中有一個著名的“索伯濾波器”,可以分別檢測到物體垂直和水平的邊緣,與視覺神經何其相似。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


經過卷積運算後,我們會發現圖像中的相鄰像素一般又具有相似的值,卷積層的輸出也會產生相似的值,輸出中包含的大部分信息都是冗餘的。

引入池化層可以解決這個問題。所謂池化就是將卷積層輸出的結果進一步壓縮,取近鄰之間的平均值或者最大值,減少輸出數據的數量。

作者簡介

楊麗笙(Lai-Sang Young)1952年出生於香港,現在是美國紐約大學科朗數學研究所的教授。她的研究方向包括動力系統、遍歷理論、混沌理論、概率論、統計力學和神經科學。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

雖然楊麗笙在香港出生和長大,但她接受的高等教育都是在美國:1973年獲得威斯康星大學麥迪遜分校的學士學位,1976年和1978年分別獲得了加州大學伯克利分校的數學碩士和博士學位。

1985年獲得斯隆獎,1997年獲得古根海姆獎,1993年獲得美國數學學會頒發的Ruth Lyttle Satter獎,2004年當選為美國文理科學院院士。

她在1998年在Annals of Mathematics(注:數學類期刊影響因子排名前三)上發表的論文已經被引用718次。

Robert Shapley是紐約大學神經科學中心教授,本科畢業於哈佛大學,之後再洛克菲勒大學獲得了神經生理學和生物物理學博士學位。

"

邊策 魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

眼見為實?不不,你以為你“看見”的世界,其實是大腦創造的。

這就是數學家帶來的最新研究結論。

在我們錯誤的認知中,人的眼睛就像一臺相機,可以直接拍下這個美麗的世界。

但事實並非如此,眼睛和大腦之間相連的神經元數量太少,對於傳輸圖像來說是遠遠不夠的。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


來自紐約大學的華人女數學家楊麗笙,與神經科學家Robert Shapley認為,數學才是破譯人類視覺祕密的關鍵。

他們提出了一種單一的數學模型,解釋了大腦如何根據少量神經元的數據生成絢爛多彩的圖像。

這個模型,解釋了視覺皮層中的神經元如何檢測物體邊緣和對比度的變化。現在,他們正在研究如何解釋大腦如何感知物體移動的方向。

而且, 這一研究帶來的影響,並不僅僅限於理解視覺, 對於研究神經網絡,也多有裨益。

要理解他們的研究成果,首先要從人類的視覺神經構造說起。

眼睛如何看見世界

從構造上來看,人眼是一臺照相機,但晶狀體是鏡頭,視網膜是CMOS感光元件,而大腦是相機的圖像處理器。

物體發出的光線經過晶狀體的聚焦後,在視網膜上形成了一個倒立且縮小的圖像。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

在通常的認知中,人們一直認為,視網膜與大腦的連接就像就像CMOS與圖像處理器的連接一樣,視網膜將逐點掃描後的完整數據傳輸給大腦。

然而事實並非如此。解剖學的結果告訴我們,視網膜連接到大腦的視覺皮層的神經元數量相對而言並不多,從視網膜傳遞到視覺皮層的信息其實非常少。

這些神經細胞構成外側膝狀體(LGN),是視覺信息從外界傳播到大腦的唯一途徑。LGN不僅數量稀少,而且功能有限,它只能在檢測到明暗的變化,然後將脈衝信號發送給視覺皮層。

大腦必須要做的是處理由LGN細胞傳來的微弱信號。用如此少的信息來看清世界,就像是用餐巾紙上的簡短筆記寫出一部長篇小說。

“你可能會認為大腦正在拍攝你在視野中看到的東西,”楊麗笙說,“但大腦沒有拍照,視網膜確實如此,從視網膜傳遞到視覺皮層的信息很少。”

雖然視覺皮層和視網膜由相對較少的神經元連接,但視網膜蜿蜒過來每10個LGN神經元,對接著初始“輸入層”中4000個神經元,其他部分則更多。視覺皮層本身的神經細胞密度很大。

巨大的差異表明大腦會深度處理它收到的數量極少的視覺數據。

揭祕真相的數學模型

楊麗笙和Robert Shapley試圖在大腦解剖學的基礎之上,創建一個數學模型,解密大腦是如何根據有限的視覺信息生成人們所看到的美好世界的。

早期的視覺皮層模型認為信息僅以一種方式傳遞:從眼睛的前部到視網膜,再到皮層,最後形成視覺。這樣的“前饋”模型易於構建,但忽略了皮質解剖學揭示的重要一點——視覺皮層中反饋迴路扮演著重要的角色。

楊麗笙指出:

反饋迴路很難處理,因為信息會不斷迴歸並導致改變。

而它在大腦中又是無處不在的。

楊麗笙和合作者Robert Shapley,Logan Chariker從一開始就非常重視反饋迴路。2016年他們合作發表的第一篇論文,他們在模型中引入了一個類似蝴蝶效應的反饋迴路:

來自LGN(外側膝狀體核)的信號的微小變化在經過一個又一個反饋迴路時被放大,這會最終導致模型產生的視覺表示發生比較大的變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


模型的主要組成部分是位於約5°偏心率的獼猴初級視皮層(V1)的一小塊4Cα層。研究人員們將兩片投射到4Cα區域的LGN細胞,以及第6層輸出和4Cα的反饋層都進行了建模。

靈長類動物的LGN有六層,其中第1、4、6層接收一隻眼的信息,第2、3、5層接收另一隻眼的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


早前的研究表明,V1層的4Cα皮質輸入層中可以觀察到方向選擇性空間頻率(SF)選擇性。4Cα層接收來自大細胞LGN層的輸入。

輸入V1層的大細胞LGN非常稀疏,每個V1皮層柱中的4Cα層僅直接接收10個左右的大細胞輸入。

各個LGN細胞的動態可以用一個integrate-and-fire方程表示:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


V表示膜電位,c=100,I+和I- 分別代表ON狀態和OFF狀態的LGN細胞,Snoise是泊松噪聲項的耦合係數,ti是泊松噪聲輸入的達到時。

當V達到1左右,電位重置為0,並且尖峰被髮送到4Cα層中的所有突觸後細胞。

進入LGN細胞的電流I(t, x)則可以表示為:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


LGN細胞的背景激發速率約20 spikes/s,被驅動時,峰值激發速率約100 spikes/s。被驅動時的LGN模型產生的激發模式更接近真實的LGN細胞,也就能更有效地激發V1細胞。

為了模擬神經元膜電位的時間演變規律,這裡採用了歸一化電壓單位,其中靜息電位Vrest=0,尖峰閾值Vth=1。

而通過下面這個LIF(leaky integrate-and-fire)方程,第n個神經元vn的膜電位會趨向標準化尖峰閾值Vth


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


當vn達到Vth時,峰值被激發,並且vn被重置為0,這個過程中會有一段2ms的不應期。

神經元n的I電導率gI^n(t)隨時間變化如下:


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


而E電導率gE^n(t)是四個突觸傳導的總和,分別來自LGN,4Cα層,第6層和大腦或身體其他部位的神經調節的影響。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這個模型重要的新特性在於,它考慮了對V1層稀疏的LGN輸入,這跟解剖學的結論是相匹配的。

結果表明,他們這一反饋豐富的模型能夠重現物體邊緣的方向,無論是垂直,水平還是介於兩者之間,而這些,都僅基於進入模型的少數LGN輸入的微小變化。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


這也就意味著,人們可以使用連接到其他神經元的少數神經元在視覺世界中生成所有的方向。

但視覺並不僅僅是邊緣檢測。

2018年,三位科學家發表了第二篇論文,他們用進行邊緣檢測的視覺模型再現了大腦皮質中伽馬神經振盪的整體模式,從而證明了這一數學模型的合理性。

而在尚未發表的第三篇論文當中,科學家們還將解釋視覺皮層是如何感知對比度變化的。這涉及興奮神經元加強彼此活動的機制。

CNN

如果你覺得神經科學的理論太難理解,不妨看一下CNN的工作原理。CNN和人眼處理圖像數據有很多相似之處,二者同樣簡化了圖像與處理過程之間的連接。

對人工神經網絡而言,如果對圖像逐點處理,數據量將是巨大的。即使是最簡單的MNIST數據集為例,圖像分辨率只有28×28,直接用神經網絡來處理,也有784個權重之多。

為此,CNN會先對圖像做卷積處理,用卷積核找到圖像的邊緣,這部分才是處理MNIST所關心的信息。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


在圖像處理中有一個著名的“索伯濾波器”,可以分別檢測到物體垂直和水平的邊緣,與視覺神經何其相似。


華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的


經過卷積運算後,我們會發現圖像中的相鄰像素一般又具有相似的值,卷積層的輸出也會產生相似的值,輸出中包含的大部分信息都是冗餘的。

引入池化層可以解決這個問題。所謂池化就是將卷積層輸出的結果進一步壓縮,取近鄰之間的平均值或者最大值,減少輸出數據的數量。

作者簡介

楊麗笙(Lai-Sang Young)1952年出生於香港,現在是美國紐約大學科朗數學研究所的教授。她的研究方向包括動力系統、遍歷理論、混沌理論、概率論、統計力學和神經科學。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

雖然楊麗笙在香港出生和長大,但她接受的高等教育都是在美國:1973年獲得威斯康星大學麥迪遜分校的學士學位,1976年和1978年分別獲得了加州大學伯克利分校的數學碩士和博士學位。

1985年獲得斯隆獎,1997年獲得古根海姆獎,1993年獲得美國數學學會頒發的Ruth Lyttle Satter獎,2004年當選為美國文理科學院院士。

她在1998年在Annals of Mathematics(注:數學類期刊影響因子排名前三)上發表的論文已經被引用718次。

Robert Shapley是紐約大學神經科學中心教授,本科畢業於哈佛大學,之後再洛克菲勒大學獲得了神經生理學和生物物理學博士學位。

華人數學家解開視覺奧祕:看到的圖像其實是“腦補”出來的

他的主要研究方向就是動物的視覺神經,在獲得博士學位後,Shapley赴西北大學研究貓視網膜神經節細胞,之後又去劍橋大學研究人類視覺如何探測邊緣。目前Shapley還在研究關於人類視覺皮層中的色彩感知和顏色表示。

論文傳送門:

https://www.jneurosci.org/content/36/49/12368#F4

https://www.jneurosci.org/content/38/40/8621

參考鏈接:

https://www.quantamagazine.org/a-mathematical-model-unlocks-the-secrets-of-vision-20190821/

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

"

相關推薦

推薦中...