'不同模式下的嵌套性在複雜網絡中的聯繫與影響'

社交網絡 金融 物理 經濟 集智俱樂部 2019-09-18
"


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

不同模式下的嵌套性在複雜網絡中的聯繫與影響

Mutualisticnetwork示例圖 不同顏色代表不同類型的節點

在mutualistic network中,有一種簡單的生成機制,能夠重現出真實網絡中70%的性質,這個比例相比其他的生成機制,有顯著的提升。該模型的假設對於上圖中的鳥,同一種鳥採集對於不同果實帶來的收益不同,同一種果實對不同的鳥的收益也不同,收益平均的在分佈在0到1之間。生成網絡時,使用兩條規則:一是針對固定的動物,限定其能連接的邊(採集的植物)的個數,即讓每種鳥有所專精;二是根據各自的收益的相對數,決定是建立一條新的連接還是隨機連接之前已連接的點。

具體的數學模型參見:https://www.nature.com/articles/nature07532


這項研究有趣的是,上述的場景本是生態系統,但驗證模型和現實網絡符合程度時,用的卻是紐約的承包商和生產者的交易網絡,這展現了複雜網絡研究跨學科的特性。

在上面的例子中,每個鳥都是一樣的,但如果將每種鳥看成一個物種,允許同一種的不同個體有所不同(吃不同的果子),那麼從一個隨機的網絡出發,每個物種中的個體依次去掉那些給它們帶來最小收益的果子,也能形成一個完美嵌套的網絡。這個過程可以看成是每種鳥類去尋找一種最接近當前網絡的均衡條件下,不同果子給自己種群帶來收益的偏好序列,例如對自己種群最好吃的果子,有最多的鳥去吃,如此,就是前文說的優化自己群落的適應度。

如下圖所示,通過上述機制,從隨機網絡變成了具有嵌套性的網絡,同時不管是授粉的昆蟲還是花,都擴大了自己的種群數量,提高了適應度。


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

不同模式下的嵌套性在複雜網絡中的聯繫與影響

Mutualisticnetwork示例圖 不同顏色代表不同類型的節點

在mutualistic network中,有一種簡單的生成機制,能夠重現出真實網絡中70%的性質,這個比例相比其他的生成機制,有顯著的提升。該模型的假設對於上圖中的鳥,同一種鳥採集對於不同果實帶來的收益不同,同一種果實對不同的鳥的收益也不同,收益平均的在分佈在0到1之間。生成網絡時,使用兩條規則:一是針對固定的動物,限定其能連接的邊(採集的植物)的個數,即讓每種鳥有所專精;二是根據各自的收益的相對數,決定是建立一條新的連接還是隨機連接之前已連接的點。

具體的數學模型參見:https://www.nature.com/articles/nature07532


這項研究有趣的是,上述的場景本是生態系統,但驗證模型和現實網絡符合程度時,用的卻是紐約的承包商和生產者的交易網絡,這展現了複雜網絡研究跨學科的特性。

在上面的例子中,每個鳥都是一樣的,但如果將每種鳥看成一個物種,允許同一種的不同個體有所不同(吃不同的果子),那麼從一個隨機的網絡出發,每個物種中的個體依次去掉那些給它們帶來最小收益的果子,也能形成一個完美嵌套的網絡。這個過程可以看成是每種鳥類去尋找一種最接近當前網絡的均衡條件下,不同果子給自己種群帶來收益的偏好序列,例如對自己種群最好吃的果子,有最多的鳥去吃,如此,就是前文說的優化自己群落的適應度。

如下圖所示,通過上述機制,從隨機網絡變成了具有嵌套性的網絡,同時不管是授粉的昆蟲還是花,都擴大了自己的種群數量,提高了適應度。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

種群適應度最大化的網絡演變起始點和種群數量變化曲線


如果將視野放大,不止限於自己的種群,而是將判斷是否調整連接的條件變成新的連接能否增加整個網絡中總的人口,也就是說,在上述的鳥吃果子的例子中,前面要求只有在能夠讓本種鳥的數量增加,才改變吃的果子,現在假定只要能讓所有的鳥的總數增加,哪怕自己品種的鳥吃的不好,也可以交換。在這樣的機制下,同樣可以生成具有嵌套結構的網絡,這類似於進化理論中的群體選擇。

不同層級下的生成機制,導出了相同的網絡性質,這說明嵌套網絡的出現,是不同機制共同作用的必然結果,但具體哪種機制在起主要作用,卻無法僅僅依據嵌套性本身推出。

社交網絡中的嵌套性生成有何不同

在社交網絡中,每個人都試圖成為聚光燈下的焦點。在網絡科學中,可以通過centrality來評價節點是否處在網絡的中心。下面的模型,可以模擬社交網絡中的嵌套性是如何產生的。從一個隨機網絡出發,隨機選一個節點,以alpha的概率選擇當前網絡裡中心性最高的未連接節點建立連接,或者以1-alpha的概率去掉當前連接中中心性最小的節點。

上述機制生成的網絡,不止具有嵌套性,而且按照節點度數從大到小排列,度數最大的節點的中心性也最高,度數次高的節點在中心性上排名第二,依次類推。

在上述的機制下,當一個節點成為中心節點時,不是由於該節點做了什麼,而應該歸因於該節點是其他節點提升自己中心性的最好選擇,也就是其本身的初始中心度相對較高,而上述的不同歸因,可以看成是社交網絡和生態網絡生成機制的本質區別。

上述模型中有一個關鍵的參數alpha,而alpha有一個關鍵值,這個關鍵值附近只要發生微小的變化,就會導致生成的網絡呈現出性質上的天壤之別。讀者可以思考這個alpha應該是下面的哪個:

(1)0.25

(2)0.50

(3)0.33

(4)1 / e

答案是第二個,也就是當網絡中超過一半的人選擇增加連接之後,在經過了足夠多次的變化之後,網絡會註定變成一個全連接的網絡。下圖展示的是在不同的alpha值下,網絡呈現的不同情況,不同形狀的點代表大小不同的網絡,圖中的縱軸是網絡的eigenvectorcentrality。

在alpha接近但不大於0.5時,生成的網絡呈現完美嵌套性,且存在少數高度連接的節點,類似現實中的社交網絡。引申來看,隨著連接的建立越來越容易(移動互聯網的普及),社交網絡圖圖中最上面的稀疏網絡,變成了最左邊的相對稠密且更加中心化的形態,而由於人的精力有限,增加連接的機率不會大於刪除連接的概率,因此在現有技術下無法生成圖中右下角的全連接網絡,至少在腦機接口成熟前不會。


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

不同模式下的嵌套性在複雜網絡中的聯繫與影響

Mutualisticnetwork示例圖 不同顏色代表不同類型的節點

在mutualistic network中,有一種簡單的生成機制,能夠重現出真實網絡中70%的性質,這個比例相比其他的生成機制,有顯著的提升。該模型的假設對於上圖中的鳥,同一種鳥採集對於不同果實帶來的收益不同,同一種果實對不同的鳥的收益也不同,收益平均的在分佈在0到1之間。生成網絡時,使用兩條規則:一是針對固定的動物,限定其能連接的邊(採集的植物)的個數,即讓每種鳥有所專精;二是根據各自的收益的相對數,決定是建立一條新的連接還是隨機連接之前已連接的點。

具體的數學模型參見:https://www.nature.com/articles/nature07532


這項研究有趣的是,上述的場景本是生態系統,但驗證模型和現實網絡符合程度時,用的卻是紐約的承包商和生產者的交易網絡,這展現了複雜網絡研究跨學科的特性。

在上面的例子中,每個鳥都是一樣的,但如果將每種鳥看成一個物種,允許同一種的不同個體有所不同(吃不同的果子),那麼從一個隨機的網絡出發,每個物種中的個體依次去掉那些給它們帶來最小收益的果子,也能形成一個完美嵌套的網絡。這個過程可以看成是每種鳥類去尋找一種最接近當前網絡的均衡條件下,不同果子給自己種群帶來收益的偏好序列,例如對自己種群最好吃的果子,有最多的鳥去吃,如此,就是前文說的優化自己群落的適應度。

如下圖所示,通過上述機制,從隨機網絡變成了具有嵌套性的網絡,同時不管是授粉的昆蟲還是花,都擴大了自己的種群數量,提高了適應度。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

種群適應度最大化的網絡演變起始點和種群數量變化曲線


如果將視野放大,不止限於自己的種群,而是將判斷是否調整連接的條件變成新的連接能否增加整個網絡中總的人口,也就是說,在上述的鳥吃果子的例子中,前面要求只有在能夠讓本種鳥的數量增加,才改變吃的果子,現在假定只要能讓所有的鳥的總數增加,哪怕自己品種的鳥吃的不好,也可以交換。在這樣的機制下,同樣可以生成具有嵌套結構的網絡,這類似於進化理論中的群體選擇。

不同層級下的生成機制,導出了相同的網絡性質,這說明嵌套網絡的出現,是不同機制共同作用的必然結果,但具體哪種機制在起主要作用,卻無法僅僅依據嵌套性本身推出。

社交網絡中的嵌套性生成有何不同

在社交網絡中,每個人都試圖成為聚光燈下的焦點。在網絡科學中,可以通過centrality來評價節點是否處在網絡的中心。下面的模型,可以模擬社交網絡中的嵌套性是如何產生的。從一個隨機網絡出發,隨機選一個節點,以alpha的概率選擇當前網絡裡中心性最高的未連接節點建立連接,或者以1-alpha的概率去掉當前連接中中心性最小的節點。

上述機制生成的網絡,不止具有嵌套性,而且按照節點度數從大到小排列,度數最大的節點的中心性也最高,度數次高的節點在中心性上排名第二,依次類推。

在上述的機制下,當一個節點成為中心節點時,不是由於該節點做了什麼,而應該歸因於該節點是其他節點提升自己中心性的最好選擇,也就是其本身的初始中心度相對較高,而上述的不同歸因,可以看成是社交網絡和生態網絡生成機制的本質區別。

上述模型中有一個關鍵的參數alpha,而alpha有一個關鍵值,這個關鍵值附近只要發生微小的變化,就會導致生成的網絡呈現出性質上的天壤之別。讀者可以思考這個alpha應該是下面的哪個:

(1)0.25

(2)0.50

(3)0.33

(4)1 / e

答案是第二個,也就是當網絡中超過一半的人選擇增加連接之後,在經過了足夠多次的變化之後,網絡會註定變成一個全連接的網絡。下圖展示的是在不同的alpha值下,網絡呈現的不同情況,不同形狀的點代表大小不同的網絡,圖中的縱軸是網絡的eigenvectorcentrality。

在alpha接近但不大於0.5時,生成的網絡呈現完美嵌套性,且存在少數高度連接的節點,類似現實中的社交網絡。引申來看,隨著連接的建立越來越容易(移動互聯網的普及),社交網絡圖圖中最上面的稀疏網絡,變成了最左邊的相對稠密且更加中心化的形態,而由於人的精力有限,增加連接的機率不會大於刪除連接的概率,因此在現有技術下無法生成圖中右下角的全連接網絡,至少在腦機接口成熟前不會。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同大小的網絡在模擬中在0.5這個臨界點附件呈現相同的相變特性


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

不同模式下的嵌套性在複雜網絡中的聯繫與影響

Mutualisticnetwork示例圖 不同顏色代表不同類型的節點

在mutualistic network中,有一種簡單的生成機制,能夠重現出真實網絡中70%的性質,這個比例相比其他的生成機制,有顯著的提升。該模型的假設對於上圖中的鳥,同一種鳥採集對於不同果實帶來的收益不同,同一種果實對不同的鳥的收益也不同,收益平均的在分佈在0到1之間。生成網絡時,使用兩條規則:一是針對固定的動物,限定其能連接的邊(採集的植物)的個數,即讓每種鳥有所專精;二是根據各自的收益的相對數,決定是建立一條新的連接還是隨機連接之前已連接的點。

具體的數學模型參見:https://www.nature.com/articles/nature07532


這項研究有趣的是,上述的場景本是生態系統,但驗證模型和現實網絡符合程度時,用的卻是紐約的承包商和生產者的交易網絡,這展現了複雜網絡研究跨學科的特性。

在上面的例子中,每個鳥都是一樣的,但如果將每種鳥看成一個物種,允許同一種的不同個體有所不同(吃不同的果子),那麼從一個隨機的網絡出發,每個物種中的個體依次去掉那些給它們帶來最小收益的果子,也能形成一個完美嵌套的網絡。這個過程可以看成是每種鳥類去尋找一種最接近當前網絡的均衡條件下,不同果子給自己種群帶來收益的偏好序列,例如對自己種群最好吃的果子,有最多的鳥去吃,如此,就是前文說的優化自己群落的適應度。

如下圖所示,通過上述機制,從隨機網絡變成了具有嵌套性的網絡,同時不管是授粉的昆蟲還是花,都擴大了自己的種群數量,提高了適應度。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

種群適應度最大化的網絡演變起始點和種群數量變化曲線


如果將視野放大,不止限於自己的種群,而是將判斷是否調整連接的條件變成新的連接能否增加整個網絡中總的人口,也就是說,在上述的鳥吃果子的例子中,前面要求只有在能夠讓本種鳥的數量增加,才改變吃的果子,現在假定只要能讓所有的鳥的總數增加,哪怕自己品種的鳥吃的不好,也可以交換。在這樣的機制下,同樣可以生成具有嵌套結構的網絡,這類似於進化理論中的群體選擇。

不同層級下的生成機制,導出了相同的網絡性質,這說明嵌套網絡的出現,是不同機制共同作用的必然結果,但具體哪種機制在起主要作用,卻無法僅僅依據嵌套性本身推出。

社交網絡中的嵌套性生成有何不同

在社交網絡中,每個人都試圖成為聚光燈下的焦點。在網絡科學中,可以通過centrality來評價節點是否處在網絡的中心。下面的模型,可以模擬社交網絡中的嵌套性是如何產生的。從一個隨機網絡出發,隨機選一個節點,以alpha的概率選擇當前網絡裡中心性最高的未連接節點建立連接,或者以1-alpha的概率去掉當前連接中中心性最小的節點。

上述機制生成的網絡,不止具有嵌套性,而且按照節點度數從大到小排列,度數最大的節點的中心性也最高,度數次高的節點在中心性上排名第二,依次類推。

在上述的機制下,當一個節點成為中心節點時,不是由於該節點做了什麼,而應該歸因於該節點是其他節點提升自己中心性的最好選擇,也就是其本身的初始中心度相對較高,而上述的不同歸因,可以看成是社交網絡和生態網絡生成機制的本質區別。

上述模型中有一個關鍵的參數alpha,而alpha有一個關鍵值,這個關鍵值附近只要發生微小的變化,就會導致生成的網絡呈現出性質上的天壤之別。讀者可以思考這個alpha應該是下面的哪個:

(1)0.25

(2)0.50

(3)0.33

(4)1 / e

答案是第二個,也就是當網絡中超過一半的人選擇增加連接之後,在經過了足夠多次的變化之後,網絡會註定變成一個全連接的網絡。下圖展示的是在不同的alpha值下,網絡呈現的不同情況,不同形狀的點代表大小不同的網絡,圖中的縱軸是網絡的eigenvectorcentrality。

在alpha接近但不大於0.5時,生成的網絡呈現完美嵌套性,且存在少數高度連接的節點,類似現實中的社交網絡。引申來看,隨著連接的建立越來越容易(移動互聯網的普及),社交網絡圖圖中最上面的稀疏網絡,變成了最左邊的相對稠密且更加中心化的形態,而由於人的精力有限,增加連接的機率不會大於刪除連接的概率,因此在現有技術下無法生成圖中右下角的全連接網絡,至少在腦機接口成熟前不會。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同大小的網絡在模擬中在0.5這個臨界點附件呈現相同的相變特性


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點所佔比例


上圖橫軸是節點的度數,即該節點連接的點佔全部節點的比例,縱軸是該度數節點出現的概率,不同的顏色代表了不同的alpha參數。建議讀者先思考一下,圖中的藍色還是黑色對應的alpha值更大。藍色對應的是alpha為0.495,黑色對應的alpha是0.45,這幅圖想說明的是度數的分佈呈現出三個階段:第一階段相對平滑;第二階段是指數式快速下降;第三階段下降的趨勢比較平緩。

隨著alpha值的提升,節點的度數需要變得比之前更大,才能突破常態,對應藍色曲線中左邊平緩的區域最長,也就是說隨著alpha的增加,一個節點連接1%還是0.1%的節點,其出現的概率都是相同的,這反映到現實生活中,就是成為大V所需的初始粉絲數目,隨著網絡變得稠密而增加了。

網絡屬性不是孤島,生成機制是其橋樑

上述的生成機制,都是相對基礎簡單的模型,若想模擬現實世界,則需要更加複雜的模型。有兩個具體方向:

一是引入博弈機制和不完全信息,即讓節點的行動不是相互獨立的,節點也無法像前文社交網絡中,根據網絡中全部節點的信息來更新自己的連接,而只能獲得局部的信息。

第二個方向是在模型中讓節點能夠創新,在生態系統中,對應的是物種分化成多個物種,一個節點變成多個節點,在經濟網絡中,是節點的內在屬性,比如對其他節點的連接偏好發生了變化。

複雜網絡的研究終極目標,是理解現實世界中,在時間和空間上都在演變的網絡是否具有臨界點,是否有固定的方向,演變過程中,網絡的特徵是怎樣的。既然現實中的網絡普遍具有嵌套性,那可以從通過模擬嵌套性生成的機制中,看到在網絡的演化過程中,不同的性質之間如何聯繫並相互影響。

複雜網絡中的每一種性質都不是孤島,而生成機制正是將其連接起來的橋樑。

作者:郭瑞東

審校:崔浩川

編輯:李倩雨


"


不同模式下的嵌套性在複雜網絡中的聯繫與影響



導語

嵌套性是網絡科學的核心議題之一。近期發表在Physics Reports上的一篇論文,對複雜網絡的嵌套性進行到了從現象到機制的全面綜述。本文聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

針對這篇網絡嵌套綜述的更多內容,以及網絡結構相關問題,我們組織了線上讀書會,定期線上分享,詳情與參與方式見文末。


複雜網絡的嵌套性,是在生態系統、經濟金融、社交網絡等具體場景中都會呈現的性質。該性質和網絡的魯棒性、多樣性都有所聯繫,在《網絡嵌套結構決定公司國家命運》一文中,介紹了利用網絡的嵌套性做預測的例子,本文則聚焦於哪些生成機制讓網絡在成長中獲得了嵌套性。

論文題目:

Nestedness in complex networks: Observation, emergence, and implications

論文地址:

https://arxiv.org/abs/1905.07593


嵌套性最簡單的生成機制:閾值模型

假設網絡中的每個節點有一個內在屬性,通常稱之為節點的適應性(fitness),不同節點的適應性符合特定的概率分佈,如果兩個節點的適應度之和小於一個定值,稱其為閾值(threshold),那麼這兩個節點之間就不會有連接,如果節點的適應度大於閾值,節點之間產生連接的機率符合某一概率分佈,這就是閾值模型。

如果節點之間的適應度的分佈曲線是指數函數,那在上述的閾值模型中,產生網絡呈現出在節點的度數上尺度一致性。

如下圖所示,圖中橫軸是節點的度數,縱軸是該度數節點的概率,紅線是理論值,圓點是模擬下的真實情況。由於模擬的網絡不是無限大的,所以左上角會偏離理論預期,而在最右邊的那個點,代表在該模型下,會有極少的點,和所有的點都能產生連接。

根據這個現象,如果某個節點的適應性本身就大於閾值,那麼這個節點不管和誰,都有可能連接,這樣的節點,就有可能成為圖中最右邊的那個點。在這樣條件下生成的網絡,節點間的連接矩陣,總會有一些節點比其他節點連接的邊要多,即滿足上三角的性質,從而是網絡呈現出嵌套性。

不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點在網絡中出現概率的分佈

在上述模型中,網絡多半是無法形成全連接網絡的(disassortativity),原因是對於度數為k的節點,其鄰居的平均度數的分佈按k^-1次衰減。用通俗的話來講,就是大V和小V的關注者的平均節點連接數的差距,要比普通人之間更大,每個大V各自連接著一堆沒什麼連接的無名氏,而不是大V和小V連接,從而使得網絡無法連成一個整體。

閾值模型生成的網絡,還有一個有趣的特性,與網絡的聚類係數(cluster cofficient)有關。聚類係數衡量一個網絡中的節點是否容易形成一個內部緊密聯繫的小團體,針對節點計算,其分母是和該節點連接的點組成的三元組(triple,三個節點形成的集合)的數量,分子是這些三元組中有多少個完全連接的三角形。

下圖的橫軸是節點的連接數,縱軸是節點的聚類係數,當節點度數小於某個特定的值之前,網絡中的聚類係數很高,這可以看成在普通人的朋友圈裡,朋友的朋友也是朋友,而當你的連接超過100個,朋友的朋友相互認識的概率就會變低。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點對應對應的聚類係數


總結閾值模型,通過引入網絡在的點有不同的內在屬性(適應度)這一個假設,閾值模型生成的網絡能重現出現實網絡中的長尾(heavy-tail),適應度要滿足的分佈不僅限於指數分佈,高斯分佈、泊松分佈、logistic等分佈,都可以生成和現實類似的網絡。

自組織網絡中的嵌套生成機制

如果網絡中的節點按照一定的規則,選擇對自己有利的連接,那這類的生成機制就稱為自組織網絡(Self-organizing network)。不管是生態系統,還是社會金融,網絡中的連接都不是一成不變的,而是在不斷變化、達成均衡後才相對穩定的。

相比於閾值模型,自組織網絡中的生成機制更加符合現實情況,也被研究得更多,有多種細分的生成模型。但這些模型都圍繞著一條核心原則變化而來,即如何通過調整連接,最大化自己、自己物種以及自己所生活的群落(community)的適應度。

從一個隨機連接的網絡起始,如果網絡中的節點都嫌貧愛富,即在滿足下面兩個條件下隨機交換一條連接:1)新增加的連接會帶來一個連接數更高的鄰居;2)新增加的連接不會讓之前連接的節點變成孤立的。

那麼足夠多次的連接交換之後,網絡就會呈現出完美的嵌套性,且節點的度數分佈呈指數函數(標度一致)。這個情景下,網絡中節點最大化的是節點的度中心性(centrality),第二個條件的加入是為了避免讓網絡變成一個全連接的子網絡與其他完全不連接的節點。現實中的網絡多半不具有完美的嵌套性,這可以通過限制交換的次數來模擬。

將網絡中的節點分為只在類間有相互作用的兩類,例如生態網絡中不同的昆蟲(授粉)和花,或者商業網絡中的製造者和承包商,這樣可以形成Mutualistic networks,如下圖所示:

不同模式下的嵌套性在複雜網絡中的聯繫與影響

Mutualisticnetwork示例圖 不同顏色代表不同類型的節點

在mutualistic network中,有一種簡單的生成機制,能夠重現出真實網絡中70%的性質,這個比例相比其他的生成機制,有顯著的提升。該模型的假設對於上圖中的鳥,同一種鳥採集對於不同果實帶來的收益不同,同一種果實對不同的鳥的收益也不同,收益平均的在分佈在0到1之間。生成網絡時,使用兩條規則:一是針對固定的動物,限定其能連接的邊(採集的植物)的個數,即讓每種鳥有所專精;二是根據各自的收益的相對數,決定是建立一條新的連接還是隨機連接之前已連接的點。

具體的數學模型參見:https://www.nature.com/articles/nature07532


這項研究有趣的是,上述的場景本是生態系統,但驗證模型和現實網絡符合程度時,用的卻是紐約的承包商和生產者的交易網絡,這展現了複雜網絡研究跨學科的特性。

在上面的例子中,每個鳥都是一樣的,但如果將每種鳥看成一個物種,允許同一種的不同個體有所不同(吃不同的果子),那麼從一個隨機的網絡出發,每個物種中的個體依次去掉那些給它們帶來最小收益的果子,也能形成一個完美嵌套的網絡。這個過程可以看成是每種鳥類去尋找一種最接近當前網絡的均衡條件下,不同果子給自己種群帶來收益的偏好序列,例如對自己種群最好吃的果子,有最多的鳥去吃,如此,就是前文說的優化自己群落的適應度。

如下圖所示,通過上述機制,從隨機網絡變成了具有嵌套性的網絡,同時不管是授粉的昆蟲還是花,都擴大了自己的種群數量,提高了適應度。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

種群適應度最大化的網絡演變起始點和種群數量變化曲線


如果將視野放大,不止限於自己的種群,而是將判斷是否調整連接的條件變成新的連接能否增加整個網絡中總的人口,也就是說,在上述的鳥吃果子的例子中,前面要求只有在能夠讓本種鳥的數量增加,才改變吃的果子,現在假定只要能讓所有的鳥的總數增加,哪怕自己品種的鳥吃的不好,也可以交換。在這樣的機制下,同樣可以生成具有嵌套結構的網絡,這類似於進化理論中的群體選擇。

不同層級下的生成機制,導出了相同的網絡性質,這說明嵌套網絡的出現,是不同機制共同作用的必然結果,但具體哪種機制在起主要作用,卻無法僅僅依據嵌套性本身推出。

社交網絡中的嵌套性生成有何不同

在社交網絡中,每個人都試圖成為聚光燈下的焦點。在網絡科學中,可以通過centrality來評價節點是否處在網絡的中心。下面的模型,可以模擬社交網絡中的嵌套性是如何產生的。從一個隨機網絡出發,隨機選一個節點,以alpha的概率選擇當前網絡裡中心性最高的未連接節點建立連接,或者以1-alpha的概率去掉當前連接中中心性最小的節點。

上述機制生成的網絡,不止具有嵌套性,而且按照節點度數從大到小排列,度數最大的節點的中心性也最高,度數次高的節點在中心性上排名第二,依次類推。

在上述的機制下,當一個節點成為中心節點時,不是由於該節點做了什麼,而應該歸因於該節點是其他節點提升自己中心性的最好選擇,也就是其本身的初始中心度相對較高,而上述的不同歸因,可以看成是社交網絡和生態網絡生成機制的本質區別。

上述模型中有一個關鍵的參數alpha,而alpha有一個關鍵值,這個關鍵值附近只要發生微小的變化,就會導致生成的網絡呈現出性質上的天壤之別。讀者可以思考這個alpha應該是下面的哪個:

(1)0.25

(2)0.50

(3)0.33

(4)1 / e

答案是第二個,也就是當網絡中超過一半的人選擇增加連接之後,在經過了足夠多次的變化之後,網絡會註定變成一個全連接的網絡。下圖展示的是在不同的alpha值下,網絡呈現的不同情況,不同形狀的點代表大小不同的網絡,圖中的縱軸是網絡的eigenvectorcentrality。

在alpha接近但不大於0.5時,生成的網絡呈現完美嵌套性,且存在少數高度連接的節點,類似現實中的社交網絡。引申來看,隨著連接的建立越來越容易(移動互聯網的普及),社交網絡圖圖中最上面的稀疏網絡,變成了最左邊的相對稠密且更加中心化的形態,而由於人的精力有限,增加連接的機率不會大於刪除連接的概率,因此在現有技術下無法生成圖中右下角的全連接網絡,至少在腦機接口成熟前不會。


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同大小的網絡在模擬中在0.5這個臨界點附件呈現相同的相變特性


不同模式下的嵌套性在複雜網絡中的聯繫與影響

不同度數節點所佔比例


上圖橫軸是節點的度數,即該節點連接的點佔全部節點的比例,縱軸是該度數節點出現的概率,不同的顏色代表了不同的alpha參數。建議讀者先思考一下,圖中的藍色還是黑色對應的alpha值更大。藍色對應的是alpha為0.495,黑色對應的alpha是0.45,這幅圖想說明的是度數的分佈呈現出三個階段:第一階段相對平滑;第二階段是指數式快速下降;第三階段下降的趨勢比較平緩。

隨著alpha值的提升,節點的度數需要變得比之前更大,才能突破常態,對應藍色曲線中左邊平緩的區域最長,也就是說隨著alpha的增加,一個節點連接1%還是0.1%的節點,其出現的概率都是相同的,這反映到現實生活中,就是成為大V所需的初始粉絲數目,隨著網絡變得稠密而增加了。

網絡屬性不是孤島,生成機制是其橋樑

上述的生成機制,都是相對基礎簡單的模型,若想模擬現實世界,則需要更加複雜的模型。有兩個具體方向:

一是引入博弈機制和不完全信息,即讓節點的行動不是相互獨立的,節點也無法像前文社交網絡中,根據網絡中全部節點的信息來更新自己的連接,而只能獲得局部的信息。

第二個方向是在模型中讓節點能夠創新,在生態系統中,對應的是物種分化成多個物種,一個節點變成多個節點,在經濟網絡中,是節點的內在屬性,比如對其他節點的連接偏好發生了變化。

複雜網絡的研究終極目標,是理解現實世界中,在時間和空間上都在演變的網絡是否具有臨界點,是否有固定的方向,演變過程中,網絡的特徵是怎樣的。既然現實中的網絡普遍具有嵌套性,那可以從通過模擬嵌套性生成的機制中,看到在網絡的演化過程中,不同的性質之間如何聯繫並相互影響。

複雜網絡中的每一種性質都不是孤島,而生成機制正是將其連接起來的橋樑。

作者:郭瑞東

審校:崔浩川

編輯:李倩雨


不同模式下的嵌套性在複雜網絡中的聯繫與影響

"

相關推薦

推薦中...