'為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大'

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/Suphx 以“大三元”役滿胡牌

AI打麻將,比下棋難多了

2019 世界人工智能大會期間,沈向洋公開稱,由微軟亞洲研究院研發的麻將 AI 系統 Suphx ,在日本專業麻將平臺“天鳳”上榮升十段。這是麻將領域中,AI 系統目前創造的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。”

與象棋、圍棋等棋類遊戲相比,麻將在對弈過程中,存在大量隱藏信息,具有高度的不確定性。因此,麻將的複雜度遠高於其他棋類,對AI技術有著特殊挑戰。

“打麻將,第一是海量的隱藏信息。微軟的做法是做‘先知教練’,可以看到所有牌打的時候應該是什麼樣,而你打的時候是沒有看到的,但有一個先知教練可以看到的,這個可以當訓練數據。”沈向洋說,其次,還有複雜的獎勵機制,因為打牌時不見得每一副都要贏,還有胡大一點還是胡小一點等等。這樣可以用全盤預測的方式,當然還有一個是巨大的狀態空間,所以還有自適應的決策,再加上深度強化學習,把所有的東西串起來。”

Suphx 在天鳳的公開房間“特上房”,與人類選手進行超過 5000 場對戰後,獲得“特上房”最高段位十段。研發團隊表示,遊戲中,Suphx 表現出了類人的直覺、預測、推理、模糊決策能力,以及大局觀意識

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/Suphx 以“大三元”役滿胡牌

AI打麻將,比下棋難多了

2019 世界人工智能大會期間,沈向洋公開稱,由微軟亞洲研究院研發的麻將 AI 系統 Suphx ,在日本專業麻將平臺“天鳳”上榮升十段。這是麻將領域中,AI 系統目前創造的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。”

與象棋、圍棋等棋類遊戲相比,麻將在對弈過程中,存在大量隱藏信息,具有高度的不確定性。因此,麻將的複雜度遠高於其他棋類,對AI技術有著特殊挑戰。

“打麻將,第一是海量的隱藏信息。微軟的做法是做‘先知教練’,可以看到所有牌打的時候應該是什麼樣,而你打的時候是沒有看到的,但有一個先知教練可以看到的,這個可以當訓練數據。”沈向洋說,其次,還有複雜的獎勵機制,因為打牌時不見得每一副都要贏,還有胡大一點還是胡小一點等等。這樣可以用全盤預測的方式,當然還有一個是巨大的狀態空間,所以還有自適應的決策,再加上深度強化學習,把所有的東西串起來。”

Suphx 在天鳳的公開房間“特上房”,與人類選手進行超過 5000 場對戰後,獲得“特上房”最高段位十段。研發團隊表示,遊戲中,Suphx 表現出了類人的直覺、預測、推理、模糊決策能力,以及大局觀意識

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟麻將遊戲的挑戰以及 Suphx 的核心技術

據瞭解,天鳳是一家創立於 2006 年的線上麻將平臺。它有著完善的規則、專業的段位升級系統。目前,天鳳在全球有近33萬名麻將玩家,其中不乏有大量專業選手。

天鳳平臺上有兩種競技房間:一種為“特上房”,為四段以上所有玩家免費開放,該房間能達到的最高段位是十段;一種為“鳳凰房”,專為七段以上的人類付費玩家開放(不允許 AI 參與),該房間能達到的最高段位為十一段——“天鳳位”。

官方數據顯示,天鳳平臺自上線13年以來,全平臺曾經達到“天鳳位”的高手僅 13 人,達到十段的選手約有 180 位,現役的十段人類選手也僅有十幾位。

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/Suphx 以“大三元”役滿胡牌

AI打麻將,比下棋難多了

2019 世界人工智能大會期間,沈向洋公開稱,由微軟亞洲研究院研發的麻將 AI 系統 Suphx ,在日本專業麻將平臺“天鳳”上榮升十段。這是麻將領域中,AI 系統目前創造的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。”

與象棋、圍棋等棋類遊戲相比,麻將在對弈過程中,存在大量隱藏信息,具有高度的不確定性。因此,麻將的複雜度遠高於其他棋類,對AI技術有著特殊挑戰。

“打麻將,第一是海量的隱藏信息。微軟的做法是做‘先知教練’,可以看到所有牌打的時候應該是什麼樣,而你打的時候是沒有看到的,但有一個先知教練可以看到的,這個可以當訓練數據。”沈向洋說,其次,還有複雜的獎勵機制,因為打牌時不見得每一副都要贏,還有胡大一點還是胡小一點等等。這樣可以用全盤預測的方式,當然還有一個是巨大的狀態空間,所以還有自適應的決策,再加上深度強化學習,把所有的東西串起來。”

Suphx 在天鳳的公開房間“特上房”,與人類選手進行超過 5000 場對戰後,獲得“特上房”最高段位十段。研發團隊表示,遊戲中,Suphx 表現出了類人的直覺、預測、推理、模糊決策能力,以及大局觀意識

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟麻將遊戲的挑戰以及 Suphx 的核心技術

據瞭解,天鳳是一家創立於 2006 年的線上麻將平臺。它有著完善的規則、專業的段位升級系統。目前,天鳳在全球有近33萬名麻將玩家,其中不乏有大量專業選手。

天鳳平臺上有兩種競技房間:一種為“特上房”,為四段以上所有玩家免費開放,該房間能達到的最高段位是十段;一種為“鳳凰房”,專為七段以上的人類付費玩家開放(不允許 AI 參與),該房間能達到的最高段位為十一段——“天鳳位”。

官方數據顯示,天鳳平臺自上線13年以來,全平臺曾經達到“天鳳位”的高手僅 13 人,達到十段的選手約有 180 位,現役的十段人類選手也僅有十幾位。

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/麻將平臺“天鳳”

儘管目前Suphx 還沒有和天鳳級選手對決過,但一位天鳳級麻將玩家朝倉康心在社交媒體上表示,自己看了 Suphx 的比賽,它看起來很強大,似乎能輕而易舉地戰勝人類。

麻將AI,厲害在於能尋找隱藏信息

遊戲一直是人工智能研究的最佳試驗田,訓練遊戲 AI 的過程,可以不斷提升人工智能的算法,以及人工智能處理複雜問題的能力。麻將 AI 系統 Suphx 的技術突破,對於探索及擴展人工智能算法的邊界是非常有益的嘗試。

對此,微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士解釋道:

針對非完美信息遊戲——麻將,AI系統的基本思路是,在自我博弈的訓練階段,利用不可見的隱藏信息,引導AI模型的訓練方向。AI的學習路徑清晰後,當它接近完美信息意義下的最優路徑後,AI模型就能更深入地理解可見信息,從而找到有效決策依據。這就好像AI可以看到其他人的牌,但不是作弊。

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/Suphx 以“大三元”役滿胡牌

AI打麻將,比下棋難多了

2019 世界人工智能大會期間,沈向洋公開稱,由微軟亞洲研究院研發的麻將 AI 系統 Suphx ,在日本專業麻將平臺“天鳳”上榮升十段。這是麻將領域中,AI 系統目前創造的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。”

與象棋、圍棋等棋類遊戲相比,麻將在對弈過程中,存在大量隱藏信息,具有高度的不確定性。因此,麻將的複雜度遠高於其他棋類,對AI技術有著特殊挑戰。

“打麻將,第一是海量的隱藏信息。微軟的做法是做‘先知教練’,可以看到所有牌打的時候應該是什麼樣,而你打的時候是沒有看到的,但有一個先知教練可以看到的,這個可以當訓練數據。”沈向洋說,其次,還有複雜的獎勵機制,因為打牌時不見得每一副都要贏,還有胡大一點還是胡小一點等等。這樣可以用全盤預測的方式,當然還有一個是巨大的狀態空間,所以還有自適應的決策,再加上深度強化學習,把所有的東西串起來。”

Suphx 在天鳳的公開房間“特上房”,與人類選手進行超過 5000 場對戰後,獲得“特上房”最高段位十段。研發團隊表示,遊戲中,Suphx 表現出了類人的直覺、預測、推理、模糊決策能力,以及大局觀意識

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟麻將遊戲的挑戰以及 Suphx 的核心技術

據瞭解,天鳳是一家創立於 2006 年的線上麻將平臺。它有著完善的規則、專業的段位升級系統。目前,天鳳在全球有近33萬名麻將玩家,其中不乏有大量專業選手。

天鳳平臺上有兩種競技房間:一種為“特上房”,為四段以上所有玩家免費開放,該房間能達到的最高段位是十段;一種為“鳳凰房”,專為七段以上的人類付費玩家開放(不允許 AI 參與),該房間能達到的最高段位為十一段——“天鳳位”。

官方數據顯示,天鳳平臺自上線13年以來,全平臺曾經達到“天鳳位”的高手僅 13 人,達到十段的選手約有 180 位,現役的十段人類選手也僅有十幾位。

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/麻將平臺“天鳳”

儘管目前Suphx 還沒有和天鳳級選手對決過,但一位天鳳級麻將玩家朝倉康心在社交媒體上表示,自己看了 Suphx 的比賽,它看起來很強大,似乎能輕而易舉地戰勝人類。

麻將AI,厲害在於能尋找隱藏信息

遊戲一直是人工智能研究的最佳試驗田,訓練遊戲 AI 的過程,可以不斷提升人工智能的算法,以及人工智能處理複雜問題的能力。麻將 AI 系統 Suphx 的技術突破,對於探索及擴展人工智能算法的邊界是非常有益的嘗試。

對此,微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士解釋道:

針對非完美信息遊戲——麻將,AI系統的基本思路是,在自我博弈的訓練階段,利用不可見的隱藏信息,引導AI模型的訓練方向。AI的學習路徑清晰後,當它接近完美信息意義下的最優路徑後,AI模型就能更深入地理解可見信息,從而找到有效決策依據。這就好像AI可以看到其他人的牌,但不是作弊。

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟亞洲研究院院長洪小文博士

作為老少咸宜的“國粹”,麻將所運用的推理、決策能力,與人類真實且複雜的生活十分貼近。因此,研究麻將 AI 系統,對提升 AI 在現實環境中解決複雜問題的能力,的確具有重要意義。

遊戲,無形中訓練了 AI,也為 AI 提供了一個與人類“交流”的絕佳機會。可以預見,未來,AI會以意想不到的方式,融入我們的生活。

麻將AI的研究員,竟然不會打麻將

距離麻將AI取得十段的好成績,已過去兩個月。

當被問及接下來微軟的麻將 AI 會落地什麼應用場景時,洪小文也坦言,“研究成果太新,所以目前還沒有,不過有計劃,特別是對於此次突破中使用的強化學習技術

簡言之,當我們每做一個動作,都會影響到最後的結果。每做錯一次,下次再做時,便會加權少做這件事。這就是強化學習。”

"

“我看網上大家的評論為什麼麻將比圍棋難,你今天聽了我的演講可以跟你爸爸媽媽解釋一下。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋說,打麻將,隱藏空間變的非常大!

在 2019 世界人工智能大會期間的AI FOR ALL"二十一世紀的計算"學術研討會上,沈向洋詳解了為什麼AI麻將比跳棋、圍棋、象棋做起來更難。

從 AlphaGo、深藍、AlphaZero 到 Pluribus ,AI 系統已經會下象棋、下圍棋、打撲克。微軟做的這款能打麻將的AI Suphx ,到底有什麼不同之處>

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/Suphx 以“大三元”役滿胡牌

AI打麻將,比下棋難多了

2019 世界人工智能大會期間,沈向洋公開稱,由微軟亞洲研究院研發的麻將 AI 系統 Suphx ,在日本專業麻將平臺“天鳳”上榮升十段。這是麻將領域中,AI 系統目前創造的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。”

與象棋、圍棋等棋類遊戲相比,麻將在對弈過程中,存在大量隱藏信息,具有高度的不確定性。因此,麻將的複雜度遠高於其他棋類,對AI技術有著特殊挑戰。

“打麻將,第一是海量的隱藏信息。微軟的做法是做‘先知教練’,可以看到所有牌打的時候應該是什麼樣,而你打的時候是沒有看到的,但有一個先知教練可以看到的,這個可以當訓練數據。”沈向洋說,其次,還有複雜的獎勵機制,因為打牌時不見得每一副都要贏,還有胡大一點還是胡小一點等等。這樣可以用全盤預測的方式,當然還有一個是巨大的狀態空間,所以還有自適應的決策,再加上深度強化學習,把所有的東西串起來。”

Suphx 在天鳳的公開房間“特上房”,與人類選手進行超過 5000 場對戰後,獲得“特上房”最高段位十段。研發團隊表示,遊戲中,Suphx 表現出了類人的直覺、預測、推理、模糊決策能力,以及大局觀意識

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟麻將遊戲的挑戰以及 Suphx 的核心技術

據瞭解,天鳳是一家創立於 2006 年的線上麻將平臺。它有著完善的規則、專業的段位升級系統。目前,天鳳在全球有近33萬名麻將玩家,其中不乏有大量專業選手。

天鳳平臺上有兩種競技房間:一種為“特上房”,為四段以上所有玩家免費開放,該房間能達到的最高段位是十段;一種為“鳳凰房”,專為七段以上的人類付費玩家開放(不允許 AI 參與),該房間能達到的最高段位為十一段——“天鳳位”。

官方數據顯示,天鳳平臺自上線13年以來,全平臺曾經達到“天鳳位”的高手僅 13 人,達到十段的選手約有 180 位,現役的十段人類選手也僅有十幾位。

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/麻將平臺“天鳳”

儘管目前Suphx 還沒有和天鳳級選手對決過,但一位天鳳級麻將玩家朝倉康心在社交媒體上表示,自己看了 Suphx 的比賽,它看起來很強大,似乎能輕而易舉地戰勝人類。

麻將AI,厲害在於能尋找隱藏信息

遊戲一直是人工智能研究的最佳試驗田,訓練遊戲 AI 的過程,可以不斷提升人工智能的算法,以及人工智能處理複雜問題的能力。麻將 AI 系統 Suphx 的技術突破,對於探索及擴展人工智能算法的邊界是非常有益的嘗試。

對此,微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士解釋道:

針對非完美信息遊戲——麻將,AI系統的基本思路是,在自我博弈的訓練階段,利用不可見的隱藏信息,引導AI模型的訓練方向。AI的學習路徑清晰後,當它接近完美信息意義下的最優路徑後,AI模型就能更深入地理解可見信息,從而找到有效決策依據。這就好像AI可以看到其他人的牌,但不是作弊。

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟亞洲研究院院長洪小文博士

作為老少咸宜的“國粹”,麻將所運用的推理、決策能力,與人類真實且複雜的生活十分貼近。因此,研究麻將 AI 系統,對提升 AI 在現實環境中解決複雜問題的能力,的確具有重要意義。

遊戲,無形中訓練了 AI,也為 AI 提供了一個與人類“交流”的絕佳機會。可以預見,未來,AI會以意想不到的方式,融入我們的生活。

麻將AI的研究員,竟然不會打麻將

距離麻將AI取得十段的好成績,已過去兩個月。

當被問及接下來微軟的麻將 AI 會落地什麼應用場景時,洪小文也坦言,“研究成果太新,所以目前還沒有,不過有計劃,特別是對於此次突破中使用的強化學習技術

簡言之,當我們每做一個動作,都會影響到最後的結果。每做錯一次,下次再做時,便會加權少做這件事。這就是強化學習。”

為什麼AI麻將比圍棋、象棋更難?打麻將,隱藏信息的空間更大

圖/微軟亞洲研究院院長洪小文博士

“麻將AI也一樣,這有一點像人類,一件事情做決定後,結果是吃虧了,或者得了益處,就知道下一次如何做了,”洪小文接著說道。

其實,麻將 AI 項目,在微軟內部是如何孵化出來的,一直是個“謎”。據說,微軟做此研究的研究員並不會打麻將,還現學了日本麻將的規則(連日語都不會)。

在麻將 AI 上,作為微軟亞洲研究院院長的洪小文,似乎更多是帶著對科學的熱誠與信仰來看這件事。他說:“治理研究院,很特別。人是有自己的想法,你不能控制他,所以要信任他,要給他空間,這樣才會有創新。做研究時,研究員八成是沒有想過未來如何應用。但正是這種好奇心驅動,才推動了整個科研的發展。”

同時,沈向洋也表示,人工智能跟以前很多技術創新不太一樣。以前,很多技術創新只是體力的延伸,人工智能的創新是腦力的延伸,所以大家會很擔心。不過,微軟很早開始思考這個問題,在2016年的時候發佈了微軟人工智能的6條準則:第一條是公平,第二條是可靠和安全,第三條是隱私和保障,第四條是包容,第五條是透明,第六條是責任。沈向洋說,希望未來微軟每個人工智能的產品都能夠通過人工智能相關的道德倫理的審查,微軟也在推動,特別是和政府,相關的法律法規的一些討論。

"

相關推薦

推薦中...