深扒微軟亞洲研究院MSRA

微軟亞洲研究院微軟微軟研究院微軟小冰人工智能微軟中國語音識別技術深度學習張亞勤亞洲 Pascal 蘋果公司 GitHub 百度技術李開復中國科學技術大學自然語言處理機器人沈向洋大數據洪小文 Windows 騰訊QQ 語音合成米聊麻省理工學院大學京東商城人機交互優酷土豆創新工場喬治·華盛頓 Windows 10 歷史有三AI 2019-06-21

01 簡介

微軟亞洲研究院，即Microsoft Research Asia（MSRA），是本系列中唯一一個非中國本土的研究院，但是因為它落地生根都是在中國，培養出大量優秀的華人學者，被稱為中國IT界的黃埔軍校。作為在世界上計算機視覺領域排名前三的研究中心，因此我們先介紹它，有官方公眾號“微軟研究院AI頭條”，官網鏈接https://www.msra.cn/，知乎鏈接https://www.zhihu.com/org/wei-ruan-ya-zhou-yan-jiu-yuan/activities，github鏈接https://github.com/msracver。

1998年7月，李開復加入微軟並在中國創建並領導微軟中國研究院，2001年11月，微軟中國研究院升級為微軟亞洲研究院，2004年，微軟亞洲研究院被MIT Technology Review評為全球最頂級的計算機科學研究院。

MSRA至今已超過20年，國內其他本土研究院還沒有幾個歷史比得上它的一半。

02 領導團隊

首任院長李開復，大家不能更熟悉了，讀書的時候在語音領域作出了開創性的貢獻，隨後活躍在工業界，讀大學的時候在學校見過本人一次，聽其演講很受鼓舞。身體得病前非常活躍，休息付出後現在是創新工場CEO，幫助年輕人創業，我輩偶像。

第二任院長張亞勤，也是微軟亞洲研究院的首任院長。12歲進入中國科技大學少年班，23歲的張亞勤獲得喬治華盛頓大學博士學位，現任百度公司總裁。

第三任院長沈向洋，微軟全球執行副總裁，目前是微軟核心管理層唯一的大陸華人高管，也是美國科技行業的華人最高職位者。

第四任院長洪小文，也是現任院長，微軟公司資深副總裁，曾任蘋果公司的Apple-ISS研究中心的技術總監。

除了以上這些人，還有湯曉鷗，何凱明等，基本上都是CV屆的歷史性人物，可自行了解，目前官網有它的組織架構，可以數數自己認識哪些人。

03 研究領域

MSRA的研究領域很多，有以下研究組

幾乎覆蓋了所有計算機應用領域，在大數據(城市計算)，智慧醫療，知識圖譜(微軟認知服務)，NLP(機器翻譯、實時語音翻譯、微軟小英、微信小冰)，計算機視覺等領域都建樹頗多。

04 研究成果

1.1 微軟小冰

微軟小冰，一個非常調皮的AI，想必很多人都調戲過。微軟小冰是一個領先的跨平臺人工智能機器人。目前，在下面微信、QQ、Windows 10、美拍、京東、米聊、米家、優酷等都可以使用。

目前已經到第6代了，如果你想初次瞭解人工智能能幹什麼，不如去好好了解一下。

1.2 微軟小英

沒錯，又是一個機器人，而且名字同樣麼麼噠。微軟小英是一款融合了語音識別、口語評測，自然語言處理、語音合成等人工智能技術而實現的智能人機交互服務，有同名官方公眾號。

口語練習，拍照翻譯，有它就夠了，隨時學習。

1.3 語音識別

在使用深度學習上，微軟首先其實是在語音上發力，在NIPS 2009 會議上，鄧力和 Hinton 聯合組織Deep Learning for Speech Recognition and Related Applications workshop，首次證明使用新方法訓練的深度神經網絡在大量語音識別基準上優於之前的方法，之後 2012 年發表了著名論文《Deep Neural Networks for Acoustic Modeling in Speech Recognition》，由 Hinton和鄧力合著。

下面這本書也是我看的第一本深度學習書，由鄧力和俞棟合著，都是MSRA的語音識別專家。由於語音不是我研究方向，就不做過多介紹，可以去用用Skype Translator，可以直接用不同語言做語音對話。

1.4 MS COCO數據集

大家都知道數據集的重要性，在深度學習圖像方向，如MNIST，CIFAR，PASCAL VOC，ImageNet，MS COCO都是具有里程碑意義的數據集，也是論文中評測方法經常使用的。

COCOCommon Objects in Context可以看出，這個數據集以場景理解為目標，特別選取比較複雜的日常場景，相比於pascal的建立是為了推進目標檢測任務，coco的建立則是為了推進自然背景下的定位與分割任務，很多方法在VOC，ImageNet上work，到了這裡就不行了的，關於數據集的重要性，可以去看我以前的一篇文章。「數據集」深度學習從“數據集”開始

1.5 ResNet

2015年何凱明，孫劍等人提出了ResNet網絡拿下了當年ImageNet幾大單元的冠軍，也被稱為殘差網絡，這是達到1000層以上的神經網絡。今天的計算機視覺模型，很少有不使用殘差連接的網絡了。

1.6 文本理解

微軟在今年年初提交的R-NET模型在SQuAD挑戰賽的EM值（Exact Match, 表示預測答案和真實答案完全匹配）上以82.650的最高分領先並率先超越人類分數82.304，這對於自然語言處理研究領域來說是一個重要的里程碑。

SQuAD挑戰賽被稱為機器閱讀理解界的ImageNet，由斯坦福大學自然語言計算組發起，它通過眾包的方式構建了一個大規模的機器閱讀理解數據集（包含10萬個問題），即將一篇幾百（平均100，最多800）詞左右的短文給標註者閱讀，隨後讓標註人員提出最多5個基於文章內容的問題並提供正確答案。

1.7 機器翻譯

MSRA的研究幾乎覆蓋所有智能計算方向而且都處於領先位置，對於機器翻譯這個任務也是。也是今年早期的時候，在通用新聞報道測試集newstest2017的中-英測試集上，達到了可與人工翻譯媲美的水平，注意，有許多的限定不用過於驚歎，但是仍然是比較大的突破。關於使用的對偶學習技術，可以自行關注。

1.8 CNTK

微軟認知工具集（Microsoft Cognitive Toolkit，CNTK）

https://github.com/Microsoft/CNTK

目前深度學習框架百花齊放，caffe，tensorflow，pytorch人盡皆知，微軟雖然沒有宣傳自家的CNTK深度學習框架，但是它在github上面也超過15000個star，不過據說使用成本高，反正我是沒用過，似乎更合適做語音，畢竟是語音組開發的。

1.9 MMDnn

MMdnn是一套能讓用戶在不同深度學習框架間進行轉換以及可視化的工作，包括Caffe、Keras、MXNet、Tensorflow、CNTK、PyTorch 和 CoreML等。

已經支持以下模型

1.10 母公司收購了Github

哈哈哈哈，這個鍋你背了吧MSRA！因為後面還有太多不知道寫什麼了，期待MSRA開源更多優秀的研究項目（包括數據集），看起來Microsoft Research Open Data是個好苗頭。

深扒微軟亞洲研究院MSRA

01 簡介

02 領導團隊

03 研究領域

04 研究成果

相關推薦