'18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達'

"


"


18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

【新智元導讀】近日,美國統計學會授予59位成員ASA Fellow稱號,有18位華人獲此殊榮。其中,美國禮來製藥公司高級研究顧問付灝達成為100年來工業界最年輕的華人fellow。一起來看看他的故事。

美國統計學會(American Statistical Association,簡稱ASA),是全美最主要的為統計學以及相關專業所設立的組織機構。其於1839年波士頓成立,是美國曆史第二悠久的迄今仍在運作的專業組織。

近日,美國統計學會(American Statistical Association,簡稱ASA)授予59位成員ASA Fellow稱號,有18位華人獲此殊榮,其中,美國禮來製藥公司(Eli Lilly and Company)高級研究顧問Haoda Fu(付灝達)成為100年來工業界最年輕的華人fellow。

"


18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

【新智元導讀】近日,美國統計學會授予59位成員ASA Fellow稱號,有18位華人獲此殊榮。其中,美國禮來製藥公司高級研究顧問付灝達成為100年來工業界最年輕的華人fellow。一起來看看他的故事。

美國統計學會(American Statistical Association,簡稱ASA),是全美最主要的為統計學以及相關專業所設立的組織機構。其於1839年波士頓成立,是美國曆史第二悠久的迄今仍在運作的專業組織。

近日,美國統計學會(American Statistical Association,簡稱ASA)授予59位成員ASA Fellow稱號,有18位華人獲此殊榮,其中,美國禮來製藥公司(Eli Lilly and Company)高級研究顧問Haoda Fu(付灝達)成為100年來工業界最年輕的華人fellow。

18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

美國統計學會是全美最主要的為統計學以及相關專業所設立的組織機構,於1839年波士頓成立,至今已有近180年的歷史,是世界上最大的數學科學組織,擁有眾多會員。

ASA Fellow評選制度也已有一百多年的歷史了,根據官方資料,有0.33%的會員會被選為ASA Fellow。當選人需要對統計領域有長期的傑出貢獻。每年每個ASA Fellow可以提名最多兩名候選者,然後提交申請材料,其中包括其他至少三名ASA Fellow推薦信。推薦材料與推薦信提交美國統計學會,委員會根據候選者論文質量,對統計屆貢獻等標準進行評估。

擁有5個核心背景的斜槓青年

"


18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

【新智元導讀】近日,美國統計學會授予59位成員ASA Fellow稱號,有18位華人獲此殊榮。其中,美國禮來製藥公司高級研究顧問付灝達成為100年來工業界最年輕的華人fellow。一起來看看他的故事。

美國統計學會(American Statistical Association,簡稱ASA),是全美最主要的為統計學以及相關專業所設立的組織機構。其於1839年波士頓成立,是美國曆史第二悠久的迄今仍在運作的專業組織。

近日,美國統計學會(American Statistical Association,簡稱ASA)授予59位成員ASA Fellow稱號,有18位華人獲此殊榮,其中,美國禮來製藥公司(Eli Lilly and Company)高級研究顧問Haoda Fu(付灝達)成為100年來工業界最年輕的華人fellow。

18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

美國統計學會是全美最主要的為統計學以及相關專業所設立的組織機構,於1839年波士頓成立,至今已有近180年的歷史,是世界上最大的數學科學組織,擁有眾多會員。

ASA Fellow評選制度也已有一百多年的歷史了,根據官方資料,有0.33%的會員會被選為ASA Fellow。當選人需要對統計領域有長期的傑出貢獻。每年每個ASA Fellow可以提名最多兩名候選者,然後提交申請材料,其中包括其他至少三名ASA Fellow推薦信。推薦材料與推薦信提交美國統計學會,委員會根據候選者論文質量,對統計屆貢獻等標準進行評估。

擁有5個核心背景的斜槓青年

18位華人學者當選美國統計學會會士 專訪最年輕華人fellow付灝達

付灝達在河北廊坊長大。高中的時候,付灝達非常喜歡數學,積極參加數學競賽,他也很喜歡寫程序,還參加了信息學奧林匹克。

用付灝達自己的話說:“一方面我對數學很感興趣,另一方面我的父親做一些關於統計方法的應用, 他對我影響很大,他說未來各種決策都需要基於數據,學統計很有前途。”

1998年,付灝達考入南開大學數學科學學院概率統計系。本科畢業後,付灝達考取託福和GRE並申請美國的獎學金,鑑於當時數學基礎課與統計課成績很不錯,申請的大部分學校都拿到了獎學金,10多個offer在手,他最後選了University of Wisconsin – Madison的統計系。當年,UW-Madison統計系在全美排名前三。

Madison是美國北方一座小城,依山傍水,非常漂亮,唯一的美中不足就是冬天很冷。當時讀博士,系裡要求他們選其他系的課做為輔修,付灝達選了同一個樓裡的計算機系,這樣,不用在寒風中走很遠就能上輔修課了。

Madison計算機系也是美國計算機系傳統強系,付灝達就選了很多關於優化與機器學習的課程。優化算法是人工智能的核心,這對付灝達今後職業選擇很有幫助。

就這樣,一個具有數學、統計、計算機科學、優化算法、機器學習等核心背景的斜槓青年誕生了。

2007年,順利拿到統計博士學位與計算機專業輔修的付灝達進入美國禮來製藥公司研發部門

因為本身對算法感興趣,即便工作了付灝達也一直堅持做科研,發表了90多篇統計方法、人工智能、醫療領域相關論文。現在,付灝達負責公司人工智能與機器學習部門。

統計學P值真的有意義嗎?

今年3月,新智元報道過一篇《大學統計學白上了?800多科學家聯名反對“統計學意義”,P值該廢了》,在網絡中引起了很大的反響。文章號召科學家放棄追求 “統計學意義”,並且停止用統計學中常見的P值作為判斷標準。

統計學出身的付灝達也給出了自己的見解:首先,P值屬於統計推斷的一種方法。統計學研究的範圍很廣泛,包括如何收集數據(實驗設計)、如何估計、如何推斷。現在很多搞人工智能僅僅侷限在估計問題,比如找到分類函數、迴歸函數。進一步的統計推斷很有必要,這樣可以讓我們更好的瞭解我們學習到的推斷函數是否可靠。

在付灝達看來,無論是不是用P值,我們要更多的推廣與研究統計推斷的思想與方法在人工智能方面的應用。對於P值,應該具體情況具體分析。我們很多時候用P值來進行決策(Go/No-Go Decision)。這個時候有可能並不是最優的。我們在做一個決策的時候,最關鍵的是決策後的結果。比如進行一項投資,如果決定投資,有多少可能性成功,另外一個方面如果決定不投資,是否真的剩下錢而不是失去一個正確的機會。那這個時候陽性預測值(Positive Predictive Value)與陰性預測值(Negative Predictive Value)就與咱們所關心的問題更加相關。在這方面貝葉斯方法可能更加適合。P值是一種靠反繹法(Proof by Negation)的證明,是一種統計推斷方法,而不是唯一一種方法。比如在證明一個人有罪的時候,大家就先假定無罪,然後用事實推翻。很多時候是有效也是有用的。

人工智能其實就是統計學

統計學和人工智能究竟有什麼關係?

統計學是一門從數據中發現規律的學科,對人工智能算法至關重要。諾貝爾經濟學獎得主托馬斯·薩金特(Thomas J. Sargent)在於北京舉辦的世界科技創新論壇上表示:人工智能其實就是統計學。付灝達雖然不完全同意他的說法,但也認同確實很有一定的道理。

統計學對人工智能發展有過、有著決定性的貢獻。比如,現在很多機器學習數據競賽中(比如Kaggle Competition)基本上有兩個算法是最有效的,在非結構性數據中(比如圖像識別),深度學習算法比較有效,在結構性數據中,XGBoost算法非常成功,其實三分之二以上的獲獎結果中都用到了XGBoost算法。關於XGBoost算法發展歷史,其實就很好的詮釋了統計與機器學習算法的關係。

1990年左右,計算機科學家提出一個問題,能否用投票算法(majority voting)提高機器學習準確率。對這個想法直到1997年,才有人提出有效的方法AdaBoost, 雖然當時被看作最好的機器學習算法之一,但有的時候效果並不理想,大家也不知道為什麼。

直到4年後,三名統計學家發表了一篇論文,從原理上闡述了AdaBoost算法本質是可加模型(stagewise additive model)與指數損失函數(exponential loss function)的結合。這篇統計學家的文章提供了很好的理論支持與解釋。正是這樣,大家發現指數損失函數對極值敏感,而且可以有更好的方法改進學習速度。這就是Gradient Boosting Machine算法的由來。

後來又由計算機學家繼續提高算法效率,就能為了後來的XGBoost算法。統計學家使得Boosting算法發生了一個從技術到科學的一個飛躍。現在深度學習也在這個歷史的轉折點, 很多時候還沒有很好的理論支持,這也是深度學習繼續發展的屏障。還有很多領域人工智能與機器學習需要統計知識,比如對各種類型數據的分析,生存數據,recurrent events是很常見的數據,但都需要更好的機器學習算法的支持。因果分析(causal inference)也是一個很重要的領域。統計學家做出了很多貢獻與研究。統計推斷也可以幫助人們更好的瞭解算法的可信度。當然,統計學家也有很多要像計算機學家學習的地方。互相學習,學會跨界。

AI算法在醫療領域有很廣闊的應用前景

現如今,AI算法被不斷的運用在醫療領域,今年付灝達被評為ASA Fellow也是因為人工智能方面的貢獻。他感興趣的方向主要集中在這4點:自動控制理論,推薦系統,模式識別,增強學習。

推薦系統算法在各個領域將會有很深刻的影響,比如精準理療。現在可穿戴設備醫療設備,基因技術,EMR數據整合都可以更好更全面的獲得病人的數據 (Contextual Information)。我們獲得這些數據的最終目的是要產生Actionable Insights指導病人獲得更好療效(Better Outcomes)。

人工智能增強學習算法,就是一種算法學習如何在不同的情況下如何給出最優方案來提高療效。Alpha Go就是一種增強學習的算法,類似的算法也可以應用於醫療領域。這方面AI算法很有優勢,數據算法可以讓我們看到以前看不到的規律,進而能提供更好的個性化治療。同時也有很多挑戰,首先就是要更高質量的數據,所以需要各個學科的合作。

有些話要送給後來人

作為100年來工業界最年輕的華人fellow,付灝達謙稱是自己比較幸運,他將自己的經驗總結為3點:重視基礎,不斷學習,加強聯繫。

1、基礎知識對融會貫通很重要。比如前面談到優化算法,很多機器學習人工智能問題最後會變成優化問題,有很好的優化方面的知識,不僅會對應用更加得心應手,對理論瞭解也會更加深入。比如證明sparsity oracle property就會用到很多優化算法KKT條件的構造式證明。同樣,如果寫程序不瞭解低級語言(C/C++)也很難對高級語言(比如Python)理解的很透徹。很多人都不是很瞭解python list與native array到底有什麼差別。

2、保持一顆好奇心,不停的學習是非常重要的。Stanford著名心理學家Carol Dweck寫過一本書 “Mindset: The New Psychology of Success”。她反覆強調學習型心態的重要性。機器學習在人工智能領域發展速度很快,要不停的學習,去讀第一手論文才能最快的掌握新的方法與動向。好多時候,興趣是可以培養的,要學會培養自己的興趣。比如通過構造自己的專家朋友圈,就是一種很高效的培養自己興趣的方式。

3、加強聯繫、學會跨界。現代科學很多時候已經是跨界科學了。付灝達分享了最近讀的一本書——《人類簡史》,裡面講到了人類的三次革命,其中第二次是農業革命。人類社會從捕獵採集到了農業社會是個很大的進步。捕獵採集更多是個人與小團體的活動,農業需要大規模合作,是不同領域的合作。現代科學正在往這個方向發展(from hunting to farming)。比如人工智能領域,需要計算機專家、統計學家、需要數據。尤其在醫療人工智能領域,高質量數據對算法研究尤其重要。這就需要大規模合作,把自己放到一個有效的合作體系中,才能最有效的發揮價值。有效的合作就需要了解不同領域的知識,認識不同領域的人。

附:2019 ASA Fellows名單

Daniel W. Apley, Professor of Industrial Engineering and Management Sciences, Northwestern University

Huiman X. Barnhart, Professor of Biostatistics, Duke University

Derek R. Bingham, Assistant Professor, Simon Fraser University

Babette A. Brumback, Professor and Associate Chair, University of Florida

Ann R. Cannon, Watson M. Davis Professor of Mathematics and Statistics, Cornell College

Hua-Hua Chang, Professor, Purdue University

Jinbo Chen, Professor, University of Pennsylvania

Gerda Claeskens, Professor, KU Leuven

Keith N. Crank, Retired, Part-Time Consulting

Catherine M. Crespi, Professor, University of California at Los Angeles

Yingying Fan, Dean’s Associate Professor, University of Southern California

Michael P. Fay, Mathematical Statistician, National Institute of Allergy and Infectious Diseases

Haoda Fu, Senior Research Adviser, Eli Lilly and Company

Mulugeta Gebregziabher, Professor, Medical University of South Carolina

Michele Guindani, Professor, University of California at Irvine

Sebastien J-P. A. Haneuse, Associate Professor, Harvard T.H. Chan School of Public Health

Alexandra L. Hanlon, Practice Professor of Biostatistics, Virginia Tech

Miguel A. Hernan, Professor, Harvard University School of Public Health

Craig A. Hill, Senior Vice President, Survey, Computing, and Statistical Sciences, RTI International

Jianhua Hu, Professor, University of Columbia

Rebecca A. Hubbard, Associate Professor, University of Pennsylvania

Peter B. Imrey, Staff, Cleveland Clinic

Hongkai Ji, Professor, Johns Hopkins Bloomberg School of Public Health

Jiashun Jin, Professor, Carnegie Mellon University

Katerina Kechris, Professor, Colorado School of Public Health

Charles L. Kooperberg, Member and Head, Biostatistics Program, Fred Hutchinson Cancer Research Center

Eric Benjamin Laber, Associate Professor, North Carolina State University

Michael Leo LeBlanc, Member, Fred Hutchinson Cancer Research Center

Bo Li, Professor, University of Illinois at Urbana-Champaign

Jia Li, Professor, Penn State University

Yehua Li, Professor, University of California at Riverside

Jeff D. Maca, Deputy Director, Biostatistics, Bayer Pharmaceuticals

Nandita Mitra, Professor, University of Pennsylvania

Samuel Mueller, Professor, University of Sydney

Lei Nie, Acting Deputy Director, FDA

Davy Paindaveine, Professor of Statistics, Université Libre de Bruxelles

Eun Sug Park, Senior Research Scientist, Texas A&M Transportation Institute

Judea Pearl, Chancellor's Professor of Computer Science and Statistics, University of California at Los Angeles

Igor Prünster, Professor, Bocconi University

Brian James Reich, Associate Professor, North Carolina State University

Jason A. Roy, Professor of Biostatistics, Rutgers University

Cynthia Rudin, Associate Professor of Computer Science, Duke University

Joseph L. Schafer, Mathematical Statistician, US Census Bureau

Jonathan Scott Schildcrout, Professor, Vanderbilt University

John Scott, Division Director, FDA

J. Michael Shaughnessy, Professor, Portland State University

David A. Stephens, Professor and Chair, McGill University

Tim Brian Swartz, Professor, Simon Fraser University

Sally W. Thurston, Associate Professor, University of Rochester

Alexander Tsodikov, Professor, University of Michigan

Pei Wang, Professor, Icahn School of Medicine at Mount Sinai

William J. Welch, Professor, University of British Columbia

David Christopher Woods, Professor of Statistics, University of Southampton

Min Yang, Professor, University of Illinois at Chicago

Xiangrong Yin, Professor, University of Kentucky

Menggang Yu, Professor, University of Wisconsin-Madison

Lanju Zhang, Director and Research Fellow, AbbVie

Mu Zhu, Professor, University of Waterloo

Hui Zou, Professor, University of Minnesota

"

相關推薦

推薦中...