微軟人工智能技術助力智能醫療服務升級

人工智能 微軟 語音識別 微軟亞研 太平洋電腦網 2017-05-15

正在美國西雅圖舉行的2017 微軟Build 開發者大會上,微軟發佈了一系列全新人工智能技術和服務,切實體現了微軟普及人工智能(Democratizing AI),將人工智能帶給每個人的願景和行動力。微軟CEO 薩提亞·納德拉表示,在如今這個擁有近乎於無限計算能力、並且數據呈指數級增長的環境下,微軟專注於予力每一位開發者,幫助他們開發應用,讓他們享受到人工智能帶來的機遇,從而適應新的智能雲及智能邊緣計算時代。

無需作秀,創業企業Airdoc就切身體會到了微軟人工智能平臺的好處。

Airdoc是一家專注於以深度學習提升醫學診療效率的成長型企業,以平臺、算法、數據積累打造人工智能應用,幫助醫生提高診斷效率和準確率。歷經數年的積累,目前Airdoc在放射影像、腫瘤、皮膚科、B超及眼科等領域都獲得了突破並擁有實際的落地應用。例如,針對糖尿病併發症——糖尿病性視網膜眼底病變(DR),Airdoc可以協助醫生快速完成視網膜病變的篩查及分析,解決了傳統手段在DR早期確診率低的困境,從而有效地防止病患視覺的損失以及失明。

微軟人工智能技術助力智能醫療服務升級

提供基於深度神經網絡和機器學習的高實時性算法服務,是Airdoc服務背後的核心競爭力。然而,已在眾多醫療機構部署了深度學習算法的Airdoc還面臨大規模醫療數據和實時併發的需求,但市面已有的深度學習系統框架的性能已經很難滿足Airdoc在訓練和生產環境的高實時性需求。因此,當Airdoc創始人張大磊得知微軟推出了微軟認知工具包的時候,立刻興奮起來。“抱著試試看的心情”,張大磊給微軟開發者體驗部門發了電子郵件,詢問相關情況。

微軟認知工具包(Microsoft Cognitive Toolkit,曾用名為深度學習工具包CNTK,Computational Network Toolkit),是微軟研究院推出的一個用於深度學習的系統,能夠基於CPU 和 GPU高效、跨平臺地處理大規模、可投入應用的任務,並可同時支持 Windows 和 Linux 系統。事實上,2016年微軟實現了對話語音識別技術超越人類專業水平的突破,背後的功臣就是微軟認知工具包。此外,包括人工智能助理小娜(Cortana)和混合現實全息眼鏡HoloLens等微軟智能產品中的語音識別功能也都是基於微軟認知工具包實現的。

為了讓更多開發者能夠輕鬆開發出各種有趣的人工智能應用,微軟已經將微軟認知工具包開源,並於近期發佈了具有更強性能表現和學習能力的2.0版本。跟其它開源軟件相比,微軟認知工具包最突出的優勢在於它高效的計算性能,尤其在大規模、分佈式的機器學習方面有著卓越的表現,在加速完成學習任務的同時還可以保證模型的準確性。

正是因為微軟認知工具包的強大功能,使得Airdoc希望進行相關部署,以實現在多機多卡的分佈式訓練環境下,提升原有系統的整體性能。但Airdoc的應用服務此前是基於Caffe平臺的ResNext和GoogLeNet模型所構建的,因此係統的遷移工作成了一大難題。而且面對大量的醫療數據,向微軟認知工具包的遷移不僅需要平穩、迅速地進行,還需要確保相關工具的準確度。

在接到Airdoc需求的第一時間,微軟即刻行動,迅速成立了一支由微軟開發者體驗部門技術人員、微軟亞洲研究院研究員與在美國總部的微軟認知工具包團隊共同組成的虛擬技術支持小組,開啟了與Airdoc的緊密合作。在微軟北京辦公室一間30平米的會議室裡,平臺遷移技術支持小組的成員們交流了技術設想,並對每一個細節都進行了充分的討論。另一邊,位於美國總部的團隊也通過Skype for Business遠程參與。

微軟開發者體驗部門首席平臺技術顧問王啟霄表示:“自從與Airdoc創始人張大磊第一次接觸之後,微軟與Airdoc雙方的技術團隊就開啟了‘同吃住’般密切的交流。我們希望成為最瞭解Airdoc技術的團隊,只有這樣才能更好地探索解決問題的方法,並盡我們所能提供最佳的解決方案。”

若要實現向微軟認知工具包的平穩遷移,就必須要保證:第一,遷移後的算法模型在真實病患數據上跑出來的結果與原先模型完全一致;第二,計算效率不能降低。只有保證這兩個前提,遷移才算成功。對這項“時間緊,任務重”的工作,微軟的研究員和工程師們都投入了巨大的積極與熱情。

微軟人工智能技術助力智能醫療服務升級

雙方技術人員在微軟辦公室進行平臺遷移

第一天,在微軟開發者體驗部門詳細瞭解了Airdoc的原有模型結構以及訓練和評估兩個方面的模型數據之後,微軟亞洲研究院的研究員迅速針對模型編寫出了可滿足需求的轉化器(Converter),用於模型過渡,同時基於真實數據進行訓練。經過多輪的評估比較,研究員們欣喜地發現,遷移完全可行,這也讓大家對結果充滿了信心。

第二天,基於前一天的對比結果,在美國微軟認知工具包團隊的支持下,微軟亞洲研究院的研究員針對新模型的代碼進行了調整,並且與Airdoc合作將微軟認知工具包的代碼庫進行了重建和整合。一切都在有條不紊地推進。

第三天,微軟亞洲研究院的研究員相應地將轉化器進行了更新,並在當晚得出了一個令人振奮的結果:基於微軟認知工具包模型運行出來的數據結果與此前Caffe平臺模型的運行結果完全一致!

第四天,遷移工作全面結束,結果不僅達成了預期目標,更是超過了所有人的設想:運行數據的準確率與原有模型完全一致,且在微軟認知工具包上的GoogLeNet模型運行效率遠遠高於Caffe平臺;整體模型的運行效率提升了30%-40%。

“我一直相信微軟,相信微軟的技術。微軟技術平臺的可靠性、先進性毋庸置疑。兼容性和開放性更是為我們創造了更多可能。這次合作,僅僅用了不到四天的時間就實現了無縫銜接,太震撼了!”Airdoc創始人張大磊表示, “不過其中最讓我感動的,是微軟研究員和技術人員的科研熱情、協作精神。沒想到一封電子郵件,就開啟了雙方如此真心誠意的緊密合作。”

微軟人工智能技術助力智能醫療服務升級

Build大會期間,Airdoc創始人張大磊(右)與同事在微軟研究院

“普及人工智能”現已成為微軟各個部門的共識。從微軟研究院到微軟產品技術部門,從北京到西雅圖,從雲計算平臺到開發工具,人工智能正在成為微軟上下統一的目標,整個微軟正在全力推動實現這一願景。

“‘一個微軟’是我們秉持的公司理念,無論身在哪個時區,哪個部門,我們的員工都將團結協作,持續為個人用戶、技術開發人員和組織機構提供值得信賴的技術、服務和產品。”微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文表示。

相關推薦

推薦中...