在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

2016 年至今,全世界都在說,人工智能的拐點已來。從世界級的玩家谷歌、IBM,到瘋狂的投資人和創業者,都在進行搶點佈局,甚至軍備競賽。人工智能正在全球性地走向繁榮。

面對如此洶湧而來的人工智能浪潮,我們該如何看待?如何思考?動脈網作為這一浪潮的見證者,勢必要為它留下些什麼。

以下是報告部分內容的精編連載,實際內容更加豐富。

醫療大數據與人工智能產業報告II:醫學影像部分

現代醫學是建立在實驗基礎上的循證醫學,醫生的診療結論必須建立在相應的診斷數據上,影像是重要的診斷依據,醫療行業80%~90%的數據都來源於醫學影像。所以臨床醫生有極強的影像需求,他們需要對醫學影像進行各種各樣的定量分析、歷史圖像的比較,從而能夠完成一次診斷。

“人工智能+醫學影像”便是計算機在醫學影像的基礎上,通過深度學習,完成對影像的分類、目標檢測、圖像分割和檢索工作,協助醫生完成診斷、治療工作的一種輔助工具。

一、人工智能參與醫學影像診斷的方式

我們人工智能在圖像處理上的能力分為四類:影像分類、目標檢測、圖像分割和圖像檢索。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

醫學影像+人工智能的主要工作模式

我們以肝部疾病篩查為例,為大家闡述人工智能參與醫學影像的方式:

人工智能參與醫療過程首先要做的是獲得大量帶標註的醫學影像樣本,然後嘗試在其中找到一些關鍵點。比如說靠近肺和靠近肝的點,把關鍵點找到以後,結合肝的形狀鮮豔模型,設定一個初始化模型,再通過機器學習的方式學到邊界應該是怎麼樣的,病變是怎麼樣的,儘量的逼近它的邊界信息,再通過它的形狀特徵進行進一步的完善,最後獲得好的分割、篩查結果。這一過程便是人工智能對圖像的定位、分類和切割。

當我們將臟器分割、病變標記出來以後,就知道了這個部位有沒有患病,但是並不知道是患了什麼病,病情發展到了什麼程度。這個時候便需要對病理圖像進行分析,獲得輔助判斷依據。

病理分析是抽取疑似病變活體,放在顯微鏡上細胞形態分析的一種檢驗方式,是目前癌症的主要確診方式。數字病理圖像往往非常大,比如部分腫瘤病理圖像的尺寸達到了20萬×20萬像素,甚至40萬×40萬像素,有非常多的細胞需要分析。這是極大的分析量,醫生需要花費大量時間進行比對。隨著病理圖像包含的信息不斷增加,這一工作交給醫生來做開始變得不現實。

通過搭建神經網絡和利用深度學習算法,人工智能系統對包含各種病變形態細胞的病理庫進行大量訓練,獲得識別病變細胞特徵的能力。利用之前提到的分割算法,將細胞分割出來,通過大量比對,識別出細胞的病變形式及發展程度,為醫生做出最後診斷提供輔助依據。

醫院大數據裡85%左右的存儲容量被影像數據所佔據,現在的計算機可以識別結構化的文本數據和結構化的影像數據,且正在探索將功能性醫療圖像和結構性圖像相融合的方式,以獲得更好診療效果。將上述四項能力進行組合,便得到了人工智能在醫學影像上的具體應用場景。

二、人工智能為醫學影像帶來的改變

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

傳統方式和人工智能讀片的區別

三、人工智能+醫學影像在各領域的應用情況

人工智能在醫學影像領域目前的應用方向主要有三類,即疾病篩查、病灶勾畫、臟器三維成像。我們總結了人工智能在醫學影像方面主要覆蓋的方式以及主要使用的醫學影像類型,接下來,我們將仔細介紹人工智能在目前最為火熱的肺部篩查、糖網篩查、病灶勾畫、臟器三維成像和病理分析的應用情況。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

目前人工智能在人體醫療影像檢查中的作用

肺部篩查

人工智能進行肺部篩查的步驟為:使用圖像分割算法對肺部掃描序列進行處理,生成肺部區域圖,然後根據肺部區域圖生成肺部圖像。利用肺部分割生成的肺部區域圖像,加上結節標註信息生成結節區域圖像,訓練基於卷積神經網絡的肺結節分割器,然後對圖像做肺結節分割,得到疑似肺結節區域。找到疑似肺結節後,使用3D卷積神經網絡對肺結節進行分類,得到真正肺結節的位置和置信度。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

肺部疾病的影像篩查

糖網病篩查

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

糖網病主要症狀和檢查點

糖網病是“糖尿病性視網膜病變”的簡稱,是常見的視網膜血管病變,也是糖尿病患者的主要致盲眼病。

因為糖網病早期往往沒有任何臨床症狀,而一旦有症狀,病情已較嚴重,容易錯過最佳治療時機。所以糖網病的治療效果取決於治療是否及時。但是由於我國眼科醫生匱乏、居民重視程度不高,目前我國糖網病篩查的比例不足10%。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

我國糖網病發病率統計

糖網病篩查沒有大面積普及,一方面是因為醫生少、患者多,另一方面也存在一些客觀問題:

1.糖網病患者基數大,增長快,眼底設備的普及速度遠遠無法滿足需求。但是由於眼底設備昂貴,對於欠發達地區來說,大量採購並不現實。

2.隨著人們對糖網病篩查的重視以及國家的推進,眼底讀片的需求在增加,現有醫生的數量已經無法承擔這些工作量,導致醫生過勞,誤診、漏診的情況出現。另外,有經驗的醫生也並不願意一直做讀片的工作,他們希望有更多的時間做一些研究,出新的成果。這就導致醫生的數量更加緊張。

3.從事眼底讀片的醫生醫生培訓速度慢,存在差異性。也就導致不同的醫生讀片結果存在差異,致使診斷結果缺乏定量信息。

4.眼底讀片的數據管理與分析操作難度大,目前現狀是數據簡單存檔保存,但數據整理工作量大,因此讀片數據再次利用難度很大。

5.糖尿病患者往往因為高齡或罹患全身多系統併發症而出行不便,居住地又距地區內有足夠眼病服務能力的醫療機構較遠,在醫療機構等待或檢查時間又較長。

這些痛點主要原因是醫患供需不平衡導致的,而圖像識別是人工智能的專長,利用人工智能進行初步篩查,將大大改善目前糖網病篩查的現狀。

目前利用AI進行糖網病篩查的有以下9家公司:

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

人工智能糖網病篩查公司

靶區勾畫

靶區勾畫與治療方案設計佔用了腫瘤醫生大量時間。

病人被確診為腫瘤時大多是很恐慌的,身體上出現一點風吹草動都要去問醫生,而著名三甲醫院的腫瘤科通常是人滿為患,醫生除了要看病,還有科研等其他的工作任務,面對病患沒完沒了追問的時候,他們也會煩躁。

基層醫療機構腫瘤科醫生缺乏經驗,很多時候他們不敢輕易地為患者做治療方案,只能轉診,這又加劇了三甲醫院醫患的矛盾。所以利用新科技來提高醫生的效率,提高基層醫生治療水平與自信心是醫院很關心的事情。腫瘤治療過程中有兩項工作佔用了醫生大量的時間和精力,他們分別是靶區勾畫與治療方案設計。

放療是腫瘤三大治療方式中最為主流的治療方式(其他兩種是手術和化療),相對於診斷,治療更切入醫療的核心。每個腫瘤病人的CT圖像在200張左右,醫生在勾畫的時候,需要給每個圖片上的器官、腫瘤位置進行標註。這個過程按照傳統的方法要耗費醫生3-5個小時,找到腫瘤位置之後,醫生還需要根據腫瘤的大小、形狀等設計放射線的具體照射方案或者手術方案,這裡面也包含了不同位置不同的放射劑量。

如果一切順利,這位患者按照醫生最初的設計方案治療、好轉,最後康復。但是有些時候事與願違,第一個療程的治療由於靶區勾畫的不準確或者腫瘤的變化,導致治療無效(腫瘤組織減少小於30%),這個時候就需要更改治療方案,這就需要醫生重新為病人做勾畫,做方案。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

智能靶區勾畫軟件界面

我們國家腫瘤病人平均的等待時間為2-3周,醫生把時間放在一個病人身上,另一個人就要繼續等待,而這有可能會錯過最佳治療期。

靶區勾畫與治療方案設計具有一定的技術含量和需要醫生的經驗,但是其中包含了大量的重複工作,這些勞動密集型的工作是人工智能的專長,利用AI做這些事情將節約腫瘤醫生大量的時間。

臟器三維成像

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

臟器三維成像VR 演示

臟器三維成像是人工智能以核磁共振、CT 等醫學影像數據為基礎,對目標臟器定位分割,在電腦上顯示患者的內部情況。將病人的核磁共振、CT等病情影像數據輸入,在電腦上顯示患者的內部情況。醫生手中的探針指向哪裡,系統實時更新顯示,讓醫生對病人的解剖位置一目瞭然,使外科手術更快速、更精確、更安全。

自動重構器官真實的3D模型,實現醫生可通過專用設施,在增強現實的虛擬空間裡全方位直接觀看到患者真實人體結構的解剖細節,並可通過手勢和語音操作,實時進行器官和病變的立體幾何分析,精確測量目標結構的區位、體積、徑線、距離等參數,同時還可進行虛擬解剖作業、模擬手術切除、手術方案設計和手術風險評估。

病理分析

就算是經過嚴格訓練的病理醫生,他們對同一個患者的診斷也存在差異性,這種差異性是造成誤診的重要原因。例如,醫生對某些形式的乳腺癌和前列腺癌的診斷一致性低至48%。

醫生所做缺乏一致性並不奇怪,因為要想做出準確的診斷,醫生必須在大量的檢查信息上進行判斷。通常情況下,病理醫生負責審查病理切片上可見的所有生物組織,但是每個患者有很多病理切片,經過 40 倍放大後每個切片上都有 100 多億的像素(10+gigapixels)。想象一下要瀏覽 1000 多個百萬像素的圖片,還要為每個像素負責。這需要閱讀大量的數據,但是醫生的時間往往是不夠的。

為了解決有限的時間和診斷準確性的問題,將人工智能引入數字病理學研究成為了最好的辦法。人工智能可以縮短病理診斷的時間、提升診斷效率,最主要的是,它還能提供更加準確的診斷結果。人工智能的有效使用可以真正幫助病理醫生提升判讀水平,從精準診斷開始,真正實現精準醫療。

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

人工智能檢測腫瘤病理圖像結果

人工智能的參與給數字病理研究帶來了革命性的變化。谷歌公佈了他們利用深度學習算法輔助病理醫生工作確定病理圖像是擴散到淋巴結的乳腺癌還是擴展到臨近乳房的乳腺癌的情況。

目前國內已有多家企業將人工智能引入到了病理學的研究。

四、人工智能醫學影像公司調研

我們對目前人工智能醫學影像公司的運行情況進行了詳實的調研,得到了一張表。這張表充分反映了人工智能公司數據來源、數據量以及落地情況。但由於各個公司處於不同的發展階段,所採用的市場策略也不同,所以該數據只具有反映行業發展情況的價值,沒有對比分析的價值。

(具體表格請在報告中查看)

表裡的調查數據如下:

真陽性:要評估的技術判定為有病(陽性)且金標準也判定為有病的病例數(用a來表示)。

假陽性:要評估的技術判定為有病(陽性)而金標準判定為無病(陰性)的病例數(用b來表示)。

假陰性:要評估的技術判定為無病(陰性)而金標準判定為有病(陽性)的病例數(用c來表示)。

真陰性:要評估的技術判定為無病(陰性)且金標準也判定為無病的病例數(用d來表示)。

根據以上四個數值就可以得出這種方法的敏感性、特異性、陰性預測值和陽性預測值。

敏感性=a/(a+c)

敏感性也稱真陽性率,反應某種方法判定某病變的漏診率。敏感性一般以百分數表示,敏感性越高,則漏診率越低。用來篩查某種疾病的方法必須敏感性高,這樣才能減少漏診。

特異性= d/(b+d)

特異性也稱真陰性率,反應某種方法判定某病變的誤診率。特異性一般也以百分數表示,特異性越高,則誤診率越低。用來篩查某種疾病的方法並不一定要求特異性特別高,在一個合理的範圍即可接受。

從目前的發展情況來看,各個公司都很重視臨床數據,在訓練數據的時候都會用到臨床數據,即使在創業初期是用公開數據集下載的數據來訓練模型,後來隨著公司的發展,也逐步貼近臨床。

目前無論是哪個公司,涉及哪個疾病,他們的系統敏感性都超過了90%,這個數據是醫生最在乎的。敏感性差的話,沒有查出疑似結節,醫生有可能要承擔責任。浙江省人民醫院放射科主任龔向陽表示,特異性和敏感性兼顧起來是很難的,所以很多公司在開發系統時會優先考慮敏感性的問題,在保證敏感性的前提下,提高特異性。

需要說明的是,目前有些公司的敏感性和特異性數據有些是在特定數據集下的數據,而不是臨床數據。這些數據只能證明他們的研究進展,而不能對比。

同樣的,訓練數據各家公司也有不同,數據量大的公司,只能說明他們和醫院的關係很好,數據量並不完全代表他們的系統好快,而且數據質量、數據完整度、標註情況各家公司也不相同,此數據不可做比較。

五、該細分領域的人工智能問題

1.優化目標的定義,也就是說問題本身的定義如何

2.能否拿到足夠多的可用數據。

3.模型的可解釋性

六、“醫學影像人工智能+”的跨領域協作

醫學影像已經成為了人工智能在醫療領域最熱門的方向。我國醫療影像領域已經湧現了大批的人工智能創業公司,騰訊、京東等大公司也開始佈局,研究如何讓機器識別病灶,並判斷腫瘤的良惡性,但是大多數的公司現階段僅僅是利用影像信息作判斷。

動脈網此前採訪過一系列的醫生,他們表示利用機器識別病灶確實幫助醫生減少漏診,提高效率,但是判斷腫瘤的良惡性以及患者罹患哪種癌症,是需要結合臨床信息、病理信息甚至是基因測序來判斷的,而僅憑藉放射影像只可以識別腫瘤的位置、大小。

綜合下來,醫學人工智能合作研發的新形勢有兩種,一種是獨立研發、另一種是組建聯盟。他們的出發點不是像阿里、百度那樣組建一個全面的平臺,而是根據實際的臨床需求、醫院需求和公司需求自然形成的一種商業或研發模式。

“醫學影像人工智能+”這種概念就像“互聯網+”一樣,雖然目前的合作領域是臨床信息、基因檢測、病理信息等,但是未來一段時間它可以和更多醫療人工智能領域合作。而且以後也不僅侷限於以醫學影像人工智能為中心的合作方式,也有可能是各醫療人工智能領域的交叉合作。這種形式可以幫助醫學影像AI產品的落地,讓醫學影響AI產品更加的接近醫院、醫生的真實臨床場景,做好醫生的助手。

《2017醫療大數據和人工智能產業報告》全文目錄如下:

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

在人工智能參與最多的醫學影像診斷領域,這是一次完整的調研

相關推薦

推薦中...