《自然》下期:火眼!科學(xué)家開發(fā)了一個基于病理切片的人工智能系統(tǒng)。肺癌分型準(zhǔn)確率為97%,還能鑒定出6個常見的肺癌突變基因|科學(xué)發(fā)現(xiàn)
每個醫(yī)學(xué)生都應(yīng)該經(jīng)歷過看病理切片的痛苦。瞇眼看幾分鐘顯微鏡“找差異”真的是一種很大的折磨,但是如果我們沒有經(jīng)歷過這幾千種折磨,面對一些看起來特別像的腫瘤就不得不麻木了。例如,肺腺癌(LUAD)和鱗狀細(xì)胞癌(LUSC),兩者都屬于非小細(xì)胞肺癌,非常相似,但它們的臨床治療選擇卻大相徑庭。
幾十年來,醫(yī)生一直依靠訓(xùn)練有素的眼睛為病人尋找診斷依據(jù),但也許他們很快就能擺脫這種繁瑣的重復(fù)工作。
今天發(fā)表在《自然醫(yī)學(xué)》上的一項新研究帶來了紐約大學(xué)研究人員的最新成果。研究人員通過使用大量的數(shù)字病理切片圖像,對Google的深度學(xué)習(xí)算法盜夢空間V3進(jìn)行了重新訓(xùn)練。AI識別癌組織和正常組織的準(zhǔn)確率為99%,區(qū)分腺癌和鱗癌的準(zhǔn)確率為97%,遠(yuǎn)遠(yuǎn)領(lǐng)先于以往的研究![1]
更令人驚訝的是,該算法可以從切片圖像中識別肺癌中六種常見的基因突變,包括靶向治療的EGFR突變,準(zhǔn)確率為73%-86%。目前,一個數(shù)字切片在單個GPU上的檢測時間約為20秒。研究人員認(rèn)為,有了更新的技術(shù)和多個GPU的并行處理,每個切片的檢測時間只能是幾秒鐘!
真的很關(guān)鍵!
記者阿里斯托里·齊里戈斯(左)和納爾吉斯·拉扎維翁(右)
無論發(fā)病率還是死亡率,肺癌都是中國癌癥的頭號殺手,每年新增病例80萬,死亡近70萬。肺腺癌(LUAD)和肺鱗癌(LUSC)是絕大多數(shù)非小細(xì)胞肺癌中的兩種主要亞型[1],它們現(xiàn)有的治療方案,從常規(guī)化療到最新的靶向治療,完全不同[2],因此準(zhǔn)確區(qū)分亞型是關(guān)鍵。
病理組織切片是臨床常用的分類方法。但是,第一,在幾倍放大的顯微鏡下,數(shù)據(jù)量巨大。第二,癌細(xì)胞的形態(tài)可能沒有明顯的差異。如何解放醫(yī)生的眼睛,值得探討。
以前,一些研究人員使用隨機(jī)森林模型來開發(fā)病理切片的識別算法。腫瘤組織與正常組織的區(qū)分準(zhǔn)確率達(dá)到85%,亞型分型準(zhǔn)確率達(dá)到75%[2];另一項研究達(dá)到了83%的打字準(zhǔn)確率[3]。
紐約大學(xué)的研究人員選擇了Google的開源算法cutout v3[4],這是一種常用于分析視覺圖像的卷積神經(jīng)網(wǎng)絡(luò)(CNNs)。在谷歌手里,它可以識別1000多種物體,還被成功用于檢測皮膚癌[5]和糖尿病視網(wǎng)膜病變[6]。
那么AI怎么才能知道腫瘤組織和正常組織呢?用知識喂它!
研究人員從基因組數(shù)據(jù)共享(GDC)數(shù)據(jù)庫中獲得了1634幅數(shù)字化病理切片圖像,包括1176個肺腫瘤組織和459個正常肺組織,分為三組分別進(jìn)行訓(xùn)練、驗證和檢測。
考慮到整個數(shù)字切片中的數(shù)據(jù)量巨大,不能直接用于分析,研究人員進(jìn)一步將每個切片分為512×512像素的碎片圖像,根據(jù)切片大小從幾萬到幾千不等,平均每個切片約500個碎片。
培訓(xùn)過程
不得不說機(jī)器真的很智能。吃了這些知識,就成了病理學(xué)家。區(qū)分腫瘤組織和正常組織的準(zhǔn)確率達(dá)到99%,達(dá)到真正的專家水平;在區(qū)分正常組織、鱗狀細(xì)胞癌組織和腺癌組織時,準(zhǔn)確率達(dá)到96.8%!
研究人員邀請了三名病理學(xué)家與人工智能競爭,兩名專門研究胸部,一名是解剖專家??偟膩碚f,三位經(jīng)過嘗試和測試的專家的水平基本和AI一樣。50%有AI分類錯誤的切片也至少有一個專家搞錯了,說明腺癌和鱗狀細(xì)胞癌確實很難區(qū)分。此外,專家誤讀的切片有83%(45/54)能被AI正確分類,說明該系統(tǒng)具有很大的二次校正潛力。
紅色腺癌、藍(lán)色鱗狀細(xì)胞癌和灰色正常組織
AI除了精準(zhǔn),還有一個優(yōu)勢就是速度。一般情況下,醫(yī)生看一片需要幾分鐘。如果病理組織特別復(fù)雜,也許用免疫組化分析,診斷時間會超過24小時。
AI快多了。目前研究人員使用單個特斯拉K20m GPU進(jìn)行分析,每個數(shù)字切片平均分為500塊。分析只需要20秒左右。如果多個GPU并行運行,幾乎幾秒鐘就能產(chǎn)生結(jié)果!目前最大的障礙在于掃描系統(tǒng),放大20倍掃描一個切片需要2-2.5分鐘。但是FDA去年才批準(zhǔn)最新的超高速數(shù)字病理掃描儀[7],相信這不會是一個很難逾越的障礙。
研究人員還在紐約大學(xué)的獨立數(shù)據(jù)庫中進(jìn)行了測試,AI在83%-97%的情況下仍然可以正確分類??紤]到紐約大學(xué)保存的腫瘤樣本純度遠(yuǎn)低于GDC樣本,GDC樣本中含有更多的炎癥、血管、血凝塊、壞死區(qū)域等“噪聲”,保存樣本的方式也不同,研究人員認(rèn)為,只要數(shù)據(jù)量上來,準(zhǔn)確性也會提高。
在冰凍切片、FFPE樣本和活檢樣本中,準(zhǔn)確性良好
接下來,研究人員將嘗試訓(xùn)練人工智能從病理切片中“看到”突變,這是任何杰出的醫(yī)生都做不到的!
為了保證足夠的樣本量,研究人員只選取突變率高于10%的基因和腺癌樣本,包括320片和21.2萬個片段進(jìn)行訓(xùn)練和驗證,62片和4.4萬個片段進(jìn)行測試。AI經(jīng)過努力學(xué)習(xí),能夠識別肺癌中STK11、EGFR、FAT1、SETBP1、KRAS、TP53等6個基因的常見突變,準(zhǔn)確率在73%-86%之間。
再者,從數(shù)據(jù)上看,面對各種EGFR突變,免疫組織化學(xué)分析(IHC)只能檢測到兩種最常見的p.L858R和p.E746_A750del,AI也能檢測到更多的突變和缺失,如p.G719A、p.L861Q和p . E709 _ T710delinsD。
如前所述,EGFR已經(jīng)有了相應(yīng)的針對性治療方案;STK11存在于15-30%的非小細(xì)胞肺癌中,也是潛在的治療靶點[8,9];其他基因的突變也有一定的預(yù)后意義,與腫瘤的耐藥性和侵襲性有關(guān)。
特定精度數(shù)據(jù)
與亞型檢測一致,獨立樣本中突變檢測的準(zhǔn)確率略有降低,幅度與亞型檢測相近。研究人員認(rèn)為,這也是樣品制備帶來的差異,可以通過大數(shù)據(jù)訓(xùn)練來改善。
但研究人員仍然不知道AI如何從切片中判斷突變,只能猜測突變會帶來人類無法觀察到的極小變化。這就是機(jī)器學(xué)習(xí)的“黑箱”問題。有人認(rèn)為我不需要知道為什么,用好就好。一些反對的研究人員提出,如果你不知道為什么,你怎么能100%確定呢?
這是研究人員接下來要做的。未來幾個月,研究人員將使用更多不同來源的數(shù)據(jù)來訓(xùn)練AI,并積極考慮商業(yè)化用于早期臨床應(yīng)用。
想象一下,腫瘤測序需要幾天到幾周的時間。考慮到時間和費用,不能納入標(biāo)準(zhǔn)處理流程。而如果這項技術(shù)真的產(chǎn)生了,那么只要把病理切片一掃而空,就有可能得到可行的治療方案。豈不是很美?
AI也可以給出變異率
當(dāng)然,研究還處于比較基礎(chǔ)的階段。斯坦福大學(xué)癌癥研究所研究員丹尼爾·魯賓(Daniel Rubin)表示,說這項技術(shù)可以取代目前的診斷方法還為時過早,AI還需要更多的驗證工作。然而,這項研究確實向我們展示了人類與計算機(jī)合作的前景,也表明病理圖像中包含的信息遠(yuǎn)遠(yuǎn)超過了我們現(xiàn)在可以使用的范圍[10]。
本文記者Aristotelis Tsirigos在接受采訪時也表示,AI可以通過病理切片診斷肺癌亞型,并不意味著很快就可以取代醫(yī)生的工作,但目前AI可以幫助醫(yī)生減少閱讀錯誤[11]。
我希望這些基本任務(wù)在未來都可以交給機(jī)器來完成,這將真正解放醫(yī)生去處理越來越重要的臨床決策。
參考文獻(xiàn):
[1]顧德瑞,莫瑞拉,薩基拉羅普洛斯,等.利用深度學(xué)習(xí)從非小細(xì)胞肺癌組織病理學(xué)圖像進(jìn)行分類和突變預(yù)測[J].bioRxiv,2017。
[2]俞,金宏,等.全自動顯微病理圖像特征預(yù)測非小細(xì)胞肺癌預(yù)后.納特。社區(qū)。7, 12474 (2016).
[3]科斯拉維,p .,卡澤米,e .,伊米林斯基,m .,Elemento,O. & amp深度卷積神經(jīng)網(wǎng)絡(luò)能夠區(qū)分不同種類的數(shù)字病理圖像。EBioMedicine 27,317–328(2018)。
[4] Szegedy,c .,Vanhoucke,v .,Iofe,s .,Shlens,J. & amp重新思考計算機(jī)視覺的初始架構(gòu)。在IEEE計算機(jī)視覺和模式識別會議記錄,2818–2826(美國馬薩諸塞州波士頓,2015年)。
[5]Esteva,A .等.用深層神經(jīng)網(wǎng)絡(luò)對皮膚癌進(jìn)行皮膚科醫(yī)生級分類。自然542,115–118(2017)。
[6]Gulshan,v .等.在視網(wǎng)膜眼底照片中檢測糖尿病視網(wǎng)膜病變的深度學(xué)習(xí)算法的開發(fā)和驗證。J. Am。Med。協(xié)會316, 2402–2410 (2016).
[7]東葉步司;美國全載玻片成像設(shè)備監(jiān)管軌跡的現(xiàn)狀。J. Pathol。通知。8, 23 (2017).
[8]LKB1/STK 11的失活是肺腺癌中的常見事件。癌癥研究62,3659–3662(2002)。
[9]Shackelford,D. B .等人LKB1失活決定了非小細(xì)胞肺癌對代謝藥物苯乙雙胍的治療反應(yīng)。癌細(xì)胞23,143–158(2013)。
[10]https://www . wired . com/story/Google-ai-tool-identifies-a-transferences-from-an-image/
[11]https://medical research . com/cancer-_-腫瘤科/肺癌/人工智能-can-可靠地-診斷-特定類型的肺癌/44583/
1.《病理切片 基于病理切片的AI系統(tǒng)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《病理切片 基于病理切片的AI系統(tǒng)》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/shehui/1478411.html