點擊上面的“轉(zhuǎn)化醫(yī)學網(wǎng)”訂閱我們!
干貨|可靠|實用
納米孔測序技術是近年來出現(xiàn)的新一代測序技術。目前測序長度可達150kb。這項技術開始于20世紀90年代,經(jīng)歷了三大技術革新:第一,單分子DNA通過納米孔;第二,納米孔上的酶控制著測序分子的單核苷酸準確性;第三,單核苷酸的測序精度控制。目前,市場上被廣泛接受的納米孔測序平臺是牛津納米孔技術公司(ONT)的MinION納米孔測序儀。其特點是單分子測序,測序閱讀長度長(150kb以上),測序速度快,測序數(shù)據(jù)實時監(jiān)控,機器攜帶方便。本文重點介紹了MinION音序器的技術特點和應用領域。
1.MinION測序技術簡介
MinION納米孔測序儀的核心是一個流動池,有2048個納米孔,分為512組,由專用集成電路控制。測序原理如圖1a所示:首先,雙分子DNA連接到前導銜接子(藍色)、發(fā)夾銜接子(紅色)和拖尾銜接子(棕色);在測序開始時,前導銜接子將測序分子導入由酶控制的納米孔中,模板讀數(shù)(待測序的DNA分子)在前導銜接子之后通過納米孔。發(fā)夾銜接子是DNA雙鏈測序的保證,然后補體閱讀(待測序分子的互補鏈)通過納米孔,最后尾隨銜接子通過。上述測序方法中,模板讀取和互補讀取依次通過納米孔,兩兩比對合并成2dread在另一種測序方法中,不使用發(fā)夾接頭,僅測序模板讀數(shù),最終形成1D讀數(shù)。后一種測序方法具有較高的通量,但測序精度低于2D讀數(shù)。每個銜接子通過納米孔引起的電流變化是不同的(圖1c),這種差異可用于堿基識別。
第二,MinION與其他NGS測序平臺相比的優(yōu)勢
1.堿基修飾的檢測
納米孔測序技術可以檢測4種胞嘧啶堿基修飾,分別是5-甲基胞嘧啶、5-羥甲基胞嘧啶、5-甲?;奏ず?-羧基胞嘧啶。檢測準確率為92%-98%。
2.實時序列監(jiān)控
對于臨床實踐來說,實時獲取和分析DNA/RNA序列是非常重要的。對于傳統(tǒng)的NGS測序,很難做到這一點。但是對于MinION來說,相對容易實現(xiàn)。這不僅是因為MinION體積小,容易操作,還因為測序過程中單個分子通過納米孔,可以檢測和識別其當前的變化。這種設計允許用戶在排序過程中根據(jù)實時結(jié)果做出一些判斷。實時測序監(jiān)測對于MinION測序特定的靶序列有重要的應用(圖2):當DNA片段通過納米孔時,如果當前的變化趨勢與靶序列相同,它們就會通過納米孔。如果DNA片段和靶序列表現(xiàn)出不同的電流趨勢,就不能通過納米孔。這樣可以實現(xiàn)靶序列的富集,從而顯著減少測序時間,對于現(xiàn)場和即時診斷治療具有重要意義。
3.測量更長的讀數(shù)
使用MinION序列發(fā)生器,可以獲得300kb長的1D讀取。對于2D讀數(shù),可以獲得60kb的讀數(shù)。利用MinION測序儀產(chǎn)生的長讀數(shù),研究人員成功填補了人類參考基因組Xq24染色體上50kb的空白。該區(qū)域有多個CT47基因的串聯(lián)拷貝,研究人員用MinION的長讀判斷該區(qū)域有8個CT47基因拷貝(圖3)。
4.結(jié)構(gòu)變異檢測
NGS短序列的特征常常使結(jié)構(gòu)變異的檢測不準確。這個問題在癌癥檢測中尤其嚴重,因為癌癥組織中存在各種結(jié)構(gòu)變異。研究人員發(fā)現(xiàn),使用MinION測量的數(shù)百個拷貝的長讀數(shù)獲得的結(jié)構(gòu)變化結(jié)果比NGS平臺測量的數(shù)百萬個讀數(shù)獲得的結(jié)果更可靠。
5.核糖核酸表達分析
對于RNA表達分析,NGS平臺測得的短序列帶來的問題是需要對序列進行拼接才能獲得轉(zhuǎn)錄本。這給變剪切的研究帶來了麻煩。一般來說,NGS測序不能產(chǎn)生足夠的信息來區(qū)分不同形式的可變剪切。MinION定序器產(chǎn)生的長讀可以更好的解決這個問題。研究人員以果蠅的Dscam1基因為例,該基因有18612種可變剪切形式,MinION測序儀可以檢測到7000多種可變剪切形式,但這種結(jié)果不能通過NGS短序列測序獲得。
6.生物信息學支持軟件的開發(fā)
近年來,隨著生物信息學分析方法的發(fā)展,MinION測序讀數(shù)與參考基因組相比成功的比例從66%增加到92%。下面分別介紹各種工具的適用場景。工具概述見表1。
(1)基礎識別工具
Metrichor是ONT公司推出的基于隱馬爾可夫模型的基礎識別軟件。它的使用需要網(wǎng)絡連接。MinION注冊用戶需要獲得開發(fā)者賬號才能獲得軟件的源代碼。2016年初,兩個實驗室分別開發(fā)了Nanocall和DeepNano軟件。這兩個軟件都可以在本地運行,不需要網(wǎng)絡連接。納米球是基于隱馬爾可夫模型的,它可以在局部識別1D基底。DeepNano是基于遞歸神經(jīng)網(wǎng)絡框架,比隱馬爾可夫模型能獲得更準確的基礎識別。
(2)序列比對工具
傳統(tǒng)的NGS序列比對軟件不能滿足MinION序列比對的需要。這是因為MinION測序數(shù)據(jù)的錯誤率比較高,序列較長,所以即使調(diào)整參數(shù),也不能取得好的結(jié)果。在這種情況下,適合MinION測序數(shù)據(jù)的比對軟件應運而生。
邊際化是通過更好地估計MinION測序讀取測序的誤差源來提高與參考基因組的比較效率。通過評估檢測到的變化,發(fā)現(xiàn)它顯著提高了對準的精度。由于邊際設計是基于最后一個或BWA記憶的比較結(jié)果進行優(yōu)化的,結(jié)果的最終準確性取決于初始比較結(jié)果。
GraphMap是另一個比較MinION測序數(shù)據(jù)的軟件。它使用啟發(fā)式方法來優(yōu)化高錯誤率讀取和長讀取。一項研究表明,GraphMap比對的靈敏度與BLAST相當,其對讀取序列錯誤率的估計相當于邊際比對。
(3)從頭組裝工具
MinION測序數(shù)據(jù)不適合用NGS數(shù)據(jù)組裝的de Bruijn圖方法組裝,主要有兩個原因。第一,de Bruijn圖等方法依靠測序讀來精確拆分k-mer測序,但高錯誤率的MinION測序讀不能保證這一點;其次,de Bruijn圖的結(jié)構(gòu)不適合長讀。
MinION測序數(shù)據(jù)的長時間讀取更適合基于重疊共有序列組裝的Sanger測序周期。需要的是在組裝前對順序讀取進行糾錯。第一個基于這一原理的研究小組利用MinION數(shù)據(jù)組裝了一個完整的大腸桿菌K-12 MG1655基因組,序列準確率達到99.5%。他們使用的過程被稱為納米修正。首先,使用基于圖的貪婪偏序?qū)R器方法來糾正錯誤,然后使用Celera匯編器來匯編已糾正的讀數(shù),最后使用納米拋光來進一步改善匯編結(jié)果。
(4)單核苷酸變異檢測工具
參考等位基因偏差是一種傾向于在變異檢測中檢測較少變異的現(xiàn)象。當測序讀取的錯誤率很高時,這種現(xiàn)象尤其嚴重。
旁注中的MarginCaller模塊是一個由研究機構(gòu)開發(fā)的適用于MinION測序數(shù)據(jù)的變異檢測軟件。MarginCaller使用最大似然參數(shù)估計和多重測序讀取序列比對來檢測單核苷酸變異。
當計算機模擬測序誤差為1%時,測序深度為60倍,由marginCaller檢測的SNV具有97%的準確性和完整性。在另一項研究中,研究人員使用GraphMap方法檢測人類基因組的雜合變異,準確率可達96%。利用計算機模擬數(shù)據(jù),GraphMap還可以以高精度和完整性檢測結(jié)構(gòu)變化。
納米拋光也可以用來檢測突變。它使用事件級對齊算法。在該方法中,從參考基因組序列開始,依次評估參考基因組序列產(chǎn)生的電信號和測序讀數(shù)之間的相似性,然后依次修改參考基因組序列以產(chǎn)生共有讀數(shù)。直到共有讀取和測序讀取產(chǎn)生的電信號足夠相似,將共有讀取與參考基因組序列進行比較以獲得變異。該方法在埃博拉病毒研究中的準確率約為80%。
PoreSeq使用了類似于Nanopolish的算法。它可以使用較低深度的測序數(shù)據(jù)獲得高精度和完整性的SNV檢測。在一項研究中,PoreSeq在16X測序深度實現(xiàn)了99%的SNV檢測準確性和完整性,這與旁注相比顯著降低了測序深度。
(5)一致測序法
MinION測序數(shù)據(jù)的準確率目前只有92%。在低深度測序條件下,不能滿足SNV檢測相似單倍型和人類樣本的要求。解決這一問題的方法是滾圓放大法。其原理是在一個DNA分子上多次擴增一個片段,產(chǎn)生多個拷貝,這樣最終共有序列測序結(jié)果的準確率可達97%。
第三,MinION目前的應用領域
1.立即發(fā)現(xiàn)傳染源
NGS測序法可用于檢測醫(yī)院環(huán)境中的傳染源等病原體,而MinION測序法提供了全新的體驗。MinION在測序長度、可移植性和檢測時間上具有NGS無法比擬的優(yōu)勢。文獻記載,從樣品制備到病原體發(fā)現(xiàn)只需6小時,從樣品放置到病原體發(fā)現(xiàn)只需4分鐘。本文列舉了迄今為止用MinION測序儀進行研究涉及的物種,詳細描述了在西非爆發(fā)埃博拉病毒時,MinION測序法在病毒檢測中的重要作用。
2.非整倍體檢測
MinION在胎兒非整倍體的產(chǎn)前檢測中可以發(fā)揮重要作用。使用NGS平臺,通常需要1-3周才能得到結(jié)果。而使用MinION測序法,文獻報道僅需4小時。
3.Tai 空的應用
在Tai 空的飛行過程中很難發(fā)現(xiàn)細菌和病毒。大多數(shù)研究是將樣本帶回地球進行測序和鑒定。目前NASA準備使用MinION測序儀在國際空站進行病原體實時測序。
四.前景
1.PromethION
為了滿足研究人員對高通量測序的需求,ONT開發(fā)了一種臺式納米孔測序儀——PromeXiom。PromethION有48個流動池,可以獨立運行或并行運行。每個流動池包括3000個通道,每天產(chǎn)生6Tb測序數(shù)據(jù)。
2.序列讀取精度
目前MinION測序儀的測序準確率在92%左右。對于相似的病原菌和可變剪切挖掘,這樣的測序精度可以滿足需求。然而,對于臨床測試來說,讀數(shù)的準確率通常需要達到99.99%。因此,提到ONT需要優(yōu)化與測序相關的化學反應和堿基識別軟件。
此外,還提到了MinION測序法存在非隨機測序誤差。比如MinION不能處理6個核苷酸以上的均聚物測序,缺乏堿基修飾檢測的內(nèi)部參考訓練。如果能解決這兩個問題,共識測序的準確率可以達到99.99%以上。
3.讀取長度排序
目前MinION的測序長度達到150kb。未來可以預期其測序長度會有很大的提高。
4.核糖核酸直接測序
逆轉(zhuǎn)錄和聚合酶鏈反應擴增會導致大量核糖核酸信息的丟失,因此ONT和一些研究機構(gòu)正試圖利用納米孔技術進行核糖核酸直接測序。前人的研究為此奠定了基礎。比如研究表明單通道和固態(tài)納米孔可以用來檢測tRNA,納米孔可以檢測DNA和tRNA的堿基修飾。
5.單分子蛋白質(zhì)測序
目前,質(zhì)譜是一種很好的蛋白質(zhì)組分析技術,但在靈敏度、準確性和分辨率方面存在局限性。2013年,一項研究報告稱,酶介導的蛋白質(zhì)通過單通道納米孔。這項研究表明,可以檢測蛋白質(zhì)的序列特征。這些發(fā)現(xiàn)為蛋白質(zhì)納米孔測序奠定了良好的基礎。
參考文獻:
牛津納米孔迷你機器人:向基因組學社區(qū)交付納米孔測序
結(jié)束
點擊圖片了解更多關于提交的信息!
1.《minion 干貨!全面解讀MinION納米孔測序技術及應用》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《minion 干貨!全面解讀MinION納米孔測序技術及應用》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/shehui/1619591.html