前面
在兩個問題中,我們介紹了短序列比對軟件bwa和SOAPaligner在微生物測序分析中的應(yīng)用。本期,我們將介紹另一個常用的短序列比對軟件蝴蝶結(jié)。Bowtie是一種超快速的短序列比對工具,內(nèi)存消耗少,比對結(jié)果可以方便地應(yīng)用于后續(xù)的一系列分析。目前軟件有bowtie1和bowite2兩個版本,其中bowite2的使用最為廣泛。
01
Bowtie1和Bowtie2的主要區(qū)別
A) Bowtie1出現(xiàn)較早,所以對50bp以下的序列測序效果較好,而bowtie2主要針對50bp以上的序列測序。
b)領(lǐng)結(jié)2支撐對齊空
c)蝴蝶結(jié)2支持局部對齊或整體對齊
d)領(lǐng)結(jié)2對最長序列沒有要求,但領(lǐng)結(jié)1最長不能超過1000bp
02
安裝軟件
a)安裝蝴蝶結(jié)2
下載:http://sourceforge.net/projects/bowtie-bio/files/;例如bowtie2-2.1.0-source.
編譯:解壓下載的文件,讓終端解壓后進入一個目錄,比如bowtie2-2.1.0,運行“make”。如果編譯時沒有異常,編譯后單獨運行:chmod 777 bowtie2和。/蝴蝶結(jié)2;如果沒有問題,會出現(xiàn)bowtie2的使用信息
添加環(huán)境變量:查找隱藏文件”。profile "或類似文件,并在該文件后添加PATH,如:export PATH = $ PATH:/home/lib/program files/bow tie 2-2 . 1 . 0/
# #將安裝路徑添加到此處的路徑中;最后,注銷或運行源代碼。/profile,這樣bowtie2。0可以在任何當前目錄中使用。
b)安裝蝴蝶結(jié)1
下載:http://sourceforge.net/projects/bowtie-bio/files/;例如領(lǐng)結(jié)-1-0.0-src.
安裝和bowtie2一樣,最后環(huán)境變量可以用對應(yīng)的路徑替換;
03
bowtie1的使用
A.構(gòu)建參考文件(GENOME.fa):
bow tie-build GENOME . fa GENOME . fa;構(gòu)建數(shù)據(jù)庫可能需要幾個小時,建議在后臺執(zhí)行(nohup bow tie-buildgenome . fagenome . fa &:).
B.用法示例:
bow tie-f-a-m 20-v 1-al Reads _ aligned-un Reads _ unaligned-norc GENOME . fa Reads . fa Reads . bwt 2 & gt;日志
-f指定查詢文件采用fasta格式
-a保留所有比較結(jié)果
-m指定基因組比對的最大數(shù)量
-v最大允許不匹配數(shù)為[0-2]
- al可以映射到GENOME的讀數(shù),fasta格式
-無法映射到fasta格式的GENOME的讀數(shù)
- norc不輸出與負鏈匹配的結(jié)果;如果不想輸出匹配到正鏈的結(jié)果,請使用“- nofw”。如果未指定此選項,將輸出正鏈和負鏈結(jié)果
依次編寫GENOME索引文件、Reads文件、輸出結(jié)果文件Reads.bwt和日志文件。
04
bowtie2的使用
a
A.build index:bow tie 2-build genome . fasta參考數(shù)據(jù)庫索引
B.用法:bow tie 2[選項] *-x
示例:bow tie 2-x index-1示例sample2.r1.fq.gz,示例2 . R1 . FQ . gz-2示例sample2.r2.fq.gz,示例2.r2.fq.gz-ssample.sam-q
C.所需參數(shù):
-x <。bt2-idx>。bowtie2-build生成的索引文件的前綴。首先在當前目錄中搜索,然后在環(huán)境變量BOWTIE2_INDEXES中設(shè)置的文件夾中搜索。
-1 <。m1>。對應(yīng)雙端測序的文獻1。它可以是用逗號分隔的多個文件;多個文件必須匹配-2
-2 <。m2>。雙端測序?qū)?yīng)于文件2。
-U & lt;r>。非雙端排序?qū)?yīng)文件。它可以是由逗號分隔的多個文件。序列文件中的讀取長度可以不同。
-S & lt;點擊。以SAM格式生成的文件前綴。默認為輸入到標準輸出。
更多參數(shù):http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml
05
比較結(jié)果文件格式描述
輸出結(jié)果為SAM格式,如下圖所示。詳細的格式描述,請參考之前的問題。
領(lǐng)結(jié)官方文件:
http://bowtie-bio.sourceforge.net/index.shtml
謝云基因微生物研究室宋德強供稿
培訓(xùn)信息:[期待您的參與]謝云基因微生物信息研討會
1.《bow 短序列比對好幫手---Bowite的使用》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《bow 短序列比對好幫手---Bowite的使用》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/caijing/1607388.html