亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Blast使用詳解

系統(tǒng) 2344 0

Blast,全稱(chēng)Basic Local Alignment Search Tool,即“基于局部比對(duì)算法的搜索工具”,由Altschul等人于1990年發(fā)布。Blast能夠?qū)崿F(xiàn)比較兩端核酸或者蛋白序列之間的同源性的功能,它能夠快速的找到兩段序列之間的同源序列并對(duì)比對(duì)區(qū)域進(jìn)行打分以確定同源性的高低。

Blast的運(yùn)行方式是先用目標(biāo)序列建數(shù)據(jù)庫(kù)(這種數(shù)據(jù)庫(kù)稱(chēng)為database,里面的每一條序列稱(chēng)為subject),然后用待查序列(query)在database中搜索,每一條query與database中的每一條subject都要進(jìn)行雙序列比對(duì),從而得出全部比對(duì)結(jié)果。

Blast是一個(gè)繼承的程序包,通過(guò)調(diào)用不同的比對(duì)模塊,blast實(shí)現(xiàn)了物種可能的序列比對(duì)方式:

blastp:蛋白序列與蛋白庫(kù)做比對(duì)。

blastx:核酸序列對(duì)蛋白庫(kù)的比對(duì),先將核酸序列翻譯成蛋白序列(根據(jù)相位可以翻譯成6種可能的蛋白序列),然后再與蛋白庫(kù)作比對(duì)。

blastn:核酸序列對(duì)核算庫(kù)的比對(duì)。

tblastn:蛋白序列對(duì)核算庫(kù)的比對(duì),將庫(kù)中的核酸序列翻譯成蛋白序列,然后進(jìn)行比對(duì)。

tblastx:核酸序列對(duì)核算庫(kù)在蛋白級(jí)別的比對(duì),將庫(kù)和待查序列都翻譯成蛋白序列,然后對(duì)蛋白序列進(jìn)行比對(duì)。

Blast提供了核酸和蛋白序列之間所有可能的比對(duì)方式,同時(shí)具有較快的比對(duì)速度和較高的比對(duì)精度,因此在常規(guī)雙序列比對(duì)分析中應(yīng)用最為廣泛,可以毫不夸張的說(shuō),blast是做比對(duì)基因組學(xué)乃至整個(gè)生物信息學(xué)研究所必須掌握的一種比對(duì)工具。

?

使用:

blast的運(yùn)行分為兩個(gè)步驟:第一,建立目標(biāo)序列的數(shù)據(jù)庫(kù);第二,做blast比對(duì)。

1、運(yùn)行建庫(kù)程序formatdb:

建庫(kù)的工程是建立目標(biāo)序列的索引文件,所以程序是formatdb。formatdb處理的都是格式為 ASN.1和 FASTA,而且不論是核苷酸序列數(shù)據(jù)庫(kù),還是蛋白質(zhì)序列數(shù)據(jù)庫(kù);不論是使用Blastall ,還是Blastpgp,Mega Blast應(yīng)用程序,這一步都是不可少的。

主要參數(shù)的說(shuō)明:

      
        -i   輸入需要格式化的源數(shù)據(jù)庫(kù)名稱(chēng)  Optional



-p  選擇建庫(kù)的類(lèi)型,“T”表示蛋白庫(kù),“F”表示核算庫(kù),缺省值為“T”



      T – protein                    F – nucleotide               [T
      
      /F] Optional default =
      
         T



-a  輸入數(shù)據(jù)庫(kù)的格式是 ASN
      
      .1
      
        (否則是 FASTA)



      T – True
      
                             F - False                    [T/F] Optional default =
      
         F



-o  判斷是否分析序列名并建立序列名索引,缺省值為“F”。



      T – True  :  解析序列標(biāo)識(shí)并且建立目錄



      F – False :  與上相反



      [T
      
      /F] Optional                    default =
      
         F



其他參數(shù):



-l  : “-l  文件名”用來(lái)改變LOG文件的命名



-n : “-n  文件名”可以自定義生成的庫(kù)文件命名
      
    

?

命令示例:

      formatdb -i ecoli.fa -p F -o T
    

image

程序輸出:

如果建立的是核算庫(kù),“formatdb -i ecoli.fa”輸出為ecoli.fa.nhr、ecoli.fa.nin、ecoli.fa.nsq,三個(gè)文件,如果選擇了“-o? T”,還會(huì)同時(shí)輸出ecoli.fa.nsd、ecoli.fa.nsi、ecoli.fa.nni、ecoli.fa.nnd四個(gè)文件,一共七個(gè)。

蛋白庫(kù)和核算庫(kù)的輸出類(lèi)似,相應(yīng)的輸出文件為:ecoli.fa.nhr、ecoli.fa.nin、ecoli.fa.nsq和ecoli.fa.nsd、ecoli.fa.nsi、ecoli.fa.nni、ecoli.fa.nnd七個(gè)文件。

除了這個(gè)結(jié)果,程序還會(huì)輸出LOG文件(默認(rèn)為formatdb.log),里面記錄了運(yùn)行時(shí)間、版本號(hào)、序列數(shù)量等信息。

?

幾點(diǎn)需要注意的問(wèn)題:

1)、建庫(kù)以后,做blast比對(duì)的輸入文件就是建庫(kù)所得的文件db.seq.n**或者db.seq.p**,而不是原始的FASTA序列,也就是說(shuō),建庫(kù)以后,原始序列文件是可以刪除的。

2)、如果命令行中選擇了“-o? T”,并且目標(biāo)序列中好友gi號(hào)重復(fù)的序列名時(shí),程序會(huì)停止建庫(kù)并報(bào)錯(cuò)。

?????? 就是說(shuō)庫(kù)文件中不能出現(xiàn)重復(fù)的序列(標(biāo)志是序列號(hào),跟具體的序列沒(méi)有關(guān)系)。

3)、如果輸入序列不符合FASTA格式或者ASN.1格式,程序會(huì)自動(dòng)退出,并報(bào)錯(cuò)。

?????? [formatdb] ERROR: Could not open db.

4)、核酸序列可以用于建核算庫(kù)和蛋白庫(kù),但是蛋白序列不能用于建核算庫(kù),這個(gè)是顯然的,密碼子的問(wèn)題哦!

?

2、運(yùn)行比對(duì)程序blastall:

Blast的主程序是blastall。程序的輸入文件是query序列(- i參數(shù))而和庫(kù)文件(-d 參數(shù)),比對(duì)類(lèi)型的選擇(- p參數(shù))和輸出文件(- o 參數(shù))由用戶(hù)指定。其中“-p”參數(shù)有5中取值:

-p blastp:蛋白序列與蛋白庫(kù)做比對(duì)。

-p blastx:核酸序列對(duì)蛋白庫(kù)的比對(duì)。

-p blastn:核酸序列對(duì)核酸庫(kù)的比對(duì)。

-p tblastn:蛋白序列對(duì)核酸庫(kù)的比對(duì)。

-p tblastx:核酸序列對(duì)核酸庫(kù)在蛋白級(jí)別的比對(duì)。

這些元素就構(gòu)成了 blast 的基本運(yùn)行命令(以 blastn 為例):

      blastall  -i  query.fa  -d  database  -o  blast.out  -p  blastn
    

其中如果"-o"參數(shù)缺省,則結(jié)果輸出方式為屏幕輸出。

?

參數(shù):

僅僅運(yùn)行blast的基本運(yùn)行命令,得到的結(jié)果往往不能清晰準(zhǔn)確的表示出有用的信息。最大的問(wèn)題就是有太多的冗余,很多很短的比對(duì)都會(huì)出現(xiàn)在輸出結(jié)果中,導(dǎo)致結(jié)果雜亂無(wú)章。為了處理雜亂無(wú)章的比對(duì)結(jié)果,滿(mǎn)足各種比對(duì)需求,blast設(shè)置了很多參數(shù)來(lái)限制比對(duì)的范圍和輸出的形式。一下多數(shù)結(jié)果以blastn距離,如不做特殊說(shuō)明,這些參數(shù)適合于所有比對(duì)方式。

-e 參數(shù)

-e(value)參數(shù)是用來(lái)過(guò)濾比對(duì)較差的結(jié)果的,用“-e”參數(shù)指定一個(gè)實(shí)數(shù),blast會(huì)過(guò)濾掉期望值大于這個(gè)數(shù)的比對(duì)結(jié)果(就是說(shuō)這個(gè)值越小比對(duì)結(jié)果就越好)。

      blastall  -i  query.fa  -d  database  -o  blast.out  -p  blastn  -e 1e-10
    

通常情況下,對(duì)于不同物種之間的比對(duì),期望值設(shè)在1e-5左右即可;而對(duì)于同源性較高的物種或者同種的比對(duì),可以適度將期望值調(diào)的更小來(lái)過(guò)濾垃圾結(jié)果。比對(duì)同一物種cDNA和染色體的比對(duì),參數(shù)可用1e-10或更高。

-F 參數(shù)

-F(T/F)參數(shù)是用來(lái)屏蔽簡(jiǎn)單重復(fù)和低復(fù)雜度序列的。如果選“T”,程序在比對(duì)過(guò)程中會(huì)屏蔽掉query中的簡(jiǎn)單重復(fù)和低復(fù)雜度序列;選“F”則不會(huì)屏蔽。缺省值為“T”。

比較兩個(gè)結(jié)果,我們看出使用缺省參數(shù)的比對(duì)結(jié)果損失了一部分信息,得到的統(tǒng)計(jì)結(jié)果也

出現(xiàn)失真,期望值和 identity 都沒(méi)有反映出真實(shí)情況。有時(shí)較長(zhǎng)的重復(fù)序列甚至?xí)?dǎo)致比對(duì)終止。加了"-F F"就保證了比對(duì)結(jié)果的完整性。通常在大規(guī)模、低精度的比對(duì)中,往往用缺省參數(shù),這樣能避免程序把過(guò)多的時(shí)間浪費(fèi)在無(wú)意義的簡(jiǎn)單重復(fù)上,提高運(yùn)行速度;而在小規(guī)模、高精度的比對(duì)中,需要加上參數(shù)"-F F",保證比對(duì)的精確度和完整性。

-m 參數(shù)

“-e”參數(shù)能夠做到篩選適當(dāng)?shù)谋葘?duì)結(jié)果,但是即使如此,blast的輸出結(jié)果仍然非常龐大并且難以處理。為了精簡(jiǎn)輸出、節(jié)省存儲(chǔ)空間、實(shí)現(xiàn)更多功能并使結(jié)果易于處理,blast 提供了參數(shù)“-m (integer)”來(lái)設(shè)定輸出格式,可供選擇的值為 0~11 之間的整數(shù),缺省為 0。下面就通過(guò)實(shí)例逐個(gè)解析“-m”參數(shù)能夠?qū)崿F(xiàn)的輸出功能。

-m? 8 : 列表格式的比對(duì)結(jié)果。從左到右各列的意義依次是:query名/subject名/identify/比對(duì)長(zhǎng)度/錯(cuò)配數(shù)/空位數(shù)/query比對(duì)起始坐標(biāo)/query比對(duì)終止坐標(biāo)/subject比對(duì)起始坐標(biāo)/subject比對(duì)終止坐標(biāo)/期望值/比對(duì)得分

在 m8 格式中通過(guò) subject 的比對(duì)起止位置可以判斷出序列的比對(duì)方向。判斷方法就是:query和subject的起始和終止坐標(biāo)是否一致增減。

Blast使用詳解


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 国产日韩欧美综合一区二区三区 | 在线观看亚洲精品专区 | 99热这里只有精 | 涩涩虎| heyzo在线播放4k岛国 | 欧美va亚洲va在线观看蝴蝶网 | 亚洲爱婷婷色婷婷五月 | 亚洲精品久久激情影院 | 久久国产免费一区二区三区 | 亚洲欧美另类专区 | 色综合久久久久久久久久久 | 国产成人高清亚洲一区久久 | 奇米777视频二区中文字幕 | 国产大学生一级毛片绿象 | 美国黄色大片 | 亚洲图片 中文字幕 | 91孕妇精品一区二区三区 | a级毛片免费完整视频 | 99资源| 久久精品亚洲牛牛影视 | 久久性 | 国产成人亚洲精品一区二区在线看 | 99视频在线国产 | 9966久久精品免费看国产 | 日日摸夜夜爽 | 四虎国产精品永久地址49 | 四虎影永久在线高清免费 | 一区二区三区在线 | 日本 | 一区二区三区高清 | 久久毛片免费看 | 欧美激情一区二区 | 精品久久久久久久99热 | 亚洲妖精天堂 | 久久国产影视 | 亚洲综合五月天 | 免费观看一级毛片 | 99久久免费费视频在线观看 | 日韩亚洲欧美一区二区三区 | 亚洲久久在线观看 | 久久99精品综合国产首页 | 久久九九 |