【6.4】hmmer

  • HMMER可以用来在数据库中搜索蛋白或DNA序列的同源物,并且做序列比对。HMMER可以仅仅用来在数据库中查询序列,但因为可以在做多重序列家族的比对而变得更加强大。

  • HMMER给替换,插入,删除突变设置了一个位置特异性评分系统的查询文件。HMMER框架是一个叫做“隐形马尔可夫模型”的概率性模型。

  • 跟BLAST,FASTA和一些的彼得序列比对和基于老的评分方法的数据库搜素相比,HMMER的目的是更准确和更能删掉院同源物,因为他强大的概率模型。

  • 在过去,这个优势是需要很强高的电脑计算能力的配置,在蛋白质和DNA搜索的过程中,他的速度比BLAST慢100倍。但现在的HMMER3.1在蛋白搜素上的速度跟BLAST差不多,同时在DNA搜索中也仅比BLAST慢5-10倍

一、安装

官网地址:http://hmmer.org/

HMMER3的安装

HMMER用来寻找同源序列数据库,做序列比对,它可用一条序列来寻找数据库,功能非常强大。

tar zxf hmmer-3.1b1.tar.gz 
cd hmmer-3.1b1 
./configure  --prefix /usr/local/hmmer-3.1b1  # 安装到/usr/local/hmmer-3.1b1
make  
make check
make install

cd easel;make install

修改环境变量:

export PATH=/usr/local/hmmer-3.1b1:$PATH  #(这个是针对bash而言的)

来检验是否安装成功

hmmscan -h 

二、使用

三、报错

3.1 报错1

./bin/hmmsearch --tblout example/NC_000913.tbl --domtblout example/NC_000913.domtbl --cpu 30 --cut_tc ./db/Pfam-A.hmm example/NC_000913.faa

Error: Unrecognized format, trying to open hmm file ./db/Pfam-A.hmm for reading

问题分析:

[sam@localhost Islander_software]$ ./bin/hmmsearch -h
# hmmsearch :: search profile(s) against a sequence database
# HMMER 3.0 (March 2010); http://hmmer.org/

[sam@localhost db]$ head  Pfam-A.hmm
HMMER3/f [3.1b1 | May 2013]

原来是pfam库和我的hmmsearch版本不匹配。解决办法是要么升级pfam,要么升级hmmsearch

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn