适用于Windows系统的hmmer软件可以安装吗?
来源:Excel办公网
时间:2024-02-04 17:50:51 316浏览 收藏
今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《适用于Windows系统的hmmer软件可以安装吗?》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!
windows系统能不能装hmmer软件
hmmer下载与安装
对于Mac OS/X, Linux, UNIX系统,用源代码编译安装:
% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % make check
windows系统,直接下载二进制压缩包,解压就可以使用。
hmmer包含的程序
phmmer: 与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;
>phmmer tutorial/HBB HUMAN uniprot sprot.fa
jackhmmer: 与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;
>jackhmmer tutorial/HBB HUMAN uniprot sprot.fa
hmmbuild: 用多重比对序列构建HMM模型;
hmmsearch: 使用HMM模型搜索序列库;
hmmscan: 使用序列搜索HMM库;
hmmalign: 使用HMM为线索,构建多重比对序列;
>hmmalign globins4.hmm tutorial/globins45.fa
hmmconvert: 转换HMM格式
hmmemit: 从HMM模型中,得到一个模式序列;
hmmfetch: 通过名字或者接受号从HMM库中取回一个HMM模型;
hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;
hmmstat: 显示HMM数据库的统计信息;
使用HMM模型搜索序列数据库
使用hmmbuild构建HMM模型,输入为Stockholm格式或者FASTA格式的多重比对序列文件(如:tutorial/globins4.sto),命令如下:
>hmmbuild globins4.hmm tutorial/globins4.sto
globins4.hmm为输出的HMM模型
使用hmmsearch搜索蛋白质序列数据库,蛋白质序列数据库为FASTA格式,命令如下:
>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out
globins4.out为输出的结果文件,如下:
*示例使用官方教程中的示例
使用蛋白质序列搜索HMM数据库
构建HMM数据库,HMM数据库是包含多个HMM模型的文件,可以从Pfam、SMART、TIGRFams下载,也可以自己由多重比对序列集中构建,如:
>hmmbuild globins4.hmm tutorial/globins4.sto
>hmmbuild fn3.hmm tutorial/fn3.sto
>hmmbuild Pkinase.hmm tutorial/Pkinase.sto
>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam
使用hmmpress格式化数据库,包括压缩以及创建索引,命令如下:
>hmmpress minifam
这个步骤可以很快的执行完成,输出的内容如下:
Working… done.
Pressed and indexed 3 HMMs (3 names and 2 accessions).
Models pressed into binary file: minifam.h3m
SSI index for binary model file: minifam.h3i
Profiles (MSV part) pressed into: minifam.h3f
Profiles (remainder) pressed into: minifam.h3p
使用hmmscan搜索HMM数据库,命令如下:
>hmmscan minifam tutorial/7LESS_DROME
hmmer软件怎么将fasta格式文件转换为sto格式
这问题我也遇到了,网上找半天没找到合适的方案,于是自己写了一个,代码如下
import glob # 都是标准库的东西
import os
# 把你想建hmm的fasta文件(比对好的)和本程序放在同一个文件夹里,然后运行本程序直接跑hmmbuild
os.chdir(os.path.dirname(__file__))
fs = glob.glob('*.fasta') # 获取每个fasta文件,如果你的fasta文件里有不是.fasta后缀名的,可以改这里,或者直接改成'*.fa*'
for f in fs:
hmm = os.path.splitext(f)[0] + '.hmm'
stockholm = os.path.splitext(f)[0] + '.sto'
with open(f, 'r') as fhandle: # 这个是读fasta文件用的,把所有fasta文件都保存到列表里
fastas = ['>' + tmp.replace('\n', '\r', 1).replace('\n', '').replace('\r', '\n') for tmp in tuple(filter(None, (fhandle.read().split('>'))))]
for i in range(len(fastas)):
fastas[i] = fastas[i].split('\n')
fastas[i][0] = fastas[i][0].split()[0][1:10]
tmp = []
for j in range(len(fastas[i][1]) // 80 + 1):
tmp.append(fastas[i][1][80 * j : 80 * j + 80])
fastas[i][1] = tmp
with open(stockholm, 'w') as out: # 这里在写sto文件
out.write('# STOCKHOLM 1.0\n\n')
for j in range(len(fastas[0][1]) - 1):
for i in range(len(fastas)):
out.write('% -12s%s\n' % (fastas[i][0], fastas[i][1][j]))
out.write('\n')
for i in range(len(fastas)):
out.write('% -12s%s\n' % (fastas[i][0], fastas[i][1][-1]))
out.write('//')
os.system('hmmbuild --amino %s %s' % (hmm, stockholm)) # 这里在跑hmmbuild,你可以自行修改里面的参数
如何自学生物信息学
1,从现有的生物信息学工具开始,要熟悉如何利用先用的软件、网络服务器、数据库等等,为生物研究服务,不要做重复工作,能用现成的就不自己开发。
2,熟悉命令行的操作系统,DOS,Linux,可以编写简单的shell;进而能安装命令行级的程序,跑一些常规的流程。要学习如何寻找和安装软件,这是最重要也是最基本的技能。其实很多问题,如果找到合适的软件包,都是迎刃而解的。
3,熟悉一种简单的脚本语言,个人推荐用python,具体原因可以见我的帖子。在没有现成工具时,或需要数据格式转换时,小的脚本是非常有用的。一般的应用无需自己写太多的代码,要相信我们通常遇到的问题,别的高手可能早就遇到了,所以网络上有大量的工具包。至于更多的编程语言,一门精则门门通,R,perl等都是类似的。
4,熟悉简单的算法和数据结构的知识,这样就可以理解很多程序的内在机制,进而知道它们的优点和缺点,对自己写程序也有帮助。有精力的话,进而学习统计、机器学习等。。
5,在自己的生物领域内扩展,调研,分析,开发。
今天关于《适用于Windows系统的hmmer软件可以安装吗?》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
135 收藏
-
156 收藏
-
364 收藏
-
216 收藏
-
448 收藏
-
199 收藏
-
135 收藏
-
214 收藏
-
367 收藏
-
305 收藏
-
331 收藏
-
288 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习