glimmer基因预测软件|glimmer基因预测软件下载

简介

glimmer基因预测软件是时下互联网常用的教育教学软件之一，该软件绿色、安全、无毒，让你可以放心使用。aW0红软基地

使用说明

下面我们拿结核分枝杆菌H37RV的基因组来做下练习，Glimmer做基因预测一般需要2个步奏。aW0红软基地
首先是建立预测的模型，第二步是利用模型来对基因组进行基因预测。模型也叫训练集，也就是先让软件了解基因的一些特征，这样软件就能根据已知的信息，来推测未知的信息。aW0红软基地
建立模型采用build-icm程序来完成。build-icm的输入有三种。aW0红软基地
1、某基因组的已知信息；aW0红软基地
2、通过long-orfs产生的长的无重叠的orfs；aW0红软基地
3、高度相似的物种的基因。aW0红软基地
这里面我们选用自身作为训练集来作为模型。aW0红软基地
那么就使用long-orfs产生训练集，那么作为long-orf的训练集，我们首先要将输入文件格式化到一条。aW0红软基地
听到这里大家可能有些乱了。下面我们具体来演示一遍大家就明白了。aW0红软基地
首先我们将多条fasta文件合并成一条，用于long-orfs程序。aW0红软基地
这里面采用sed 命令。aW0红软基地
sed -e '/>/d' K12.fna |tr -d '\n' |awk 'BEGIN {print ">wholefile"}{print $0}' >wholefileaW0红软基地
这样就可以用作long-orfs的输入了。aW0红软基地
运行long-orfs产生无重叠的orfsaW0红软基地
long-orfs -n -t 1.15 $wholefile $tagname.longorfs 1>/dev/null 2>/dev/nullaW0红软基地
然后运行extract来提取训练集aW0红软基地
extract -t $wholefile $tagname.longorfs > $tagname.train 2>/dev/nullaW0红软基地
这样训练集就处理好了。aW0红软基地
产生训练集有收那种方法，这里面我们用的是第二种方法，通过long-orfs产生。aW0红软基地
如果有某基因组的已知基因，或者高度相似的物种基因不用以上三个步骤aW0红软基地
接下来我们运行bulid-icm通过训练集，来生产预测的模型，用于基因预测aW0红软基地
build-icm -r $tagname.icm < $tagname.train 1>/dev/null 2>/dev/nullaW0红软基地
最后我们就可以直接运行glimmer3来完成基因预测。aW0红软基地
glimmer3 -o50 -g110 -t30 [options]。aW0红软基地

软件说明

生成*.detail *.predictaW0红软基地
那么*.predict就是我们最终得到的预测基因文件，它其实只是一个列表，我们打开看一下。也是以“>"进行分割，aW0红软基地
基因的各列信息分别为：aW0红软基地
Column 1 预测基因编号，此编号和*.detail文件里编号一致。aW0红软基地
Column 2 基因的开始位置。aW0红软基地
Column 3 基因的结束位置。为终止密码子的最后一个碱基位置，也就是说包含终止密码子。aW0红软基地
Column 4 阅读框。aW0红软基地
Column 5 基因的“raw”分值。aW0红软基地

软件截图

glimmer基因预测软件 aW0红软基地

展开

教育学习

glimmer基因预测软件

使用说明

软件说明

相关介绍

软件截图