【5.4.2.3】mRNA-optimiser

一、简介

http://bioinformatics.ua.pt/software/mRNA-optimiser/

mRNA优化器是一种工具,可以重新设计基因信使RNA,以优化其二级结构,而不影响多肽序列。 该工具可以最大化或最小化分子的最小自由能(MFE),从而导致二级结构强度降低或增加。通过使用启发式算法寻找同义基因序列并选择具有最佳二级结构的基因序列来实现优化 。 使用相关的茎环预测算法对二级结构进行评估,该算法检查核苷酸序列中的简单茎环。 该算法经过微调,使其结果与RNA折叠的MFE评估高度相关。我们的结果表明,使用该方法可以使MFE平均增加40%以上。 而且,由于在优化时有降低核苷酸序列的GC百分比的趋势,因此开发的工具包括一个选项,可以保持野生型基因的GC含量。

二、下载安装

wget -c http://bioinformatics.ua.pt/EuGene/mRNAOptimiser/mRNAOptimiser.jar

java -jar mRNAOptimiser.jar

mRNA Secondary Structure optimizer (v1.0)
Paulo Gaspar, University of Aveiro, 2012
paulogaspar@ua.pt

Usage: mRNAoptimizer [options] nucleotideSequence

Example usages:
        mRNAoptimizer GUCACGUACUGACGUACUGCAGUCA
        mRNAoptimizer -f sequence_file.txt
        mRNAoptimizer -f sequence_file.txt -b 100 -e 300 -o output.txt

Options:

-f inputFile      Give input sequence as a file.

-o outputFile     Output results to file (Default = standard output).

-b index          Index of the first nucleotide of the start codon (default=1)

-e index          Index of the last nucleotide of the stop codon
                  (default = sequence size)

-d type           Optimization type: 0 to maximize MFE (default)
                                     1 to minimize MFE

-t maxTime        Maximum optimization time, in minutes (default = no limit).

-i iterations     Number of iterations the algorithm runs. The more iterations
                  the longer it will take, but results will usually be better
                  (default = 4000)

-c codingTable    Genetic Code Table to use(default=1) according to this list:
                  http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi

-q                Don't output anything else than the resulting sequence.

-g                Try keeping the same GC content as the original sequence.
                  With this option, the MFE optimization won't be as great.

三、用法

我的使用:

java -jar ../mRNAOptimiser.jar -f test.fa  -o result2.tsv -i 10000

[sam@g02 test]$ cat result2.tsv
Sequence size: 75
GC content initial percentage: 57.33%
Initial pseudo-energy: -968.73
Using the Standard genetic code
Optimisation started...
Done!
GC content final percentage: 38.67%
Final pseudo-energy: -555.85
Final optimised sequence:
AUAGCAGUAGCCUGGUACCAACAAAA******CUACUAAUAUACUCAGCAUCAUACAGAUAC

四、报错

五、讨论

* 可以作为优化的一个手段,但这个给出的结果只有一
* 不能调出中间结果
药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn