如何搜索基因从基因组使用ID ?

4视图(30天)
卡•罗伊
卡•罗伊 2017年3月13日
评论道: 马特·C 2018年7月25日
我拯救了整个基因组fasta文件和基因fasta文件到一个文件夹中。
现在我想搜索是否基因在基因组,如果是的多少时间。
有没有在matlab函数可用这种应用程序吗?
2的评论
马特·C
马特·C 2018年7月25日
我认为这可以通过使用fastaread()和()函数。
fastaread()函数接受fasta文件的名称作为输入,并返回一个结构体包含的头文件中的信息和实际的序列。可选参数也可以被添加到函数调用。例如,函数可以调用像fastaread(“文件名”,“IgnoreGaps”,真正的)为了消除差距的符号序列。
的文档fastaread()是在这里找到://www.tatmou.com/help/bioinfo/ref/fastaread.html
count()函数接受一个字符串和一个字符串并返回substring多少次发生在更大的字符串。
count()的文档在这里找到://www.tatmou.com/help/matlab/ref/count.html
我认为出现的次数计算的基因组中基因可能是下面的伪代码:
%读取基因fasta文件
geneData = fastaread (“geneFileName”);
%读取基因组fasta文件
genomeData = fastaread (“genomeFileName”);
%计算出现的基因序列在基因组序列
numberOfOccurrences = count (genomeData。序列,geneData.Sequence);

登录置评。

答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!