主要内容

nt2int

信核苷酸序列转换成整数表示

语法

SeqInt= nt2int (SeqChar)
SeqInt= nt2int (SeqChar……“未知”,UnknownValue,……)
SeqInt= nt2int (SeqChar……“ACGTOnly”,ACGTOnlyValue,……)

输入参数

SeqChar

下列之一:

UnknownValue 整数代表未知的核苷酸。选择是整数≥0和≤255年。默认是0
ACGTOnlyValue 控制禁止模棱两可的核苷酸。的选择是真正的(默认)。如果ACGTOnlyValue真正的,您可以输入字符一个,C,G,T,U

输出参数

SeqInt 核苷酸序列指定一个行向量的整数。

描述

SeqInt= nt2int (SeqChar)转换SeqChar,一个特征向量或字符串指定一个核苷酸序列,SeqInt行向量的整数指定相同的核苷酸序列。有效的编码,见表核苷酸字母代码映射到整数。未知字符(字符表中没有)被映射到0。用连字符表示映射到空缺16

SeqInt= nt2int (SeqChar,……”PropertyName”,PropertyValue,……)调用nt2int与使用属性名可选属性/属性值对。您可以指定一个或多个属性在任何顺序。每一个PropertyName必须包含在单引号,不分大小写。这些属性名称/属性值对如下:

SeqInt= nt2int (SeqChar……“未知”,UnknownValue,……)指定一个整数代表未知的核苷酸。UnknownValue可以是一个整数≥吗0和≤255年。默认是0

SeqInt= nt2int (SeqChar……“ACGTOnly”,ACGTOnlyValue,……)控制禁止模棱两可的核苷酸(N,R,Y,K,,年代,W,B,D,H,V)。的选择是真正的(默认)。如果ACGTOnlyValue真正的,您可以输入字符一个,C,G,T,U

核苷酸字母代码映射到整数

核苷酸 代码 整数
腺苷 一个 1
胞嘧啶核苷 C 2
鸟嘌呤 G 3
胸苷 T 4
尿苷(如果“字母”设置为“RNA”) U 4
嘌呤(一个G) R 5
嘧啶(TC) Y 6
酮(GT) K 7
氨基酸(一个C) 8
强相互作用(3 H债券)(GC) 年代 9
弱相互作用(2 H债券)(一个T) W 10
一个(CGT) B 11
C(一个GT) D 12
G(一个CT) H 13
TU(一个CG) V 14
任何核苷酸(一个CGTU) N 15
不定长度的差距 - - - - - - 16
未知(任何字符不表) * 0(默认)

例子

例31。把一个简单的序列

从字母核苷酸序列转换为整数。

s = nt2int (“ACTGCTAGC”)s = 1 2 4 3 2 4 1 3 2
32例。将一个随机序列
  1. 创建一个随机的特征向量来表示核苷酸序列。

    SeqChar = randseq (20) SeqChar = TTATGACGTTATTCTACTTT
  2. 信的核苷酸序列转换为整数表示。

    SeqInt = nt2int (SeqChar) SeqInt =列1到13 4 4 1 3 1 2 3 4 4 1 4 4列14到20 2 4 1 2 4 4 4

版本历史

之前介绍过的R2006a