nt2int
信核苷酸序列转换成整数表示
语法
SeqInt
= nt2int (SeqChar
)SeqInt
= nt2int (SeqChar
……“未知”,UnknownValue
,……)SeqInt
= nt2int (SeqChar
……“ACGTOnly”,ACGTOnlyValue
,……)
输入参数
SeqChar |
下列之一:
|
UnknownValue |
整数代表未知的核苷酸。选择是整数≥0 和≤255年 。默认是0 。 |
ACGTOnlyValue |
控制禁止模棱两可的核苷酸。的选择是真正的 或假 (默认)。如果ACGTOnlyValue 是真正的 ,您可以输入字符一个 ,C ,G ,T ,U 。 |
输出参数
SeqInt |
核苷酸序列指定一个行向量的整数。 |
描述
转换SeqInt
= nt2int (SeqChar
)SeqChar
,一个特征向量或字符串指定一个核苷酸序列,SeqInt
行向量的整数指定相同的核苷酸序列。有效的编码,见表核苷酸字母代码映射到整数。未知字符(字符表中没有)被映射到0
。用连字符表示映射到空缺16
。
调用SeqInt
= nt2int (SeqChar
,……”PropertyName
”,PropertyValue
,……)nt2int
与使用属性名可选属性/属性值对。您可以指定一个或多个属性在任何顺序。每一个PropertyName
必须包含在单引号,不分大小写。这些属性名称/属性值对如下:
指定一个整数代表未知的核苷酸。SeqInt
= nt2int (SeqChar
……“未知”,UnknownValue
,……)UnknownValue
可以是一个整数≥吗0
和≤255年
。默认是0
。
控制禁止模棱两可的核苷酸(SeqInt
= nt2int (SeqChar
……“ACGTOnly”,ACGTOnlyValue
,……)N
,R
,Y
,K
,米
,年代
,W
,B
,D
,H
,V
)。的选择是真正的
或假
(默认)。如果ACGTOnlyValue
是真正的
,您可以输入字符一个
,C
,G
,T
,U
。
核苷酸字母代码映射到整数
核苷酸 | 代码 | 整数 |
---|---|---|
腺苷 | 一个 |
1 |
胞嘧啶核苷 | C |
2 |
鸟嘌呤 | G |
3 |
胸苷 | T |
4 |
尿苷(如果“字母” 设置为“RNA” ) |
U |
4 |
嘌呤(一个 或G ) |
R |
5 |
嘧啶(T 或C ) |
Y |
6 |
酮(G 或T ) |
K |
7 |
氨基酸(一个 或C ) |
米 |
8 |
强相互作用(3 H债券)(G 或C ) |
年代 |
9 |
弱相互作用(2 H债券)(一个 或T ) |
W |
10 |
不一个 (C 或G 或T ) |
B |
11 |
不C (一个 或G 或T ) |
D |
12 |
不G (一个 或C 或T ) |
H |
13 |
不T 或U (一个 或C 或G ) |
V |
14 |
任何核苷酸(一个 或C 或G 或T 或U ) |
N |
15 |
不定长度的差距 | - - - - - - |
16 |
未知(任何字符不表) | * |
0 (默认) |
例子
从字母核苷酸序列转换为整数。
s = nt2int (“ACTGCTAGC”)s = 1 2 4 3 2 4 1 3 2
创建一个随机的特征向量来表示核苷酸序列。
SeqChar = randseq (20) SeqChar = TTATGACGTTATTCTACTTT
信的核苷酸序列转换为整数表示。
SeqInt = nt2int (SeqChar) SeqInt =列1到13 4 4 1 3 1 2 3 4 4 1 4 4列14到20 2 4 1 2 4 4 4
版本历史
之前介绍过的R2006a