过滤器和转换GFF和GTF文件
cuffgffread (
读取输入
那输出
)输入
GFF或GTF文件,并把强制列到输出
人造石铺地面文件[1].该函数还可以使用返回GTF格式文件“GTFOutput”
选项。
cuffgffread
需要这一点袖扣支持BioInf金宝appormatics Toolbox™的包装.如果未安装支持金宝app包,则该函数提供了下载链接。有关详细信息,请参阅生物信息工具箱软件支持包金宝app.
笔记
cuffgffread
支撑在金宝appMac和UNIX®平台。
保留所有属性时将GTF文件转换为GFF文件。
cuffgffread (“gyrAB.gtf”那'gyrABOut.gff'那“PreserveAttributes”,真正的)
您还可以使用对象设置选项。例如,指定输出为GTF格式。
选择= CuffGFFReadOptions;opt.GTFOutput = true;opt.PreserveAttributes = true;cuffgffread (“gyrAB.gtf”那“gyrABOut.gtf”,选择);
有一个选项对象,您可以使用的所有对象属性检索等效的原始选项getOptionsTable
.
getOptionstable(选择)
ANS = 33×3的表的PropertyName FlagName FlagShortName ___________________________ ________________ _____________ AppendDescription 'AppendDescription' '-A' '' CheckOppositeStrand 'CheckOppositeStrand' '-B' '' CheckPhase 'CheckPhase' '-H' '' 群集 '群集'“--cluster-only ' '' CodingOnly 'CodingOnly' '-C' '' CollapseContainer 'CollapseContainer' '-K' '' CollapseFull 'CollapseFull' '-Q' '' CoordinateRange 'CoordinateRange' '-r' '' DiscardInvalidCDS 'DiscardInvalidCDS''-J ' '' DiscardNonCanonicalSplice 'DiscardNonCanonicalSplice' '-N' '' DiscardSingleExon 'DiscardSingleExon' '-U' '' DiscardTerminatedCDS 'DiscardTerminatedCDS' '-V' '' FastaCDSFile 'FastaCDSFile' '-x' '' FastaExonsFile 'FastaExonsFile''-w ' '' FastaProteinFile 'FastaProteinFile' '-y' '' FirstExonOnly 'FirstExonOnly' '-G' '' ForceExons 'ForceExons' '--force外显子' '' FullyContained 'FullyContained' '-R' '' GTFOutput'GTFOutput '-T' '' MaxIntronLength“MaxIntronLength '-i' '' 合并'合并'--merge '-M' MergeCloseExons' MergeCloseExons' -Z' '' MergeInfoFile“MergeInfoFile '-d' '' PreserveAttributes”PreserveAttributes '-F' '' 伪 '伪' '--no伪' '' ReplacementTable“ReplacementTable '-M'''SequenceFile 'SequenceFile' '-g' '' 的SequenceInfo '的SequenceInfo' '-s' '' UrlDecode 'UrlDecode' '-D' '' UseEnsemblConversion 'UseEnsemblConversion' '-L' '' UseNonTranscript 'UseNonTranscript' '-O'''UseTrackName 'UseTrackName' '-t' '' WriteCoordinates 'WriteCoordinates' '-W' ''
输入
-输入文件名输入文件名,指定为字符串或字符向量。该文件可以是GTF或GFF文件。
例子:“gyrAB.gtf”
数据类型:char
|细绳
输出
-输出文件名输出文件名,指定为字符串或字符向量。默认情况下,输出是一个GFF文件。集“GTFOutput”
到真正的
获取GTF输出文件。
例子:'gyrAB.gff'
数据类型:char
|细绳
选择
-cuffgffread
选项cuffgffreadOptions.
目的|细绳|字符向量cuffgffread
选项,指定为acuffgffreadOptions.
对象,字符串或字符向量。该字符串或字符载体必须是在原gffread
选项语法(由一个或两个破折号前缀)[1].
指定可选的逗号分离对名称,值
论点。名称
是参数名称和价值
为对应值。名称
必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen
.
cuffgffread(‘gyrAB.gtf’,‘gyrAB.gff’,‘CoordinateRange’,' + NC_000912.1:4821 . . 7340 ')
'peachdescription'
-添加文件描述的标志备注说明
属性错误的
(默认)|真正的
将序列文件中的文件描述添加到备注说明
输出GFF记录的属性,指定为真正的
或错误的
.使用该文件指定序列文件SequenceInfo
选项。
例子:“AppendDescription”,真的
数据类型:逻辑
'checkoppositestrand'
-标志用于在帧的终止密码子检查时检查相反链错误的
(默认)|真正的
在检查帧内停止密码子时检查对链的标志,指定为真正的
或错误的
.
例子:'CheckOppositeStrand',真
数据类型:逻辑
“CheckPhase”
-标志来调节编码序列的相错误的
(默认)|真正的
在检查帧内停止密码子时调整编码序列阶段的标志,指定为真正的
或错误的
.
例子:'checkphase',true
数据类型:逻辑
'簇'
-标志将输入成绩单集聚到基因座中真正的
(默认)|错误的
标志将输入转录物集中到基因座中,指定为真正的
或错误的
.此选项与此选项相同合并
财产,但它不具有相同的内含子崩溃完全包含成绩单。
例子:“集群”,假的
数据类型:逻辑
'codingonly'
-标志放弃没有编码序列的转录本错误的
(默认)|真正的
丢弃没有编码序列特征(CD)的成绩单,指定为真正的
或错误的
.
例子:“CodingOnly”,真的
数据类型:逻辑
'CollapseContainer'
-标志崩溃完全包含成绩单错误的
(默认)|真正的
折叠完全包含的转录本标志,这些转录本比容器更短,内含子更少,指定为真正的
或错误的
.此属性仅在您设置时适用合并
到真正的
.
例子:'pollapaceecontainer',真实
数据类型:逻辑
'CollapseFull'
-与另一个外显子重叠至少80%的较短转录本错误的
(默认)|真正的
旗帜折叠较短的成绩单与另一个单一外显子成绩单重叠至少80%,指定为真正的
或错误的
.此属性仅在您设置时适用合并
到真正的
.
例子:'collassfull',真实
数据类型:逻辑
“CoordinateRange”
-筛选转录本的基因组范围基因组范围的转录物过滤器,指定为字符串或字符向量。格式必须为“[[<链>]
, 在哪里开始
和结尾
是基因组位置,CHR.
是一个可选的染色体或contig名称,和一个可选缕
('+'
或' - '
).
例子:'coordinaterange',“+ nc_000912.1:4821..7340”
数据类型:char
|细绳
'DiscardInvalidCDS'
-标志忽略的mRNA转录物或者缺乏启动或终止密码子或具有符合读框的终止密码子错误的
(默认)|真正的
标记忽略缺乏启动或停止密码子或具有框架内停止密码子的mRNA转录本,指定为真正的
或错误的
.
例子:“DiscardInvalidCDS”,真的
数据类型:逻辑
“DiscardNonCanonicalSplice”
-旗帜忽略具有非甘露糖浆序列的内含子的Multiexon mRNA转录物错误的
(默认)|真正的
标志以忽略具有非甘露糖拼接序列的内含子的Multiexon mRNA转录物,指定为真正的
或错误的
.阿非规范剪接序列比其他任何接头序列“GT-AG”
那“cg-ag”
,或“AT-AC”
.
例子:'DiscardNonCanonicalSplice',真
数据类型:逻辑
'discardsingleexon'
-标记忽略跨越单个外显子的转录本错误的
(默认)|真正的
旗帜忽略跨越一个外显子的成绩单,指定为真正的
或错误的
.
例子:'discardsingleexon',真实
数据类型:逻辑
“DiscardTerminatedCDS”
-标记忽略带有框内终止密码子的转录本错误的
(默认)|真正的
标记忽略带有帧内终止密码子的转录本,指定为真正的
或错误的
.
例子:'DiscardTerminatedCDS',真
数据类型:逻辑
“ExtraCommand”
-额外的命令“
(默认)|字符向量|细绳命令必须使用本机语法(以一或两个破折号作为前缀)。使用此选项来应用无文件记录的标志和没有相应MATLAB的标志®属性。
例子:'ExtraCommand', “ - E”
数据类型:char
|细绳
“FastaCDSFile”
-保存拼接编码序列的文件名将剪接编码序列保存为快速格式的文件名,指定为字符串或字符向量。
例子:'fastacdsfile',“splicedcoding.fasta”
数据类型:char
|细绳
“FastaExonsFile”
-保存拼接外显子的文件名一个文件来保存剪接的外显子在FASTA格式,指定为字符串或字符向量的名称。
例子:'FastaExonsFile', “splicedExon.FASTA”
数据类型:char
|细绳
'fastaproteinfile'
-保存蛋白质翻译编码序列的文件名文件的名称以保存以快速格式的编码序列的蛋白质翻译,指定为字符串或字符向量。
例子:'FastaProteinFile', “translated.FASTA”
数据类型:char
|细绳
'Firstexononly'
-标记仅从第一个外显子解析附加属性错误的
(默认)|真正的
标记只解析第一个外显子的附加属性,指定为真正的
或错误的
.
例子:'FirstExonOnly',真
数据类型:逻辑
'forfexons'
-将最低级GFF特性列为外显子特性的标志错误的
(默认)|真正的
标志以列表中的最低级别GFF设有作为外显子在输出文件中的功能,指定为真正的
或错误的
.
例子:'forfexons',真实
数据类型:逻辑
“FullyContained”
-旗帜丢弃不包含的成绩单错误的
(默认)|真正的
国旗丢弃成绩单不在该范围内完全包含,指定为真正的
或错误的
.属性指定范围CoordinateRange
选项。
例子:'完全',真实
数据类型:逻辑
“GTFOutput”
-标志输出gtf格式的转录文件错误的
(默认)|真正的
输出gtf格式的文本文件的标志,指定为真正的
或错误的
.
例子:'GTFOutput',真
数据类型:逻辑
'包括'
-标志应用所有可用的选项错误的
(默认)|真正的
原始(本机)语法由一个或两个破折号前缀。默认情况下,该函数仅转换指定的选项。如果值是真正的
,该软件将所有可用的选项,与未指定选项的默认值,原来的语法。
笔记
如果你设置包括
到真正的
,软件转换所有可用的属性,默认值为未指定属性。唯一的例外是,当属性的默认值是时南
那INF.
那[]
那''
,或“
,那么软件不转换相应的属性。
例子:'Includeall',真实
数据类型:逻辑
'maxintronlength'
-用于输出中的转录物的最大内含子长度INF.
(默认)|正整数要包含在输出文件中的转录本的最大内含子长度,指定为正整数。INF.
,默认值,对内含子长度设置无限制。
例子:'maxintronlength',500
数据类型:双倍的
“合并”
-标志合并成绩单位点错误的
(默认)|真正的
标记通过折叠具有相同内含子的转录本,将转录本合并到位点,指定为真正的
或错误的
.
例子:“合并”,真
数据类型:逻辑
'mergecloseexons'
-旗合并外显子为单一外显子错误的
(默认)|真正的
标记当外显子被少于4个碱基对的内含子分开时,将外显子合并为单个外显子,指定为真正的
或错误的
.
例子:'mergecloseexons',true
数据类型:逻辑
'mergeinfofile'
-合并时保存有关重复信息的信息的文件名将文件的名称保存有关重复的信息,指定为字符串或字符向量。此属性仅在您设置时适用合并
到真正的
.
例子:“MergeInfoFile”、“duplicates.txt”
数据类型:char
|细绳
“PreserveAttributes”
-标记以保留输出中的所有属性错误的
(默认)|真正的
标记以保留输出文件中的所有属性,指定为真正的
或错误的
.
例子:'PreserveAttributes',真
数据类型:逻辑
“伪”
-标志过滤掉包含“pseudo”的记录真正的
(默认)|错误的
旗帜过滤滤除包含“伪”单词“单词”字的记录指定为真正的
或错误的
.
例子:“伪”,假的
数据类型:逻辑
'replacementtable'
-包含文件替换表的名称包含替换表的文件的名称,指定为字符串或字符向量。表必须有两个列,其中第一个列包含原始转录ID,第二列包含新的签字ID。遵循示例表。
origTranscript1 |
newTranscript1 |
origTranscript2 |
newTranscript2 |
origTranscript3 |
newTranscript3 |
如果提供替换表,则该函数将替换第一个列中的签字标识,其中包含来自第二列的新成绩单ID,并筛选找出未找到的成绩单。
例子:'replacementtable',“replaceetbl.txt”
数据类型:char
|细绳
“SequenceFile”
-包含基因组序列的Fasta格式文件的名称包含所有输入映射的基因组序列的Fasta格式文件的名称,指定为字符串或字符向量。
例子:“SequenceFile”、“seqs.fasta”
数据类型:char
|细绳
“SequenceInfo”
-具有有关输入序列的其他信息的选项卡分隔文件的名称用制表符分隔的文件的名称,其中包含关于每个输入序列的附加信息,指定为字符串或字符向量。这个文件必须有三个列:序列名称列、序列长度列和序列描述列。如果AppendDescription
是真正的
,序列描述包含在输出GFF文件中的属性。
例子:'的SequenceInfo', “seqinfo.txt”
数据类型:char
|细绳
'UrlDecode'
-标志以在属性名称中解码URL编码的字符错误的
(默认)|真正的
标志属性名解码URL编码的字符,指定为真正的
或错误的
.例如,“transcript%20description”被解码为“transcript description”。
例子:“UrlDecode”,真的
数据类型:逻辑
'使用emblconversion'
-FLAG使用GTF-GFF3转换方法来自Ensembl错误的
(默认)|真正的
FLAG使用GTF-GFF3转换方法从Ensembl中指定为真正的
或错误的
.
例子:'unmentsemblconversion',true
数据类型:逻辑
'usenontranscript'
-标志包括在输出文件nontranscript GFF记录错误的
(默认)|真正的
标志包括在输出文件nontranscript GFF记录,指定为真正的
或错误的
.
例子:'UseNonTranscript',真
数据类型:逻辑
'UseTrackName'
-标志在GFF输出线的第二列中使用轨道名错误的
(默认)|真正的
标记来使用GFF输出行第二列中的曲目名称,指定为真正的
或错误的
.
例子:'UseTrackName',真
数据类型:逻辑
“WriteCoordinates”
-标志写入的外显子的坐标投影到叠接序列错误的
(默认)|真正的
标记以写入投影到剪接序列上的外显子坐标,指定为真正的
或错误的
.此属性仅适用于什么时候FastaExonsFile
或FastAcdsfile.
被指定。
例子:'writecoordinates',真实
数据类型:逻辑
[1]Trapnell,Cole,Brian A Williams,Geo Pertea,Ali Mortazavi,Gordon Kwan,Marijke J Van Baren,Steven L Salzberg,Barbara J Wold和Lior Pachter。“转录程序组件和RNA-SEQ定量揭示了在细胞分化期间未经发布的转录物和同种型切换。”自然生物技术28日,没有。5 (May 2010): 511-15。
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝app
你也可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。