主要内容

cuffgffread

过滤器和转换GFF和GTF文件

描述

例子

cuffgffread (输入输出读取输入GFF或GTF文件,并把强制列到输出人造石铺地面文件[1].该函数还可以使用返回GTF格式文件“GTFOutput”选项。

cuffgffread需要这一点袖扣支持BioInf金宝appormatics Toolbox™的包装.如果未安装支持金宝app包,则该函数提供了下载链接。有关详细信息,请参阅生物信息工具箱软件支持包金宝app

笔记

cuffgffread支撑在金宝appMac和UNIX®平台。

cuffgffread (输入输出选择使用指定的附加选项选择

cuffgffread (输入输出名称,值使用一个或多个名称值对参数指定的其他选项。例如,cuffgffread(‘gyrAB.gtf’,‘gyrAB.gff’,‘PreserveAttributes’,真的)保留输出文件中的所有属性。

例子

全部折叠

保留所有属性时将GTF文件转换为GFF文件。

cuffgffread (“gyrAB.gtf”'gyrABOut.gff'“PreserveAttributes”,真正的)

您还可以使用对象设置选项。例如,指定输出为GTF格式。

选择= CuffGFFReadOptions;opt.GTFOutput = true;opt.PreserveAttributes = true;cuffgffread (“gyrAB.gtf”“gyrABOut.gtf”,选择);

有一个选项对象,您可以使用的所有对象属性检索等效的原始选项getOptionsTable

getOptionstable(选择)
ANS = 33×3的表的PropertyName FlagName FlagShortName ___________________________ ________________ _____________ AppendDescription 'AppendDescription' '-A' '' CheckOppositeStrand 'CheckOppositeStrand' '-B' '' CheckPhase 'CheckPhase' '-H' '' 群集 '群集'“--cluster-only ' '' CodingOnly 'CodingOnly' '-C' '' CollapseContainer 'CollapseContainer' '-K' '' CollapseFull 'CollapseFull' '-Q' '' CoordinateRange 'CoordinateRange' '-r' '' DiscardInvalidCDS 'DiscardInvalidCDS''-J ' '' DiscardNonCanonicalSplice 'DiscardNonCanonicalSplice' '-N' '' DiscardSingleExon 'DiscardSingleExon' '-U' '' DiscardTerminatedCDS 'DiscardTerminatedCDS' '-V' '' FastaCDSFile 'FastaCDSFile' '-x' '' FastaExonsFile 'FastaExonsFile''-w ' '' FastaProteinFile 'FastaProteinFile' '-y' '' FirstExonOnly 'FirstExonOnly' '-G' '' ForceExons 'ForceExons' '--force外显子' '' FullyContained 'FullyContained' '-R' '' GTFOutput'GTFOutput '-T' '' MaxIntronLength“MaxIntronLength '-i' '' 合并'合并'--merge '-M' MergeCloseExons' MergeCloseExons' -Z' '' MergeInfoFile“MergeInfoFile '-d' '' PreserveAttributes”PreserveAttributes '-F' '' 伪 '伪' '--no伪' '' ReplacementTable“ReplacementTable '-M'''SequenceFile 'SequenceFile' '-g' '' 的SequenceInfo '的SequenceInfo' '-s' '' UrlDecode 'UrlDecode' '-D' '' UseEnsemblConversion 'UseEnsemblConversion' '-L' '' UseNonTranscript 'UseNonTranscript' '-O'''UseTrackName 'UseTrackName' '-t' '' WriteCoordinates 'WriteCoordinates' '-W' ''

输入参数

全部折叠

输入文件名,指定为字符串或字符向量。该文件可以是GTF或GFF文件。

例子:“gyrAB.gtf”

数据类型:char|细绳

输出文件名,指定为字符串或字符向量。默认情况下,输出是一个GFF文件。集“GTFOutput”真正的获取GTF输出文件。

例子:'gyrAB.gff'

数据类型:char|细绳

cuffgffread选项,指定为acuffgffreadOptions.对象,字符串或字符向量。该字符串或字符载体必须是在原gffread选项语法(由一个或两个破折号前缀)[1]

名称-值对的观点

指定可选的逗号分离对名称,值论点。名称是参数名称和价值为对应值。名称必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:cuffgffread(‘gyrAB.gtf’,‘gyrAB.gff’,‘CoordinateRange’,' + NC_000912.1:4821 . . 7340 ')

将序列文件中的文件描述添加到备注说明输出GFF记录的属性,指定为真正的错误的.使用该文件指定序列文件SequenceInfo选项。

例子:“AppendDescription”,真的

数据类型:逻辑

在检查帧内停止密码子时检查对链的标志,指定为真正的错误的

例子:'CheckOppositeStrand',真

数据类型:逻辑

在检查帧内停止密码子时调整编码序列阶段的标志,指定为真正的错误的

例子:'checkphase',true

数据类型:逻辑

标志将输入转录物集中到基因座中,指定为真正的错误的.此选项与此选项相同合并财产,但它不具有相同的内含子崩溃完全包含成绩单。

例子:“集群”,假的

数据类型:逻辑

丢弃没有编码序列特征(CD)的成绩单,指定为真正的错误的

例子:“CodingOnly”,真的

数据类型:逻辑

折叠完全包含的转录本标志,这些转录本比容器更短,内含子更少,指定为真正的错误的.此属性仅在您设置时适用合并真正的

例子:'pollapaceecontainer',真实

数据类型:逻辑

旗帜折叠较短的成绩单与另一个单一外显子成绩单重叠至少80%,指定为真正的错误的.此属性仅在您设置时适用合并真正的

例子:'collassfull',真实

数据类型:逻辑

基因组范围的转录物过滤器,指定为字符串或字符向量。格式必须为“[[<链>] :<启动> .. , 在哪里开始结尾是基因组位置,CHR.是一个可选的染色体或contig名称,和一个可选'+'' - ').

例子:'coordinaterange',“+ nc_000912.1:4821..7340”

数据类型:char|细绳

标记忽略缺乏启动或停止密码子或具有框架内停止密码子的mRNA转录本,指定为真正的错误的

例子:“DiscardInvalidCDS”,真的

数据类型:逻辑

标志以忽略具有非甘露糖拼接序列的内含子的Multiexon mRNA转录物,指定为真正的错误的.阿非规范剪接序列比其他任何接头序列“GT-AG”“cg-ag”,或“AT-AC”

例子:'DiscardNonCanonicalSplice',真

数据类型:逻辑

旗帜忽略跨越一个外显子的成绩单,指定为真正的错误的

例子:'discardsingleexon',真实

数据类型:逻辑

标记忽略带有帧内终止密码子的转录本,指定为真正的错误的

例子:'DiscardTerminatedCDS',真

数据类型:逻辑

命令必须使用本机语法(以一或两个破折号作为前缀)。使用此选项来应用无文件记录的标志和没有相应MATLAB的标志®属性。

例子:'ExtraCommand', “ - E”

数据类型:char|细绳

将剪接编码序列保存为快速格式的文件名,指定为字符串或字符向量。

例子:'fastacdsfile',“splicedcoding.fasta”

数据类型:char|细绳

一个文件来保存剪接的外显子在FASTA格式,指定为字符串或字符向量的名称。

例子:'FastaExonsFile', “splicedExon.FASTA”

数据类型:char|细绳

文件的名称以保存以快速格式的编码序列的蛋白质翻译,指定为字符串或字符向量。

例子:'FastaProteinFile', “translated.FASTA”

数据类型:char|细绳

标记只解析第一个外显子的附加属性,指定为真正的错误的

例子:'FirstExonOnly',真

数据类型:逻辑

标志以列表中的最低级别GFF设有作为外显子在输出文件中的功能,指定为真正的错误的

例子:'forfexons',真实

数据类型:逻辑

国旗丢弃成绩单不在该范围内完全包含,指定为真正的错误的.属性指定范围CoordinateRange选项。

例子:'完全',真实

数据类型:逻辑

输出gtf格式的文本文件的标志,指定为真正的错误的

例子:'GTFOutput',真

数据类型:逻辑

原始(本机)语法由一个或两个破折号前缀。默认情况下,该函数仅转换指定的选项。如果值是真正的,该软件将所有可用的选项,与未指定选项的默认值,原来的语法。

笔记

如果你设置包括真正的,软件转换所有可用的属性,默认值为未指定属性。唯一的例外是,当属性的默认值是时INF.[]'',或,那么软件不转换相应的属性。

例子:'Includeall',真实

数据类型:逻辑

要包含在输出文件中的转录本的最大内含子长度,指定为正整数。INF.,默认值,对内含子长度设置无限制。

例子:'maxintronlength',500

数据类型:双倍的

标记通过折叠具有相同内含子的转录本,将转录本合并到位点,指定为真正的错误的

例子:“合并”,真

数据类型:逻辑

标记当外显子被少于4个碱基对的内含子分开时,将外显子合并为单个外显子,指定为真正的错误的

例子:'mergecloseexons',true

数据类型:逻辑

将文件的名称保存有关重复的信息,指定为字符串或字符向量。此属性仅在您设置时适用合并真正的

例子:“MergeInfoFile”、“duplicates.txt”

数据类型:char|细绳

标记以保留输出文件中的所有属性,指定为真正的错误的

例子:'PreserveAttributes',真

数据类型:逻辑

旗帜过滤滤除包含“伪”单词“单词”字的记录指定为真正的错误的

例子:“伪”,假的

数据类型:逻辑

包含替换表的文件的名称,指定为字符串或字符向量。表必须有两个列,其中第一个列包含原始转录ID,第二列包含新的签字ID。遵循示例表。

origTranscript1

newTranscript1

origTranscript2

newTranscript2

origTranscript3

newTranscript3

如果提供替换表,则该函数将替换第一个列中的签字标识,其中包含来自第二列的新成绩单ID,并筛选找出未找到的成绩单。

例子:'replacementtable',“replaceetbl.txt”

数据类型:char|细绳

包含所有输入映射的基因组序列的Fasta格式文件的名称,指定为字符串或字符向量。

例子:“SequenceFile”、“seqs.fasta”

数据类型:char|细绳

用制表符分隔的文件的名称,其中包含关于每个输入序列的附加信息,指定为字符串或字符向量。这个文件必须有三个列:序列名称列、序列长度列和序列描述列。如果AppendDescription真正的,序列描述包含在输出GFF文件中的属性。

例子:'的SequenceInfo', “seqinfo.txt”

数据类型:char|细绳

标志属性名解码URL编码的字符,指定为真正的错误的.例如,“transcript%20description”被解码为“transcript description”。

例子:“UrlDecode”,真的

数据类型:逻辑

FLAG使用GTF-GFF3转换方法从Ensembl中指定为真正的错误的

例子:'unmentsemblconversion',true

数据类型:逻辑

标志包括在输出文件nontranscript GFF记录,指定为真正的错误的

例子:'UseNonTranscript',真

数据类型:逻辑

标记来使用GFF输出行第二列中的曲目名称,指定为真正的错误的

例子:'UseTrackName',真

数据类型:逻辑

标记以写入投影到剪接序列上的外显子坐标,指定为真正的错误的.此属性仅适用于什么时候FastaExonsFileFastAcdsfile.被指定。

例子:'writecoordinates',真实

数据类型:逻辑

参考

[1]Trapnell,Cole,Brian A Williams,Geo Pertea,Ali Mortazavi,Gordon Kwan,Marijke J Van Baren,Steven L Salzberg,Barbara J Wold和Lior Pachter。“转录程序组件和RNA-SEQ定量揭示了在细胞分化期间未经发布的转录物和同种型切换。”自然生物技术28日,没有。5 (May 2010): 511-15。

在R2019A介绍