主要内容

samread

从山姆读取数据文件

语法

SAMStruct= samread (文件)
(SAMStruct,HeaderStruct)= samread (文件)
…= samread (文件”,ParameterName”,ParameterValue)

描述

SAMStruct= samread (文件)读取SAM-formatted文件并返回MATLAB中的数据®数组的结构。

(SAMStruct,HeaderStruct)= samread (文件)返回校准和标题数据在两个独立的变量。

…= samread (文件”,ParameterName”,ParameterValue)接受一个或多个以逗号分隔的参数名称/值对。指定ParameterName在单引号。

输入参数

文件

特征向量或字符串指定一个文件名,SAM-formatted文件的路径和文件名,或SAM-formatted的文本文件。如果你仅指定一个文件名,文件必须在MATLAB搜索路径或在当前文件夹。

名称-值参数

标签

控制可选的阅读标签除了前11场中每一个对齐SAM-formatted文件。的选择是真正的(默认)或

ReadGroup

特征向量或字符串指定的阅读组ID读取校准记录。默认是所有组织阅读记录。

提示

的阅读列表组(如果存在),返回在一个单独的标题信息结构和视图ReadGroup在这个结构。

BlockRead

标量或矢量控制单个序列条目的阅读或块序列条目从SAM-formatted文件包含多个序列。输入一个标量N,阅读N输入文件中。输入一个1×2向量(M1, M2),开始读一块条目M1条目和结束平方米条目。读文件从所有剩余的条目M1入口,输入一个积极的价值M1并输入平方米

输出参数

SAMStruct

一个N1阵列的结构包含序列比对和从SAM-formatted文件映射信息,N是对齐的数量记录存储在SAM-formatted文件。每个结构包含以下字段。

描述
QueryName

阅读顺序(如果未配对)名称或名称的顺序(如果配对)。

提示

您可以使用此信息来填充BioMap对象的属性。

国旗

整数表示的位操作信息指定每个11旗帜的状态所描述的山姆格式规范。

提示

您可以使用bitget函数来确定特定的山姆国旗的状态。

ReferenceName 参考序列的名称。
位置 向前引用序列的位置(从抵消),最左边对齐的基础阅读序列的开始。
MappingQuality 整数指定映射质量分数的阅读顺序。
CigarString CIGAR-formatted特征向量代表如何读取序列与参考序列。
MateReferenceName 参考序列与伴侣相关的名称。如果这个名字是一样的ReferenceName,那么这个值=。如果没有伴侣,那么这个值*
MatePosition 向前引用序列的位置(从抵消),最左边对齐的基础阅读序列开始的伴侣。
InsertSize 读取之间的基地位置数序列及其配偶,当两者都映射到相同的参考序列。否则,此值0
序列 特征向量包含读这封信表示的序列。是reverse-complement如果读取序列对齐参考序列的反向链。
质量 每个基站的特征向量包含ASCII表示质量分数的阅读顺序。质量分数逆转如果读取序列对齐参考序列的反向链。
标签 适用的山姆标签列表和它们的值。

HeaderStruct

结构包含SAM-formatted文件头信息在以下领域。

描述
* 结构包含文件格式版本,排序顺序和组订单。
SequenceDictionary*

结构包含:

  • 序列的名字

  • 序列长度

  • 基因组装配标识符

  • 序列的MD5校验和

  • URI的序列

  • 物种

ReadGroup*

结构包含:

  • 阅读组标识符

  • 样本

  • 图书馆

  • 描述

  • 平台单元

  • 预测中值插入大小

  • 测序中心

  • 日期

  • 平台

程序*

结构包含:

  • 程序名

  • 版本

  • 命令行

*——这些结构和字段出现在输出结构中只有山姆文件。这些结构中的信息取决于山姆文件中的信息。

例子

读头信息和对齐的数据ex1.sam文件包含在生物信息学工具箱™,然后返回的信息在两个独立的变量:

[数据头]= samread (“ex1.sam”);

读一块条目,不包括标签,从ex1.sam文件,然后返回一个数组的信息结构:

%读条目5 - 10和不包含标签数据= samread(例1。山姆”、“blockread”10[5],“标签”,假);

提示

  • 使用saminfo函数来调查的规模和内容SAM-formatted文件之前使用samreadMATLAB函数将文件内容读入数组的结构。

  • 如果你SAM-formatted文件使用可用内存太大阅读,尝试以下之一:

    • 使用BlockRead参数与samread函数来读取条目的一个子集。

    • 创建一个从SAM-formatted BioIndexedFile对象文件,然后使用的方法访问条目BioIndexedFile类。

  • 使用SAMStruct输出参数,samread返回创建一个BioMap对象,它允许您探索、访问过滤器,和操作或数据的一个子集,在随后的分析之前或查看数据。

版本历史

介绍了R2010a