主要内容

使用微阵列实验数据对象

这个例子展示了如何创建和操作MATLAB®容器,用于存储微阵列实验中的数据。

基因表达实验数据容器

微阵列实验数据非常复杂,通常由来自许多不同来源的数据和信息组成。以一致的方式存储和管理庞大而复杂的数据集是一个挑战。生物信息学工具箱™提供了一组对象来表示来自微阵列实验的不同数据块。

ExpressionSet类是用于存储和管理来自微阵列基因表达实验的不同类型数据的单一、方便的数据结构。

一个ExpressionSetObject由所有微阵列基因表达实验中常见的这四个组件组成:

实验数据:微阵列实验的表达式值。类的实例存储这些数据ExptData类。

样品信息:描述实验样本的元数据。类的实例存储样例元数据元数据类。

数组特性注释:实验中使用的阵列上关于特征或探针的注释。类的实例存储注释元数据类。

实验说明:描述实验方法和条件的资料。类的实例存储该信息MIAME类。

ExpressionSet类协调并验证这些数据组件。类提供检索和设置存储在类中的数据的方法ExpressionSet对象。一个ExpressionSetobject的行为也像许多其他MATLAB数据结构一样,可以进行子集和复制。

实验数据

在微阵列基因表达实验中,每个样本的每个特征的测量表达值可以表示为一个二维矩阵。矩阵有F行和年代列,F数组上的特征数,和年代是测量表达值的样本数量。一个DataMatrix对象是一个二维矩阵,您可以根据行号和列号、逻辑向量或行名和列名对其进行索引。

创建一个包含行名和列名的数据矩阵。

dm = bama .data. datamatrix (rand(5,4),“RowNames”“功能”“ColNames”“样本”
dm = Sample1 Sample2 Sample3 Sample4 Feature1 0.81472 0.09754 0.15761 0.14189 Feature2 0.90579 0.2785 0.97059 0.42176 Feature3 0.12699 0.54688 0.95717 0.91574 Feature4 0.91338 0.95751 0.48538 0.79221 Feature5 0.63236 0.96489 0.80028 0.95949

这个函数大小的行数和列数DataMatrix对象。

大小(dm)
Ans = 5 4

你可以索引到DataMatrix对象,就像其他MATLAB数值数组一样,使用行号和列号。例如,您可以访问第1行和第2行、第3列的元素。

dm (1:2, 3)
ans = Sample3 Feature1 0.15761 Feature2 0.97059

你也可以索引到DataMatrix对象的行名和列名。将第2行和第3行、第1列和第4列中的元素重新赋值。

dm ({“Feature2”“Feature3”}, {“Sample1”“Sample4”}) = [2,3;4、5)
dm = Sample1 Sample2 Sample3 Sample4 Feature1 0.81472 0.09754 0.15761 0.14189 Feature2 2 0.2785 0.97059 3 Feature3 4 0.54688 0.95717 5 Feature4 0.91338 0.95751 0.48538 0.79221 Feature5 0.63236 0.96489 0.80028 0.95949

本例中使用的基因表达数据是来自Affymetrix®MG-U74Av2阵列[1]上常见菌株的成年小鼠基因表达模式微阵列实验的一小组数据。

从制表符格式的文件读取表达式值mouseExprsData.txt进入MATLAB工作区作为DataMatrix对象。

exprsData =生物数据。“文件”“mouseExprsData.txt”);类(exprsData)
ans = 'bioma.data.DataMatrix'

属性的属性DataMatrix对象,exprsData

get (exprsData)
名称:'mouseExprsData' RowNames: {500x1 cell} ColNames: {1x26 cell} NRows: 500 NCols: 26 NDims: 2 ElementClass: 'double'

检查示例名称。

colnames (exprsData)
ans = 1 x26单元阵列列1到8 {A} {B} {' C '} {' D '}{“E”}{' F '}{‘G’}{' H '}列9到16{“我”}{' J '}{“K”}{‘L’}{“M”}{' N '} {' O '}{“P”}列17到24{‘问’}{‘R’}{S} {' T '}{‘U’}{' V '} {' W '} {X}列25到26 {Y} {' Z '}

查看前10行和5列。

exprsData (1:10, 1:5)
ans = A B C D E 100001_at 2.26 20.14 31.66 14.58 16.04 100002_at 158.86 236.25 206.27 388.71 388.09 100003_at 68.11 105.45 82.92 82.9 60.38 100004_at 74.32 96.68 84.87 72.26 98.38 100005_at 75.05 53.17 57.94 60.06 63.91 100006_at 80.36 42.89 77.21 77.24 40.31 100007_at 216.64 191.32 219.48 237.28 298.18 100009_r_at 3806.7 1425 2468.5 2172.7 2237.2 100010_at NaN NaN NaN 7.18 22.37 100011_at 81.72 72.27 127.61 91.01 98.13

对表达式值执行log2转换。

exprsData_log2 = log2(exprsData);exprsData_log2 (1:10, 1:5)
ans = A B C D E 100001_at 1.1763 4.332 4.9846 3.8659 4.0036 100002_at 7.3116 7.8842 7.6884 8.6026 8.6002 100003_at 6.0898 6.7204 6.3736 6.3733 5.916 100004_at 6.2298 5.7325 5.8565 5.9083 5.998 100006_at 6.3284 5.4226 6.2707 6.2713 5.3331 100007_at 7.7592 7.5798 7.7779 7.8904 8.22 100009_r_at 11.894 10.477 11.269 11.085 11.127 100010_at NaN NaN NaN 2.844 4.4835 100011_at 6.3526 6.1753 6.9956 6.508 6.6166

改变的名字属性更具有描述性|。

exprsData_log2 = set(exprsData_log2,“名字”“Log2基于mouseexpressdata”);get (exprsData_log2)
名称:'Log2基于mouseExprsData' RowNames: {500x1 cell} ColNames: {1x26 cell} NRows: 500 NCols: 26 NDims: 2 ElementClass: 'double'

在微阵列实验中,数据集通常包含一个或多个矩阵,这些矩阵具有相同的行数和列数以及相同的行名和列名。ExptData类的设计用于包含和协调一个或多个数据矩阵,这些数据矩阵具有相同的行名和列名,且维度大小相同。数据值存储为DataMatrix对象。每一个DataMatrix对象的元素ExptData对象。的ExptData类负责这些之间的数据验证和协调DataMatrix对象。

将自然尺度和log2基表达值的基因表达数据分别存储在an中ExptData对象。

mouseExptData =生物数据。ExptData(exprsData, exprsData_log2,...“elementname”, {“naturalExprs”“log2Exprs”})
mouseExptData =实验数据:500个特征,26个样本2个元素元素名称:naturalExprs, log2Exprs

访问一个DataMatrix元素mouseExptData使用元素名。

exprsData2 = mouseExptData(“log2Exprs”);get (exprsData2)
名称:'Log2基于mouseExprsData' RowNames: {500x1 cell} ColNames: {1x26 cell} NRows: 500 NCols: 26 NDims: 2 ElementClass: 'double'

元数据样本

微阵列实验中样品的元数据可以用表表示年代行和V列,年代是样本的数量,和V是变量的数量。表的内容是每个样本的每个变量的值。例如,文件mouseSampleData.txt包含这样一个表。每个样例变量的描述用的象征。

元数据类设计用于以协调的方式存储和操作变量值及其元数据。你可以阅读mouseSampleData.txt文件到MATLAB中作为元数据对象。

sData = bioma.data.MetaData(“文件”“mouseSampleData.txt”“vardescchar”“#”
sData =示例名称:A, B,…,Z (26 total) Variable Names and Meta Information: VariableDescription Gender {' Gender of the mouse in study' } Age {' The number of weeks since mouse birth'} Type {' Genetic characters' } Strain {' The mouse strain' } Source {' The tissue source for RNA collection' }

的性质元数据类提供关于示例和变量的信息。

numSamples = sData。NSamplesnumVariables = sData.NVariables
numSamples = 26 numVariables = 5

样本的变量值和变量描述存储为两个数据集数组中的数组元数据类。的元数据类提供对变量值和描述变量的元信息的访问方法。

方法访问样例元数据variableValues方法。

sData.variableValues
ans =性别年龄模式菌株{‘男性’}8{“野生型”}{' 129 s6 / SvEvTac} B{‘男性’}8{“野生型”}{' 129 s6 / SvEvTac} 8 C{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 D{‘男性’}{“野生型”}{/ J的}8 E{‘男性’}{“野生型”}{/ J的}8 F{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 G{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 H{‘男性’}{“野生型”}{' 129 s6 / SvEvTac}{‘男性’}我八{“野生型”}{' 129 s6 / SvEvTac} J{‘男性’}8{“野生型”}{/ J的}8 K{‘男性’}{“野生型”}{/ J的}{‘男性’}8{“野生型”}{/ J的}8 M{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 N{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 O{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 P{‘男性’}{“野生型”}{' 129 s6 / SvEvTac}问{‘男性’}8{“野生型”}{/ J的}8 R{‘男性’}{“野生型”}{/ J的}8 S{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 T{‘男性’}{“野生型”}{C57BL / 6阁下的}8 U{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 V{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 W{‘男性’}{“野生型”}{/ J的}X{‘男性’}8{野生类型的Y} {/ J”}{‘男性’}8{“野生型”}{' C57BL / 6 J '} Z{‘男性’}8{“野生型”}{' C57BL / 6 J '}源A{“杏仁核”}{“杏仁核”}C{“杏仁核”}D E{“杏仁核”}{“杏仁核”}F{“杏仁核”}G H{“杏仁核”}{}“扣带皮层”我{“扣带皮层”}J{“扣带皮层”}K{“扣带皮层”}L{“扣带皮层”}{}“扣带皮层”N{“扣带皮层”}O{‘海马’}P{‘海马’}{‘海马’}R{‘海马’}S{‘海马’}{‘海马’}T U{'下丘脑'}V{'下丘脑'}W{'下丘脑'}X{'下丘脑'}Y{'下丘脑'}Z{'下丘脑'}

查看样例元数据的摘要。

总结(sData.variableValues)
性别:[26x1字符向量单元阵列]年龄:[26x1双]分第一四分位数中位数第三四分位数最大8 8 8 8 8类型:[26x1字符向量单元阵列]品系:[26x1字符向量单元阵列]来源:[26x1字符向量单元阵列]

sampleNames而且variableNames方法是访问示例和变量名称的方便方法。类的变量名sData对象。

variableNames (sData)
ans = 1 x5单元阵列{‘性别’}{‘年龄’}{'类型'}{“应变”}{'源'}

属性可以检索关于描述示例的变量的元信息variableDesc方法。在本例中,它只包含关于变量的描述。

variableDesc (sData)
ans = VariableDescription性别{'被研究小鼠的性别'}年龄{'小鼠出生的周数'}类型{'遗传特征'}品系{'小鼠品系'}来源{' RNA收集的组织来源'}

您可以将示例数据子集化sData对象使用数值索引。

sData(三6,:)
ans =示例名称:C, D,…,F(4 total) Variable Names and Meta Information: VariableDescription Gender {' Gender of the mouse in study' } Age {' The number of weeks since mouse birth'} Type {' Genetic characters' } Strain {' The mouse strain' } Source {' The tissue source for RNA collection' }

您可以使用数值索引显示特定样品的小鼠品系。

sData。年代train([2 14])
ans = 2x1单元格阵列{'129S6/SvEvTac'} {'C57BL/6J'}

中的行名sData里面的列名exprsData都是一样的。在同一实验中,表达式数据与样本数据之间存在着重要的关系。

所有(ismember (sampleNames (sData) colnames (exprsData)))
Ans =逻辑1

特征标注元数据

关于数组上的特征或探测集的元数据可以非常大且多样。芯片制造商通常为每种类型的阵列提供特定的注释文件。元数据可以存储为元数据对象用于特定的实验。在本例中,MG-U74Av2阵列的注释文件可以从Affymetrix网站下载。您需要使用电子表格软件应用程序将文件从CSV格式转换为XLSX格式。

将整个文件读入MATLAB作为数据集数组中。或者,您可以使用范围选项中的数据集构造函数。删除变量名中的任何空格,使其成为有效的MATLAB变量名。每次发生这种情况都会显示一个警告。

mgU74Av2 = table2dataset(可读数据集)“MG_U74Av2_annot.xlsx”));
警告:在为表创建变量名之前,文件中的列标头已被修改为有效的MATLAB标识符。原始列标题保存在VariableDescriptions属性中。将'VariableNamingRule'设置为'preserve'以使用原始列标题作为表变量名。

检查它的属性数据集数组中。

get (mgU74Av2)
描述:" VarDescription: {1x43 cell} Units: {} DimNames: {'Row' 'Variables'} UserData: [] ObsNames: {} VarNames: {1x43 cell}

确定注释文件中探测集id的数量。

元素个数(mgU74Av2.ProbeSetID)
Ans = 12488

检索描述数组特征的变量名,并查看前20个变量名。

fDataVariables = get(mgU74Av2,“VarNames”);fDataVariables (1:20) '
ans = 20x1单元阵列{'ProbeSetID'} {'GeneChipArray'} {'SpeciesScientificName'} {'AnnotationDate'} {'SequenceType'} {'SequenceSource'} {'TranscriptID_ArrayDesign_'} {'TargetDescription'} {'RepresentativePublicID'} {'ArchivalUniGeneCluster'} {'UniGeneID'} {' genome eversion '} {'Alignments'} {'GeneTitle'} {'GeneSymbol'} {'ChromosomalLocation'} {'UnigeneClusterType'} {'Ensembl'} {'EntrezGene'} {'SwissProt'}

设置ObsNames属性设置为探测集id,这样您就可以通过索引探测集id来访问单个基因注释。

mgU74Av2 = set(mgU74Av2,“ObsNames”, mgU74Av2.ProbeSetID);mgU74Av2 (“100709 _at”, {“GeneSymbol”“ChromosomalLocation”})
ans = GeneSymbol染色体分配100709_at {'Tpbpa'} {'chr13 B2|13 36.0 cM'}

在某些情况下,提取与分析相关的特定注释是有用的。为GeneTitleGeneSymbolChromosomalLocation,通路相对于的特征exprsData

mgU74Av2 = mgU74Av2(:,{“GeneTitle”...“GeneSymbol”...“ChromosomalLocation”...“通路”});mgU74Av2 = mgU74Av2(rownames(exprsData),:);get (mgU74Av2)
描述:" VarDescription: {1x4 cell}单位:{}DimNames: {'Row' 'Variables'} UserData: [] ObsNames: {500x1 cell} VarNames: {1x4 cell}

您可以存储特性注释数据集对象的实例元数据类。

fData = bioma.data.MetaData(mgU74Av2)
fData =样本名称:100001_at, 100002_at,…,100717_at (500 total) Variable Names and Meta Information: VariableDescription GeneTitle {'NA'} GeneSymbol {'NA'} ChromosomalLocation {'NA'} Pathway {'NA'}

中没有对特征变量的描述fData元数据对象。中添加变量的描述fData使用variableDesc方法。

fData =变量(fData, {“探针集的基因名称”...“探针集基因符号”...“探针设置染色体位置”...基因参与的途径})
fData =样本名称:100001_at, 100002_at,…,100717_at (500 total) Variable Names and Meta Information: VariableDescription GeneTitle {'Gene title of a probe set' } GeneSymbol {'Probe set gene symbol' } ChromosomalLocation {'Probe set chromosomal locations' } Pathway {'The pathway the genes involved in'}

实验信息

MIAME类是一个灵活的数据容器,用于收集关于微阵列实验的基本描述,如调查员、实验室和阵列设计。的MIAME类大致遵循微阵列实验(MIAME)规范[2]。

创建一个MIAME对象,提供一些基本信息。

expDesc =生物数据。miame (“侦探”“简OneName”...“实验室”“生物信息学实验室”...“标题”“基因表达实验实例”...“抽象”一个使用微阵列对象的例子...“其他”, {“注释:从文本文件创建。”})
expDesc =实验描述:作者姓名:Jane OneName实验室:生物信息学实验室联系方式:URL: PubMedIDs:摘要:一个5个字的摘要可用。使用Abstract属性。没有实验设计摘要。其他注释:{'注释:从文本文件创建。'}

另一种创建MIAME对象来自GEO系列数据。的MIAME类将填充GEO系列结构中的相应属性。本例中与基因谱实验相关的信息可从GEO数据库中获得,登录号如下GSE3327[1]。方法检索GEO系列数据getgeodata函数。

getgeodata (“GSE3327”“去整理”“GSE3327.txt”);

将数据读入结构。

geoSeries = geoseriesread(“GSE3327.txt”
geoSeries = struct with fields:头:[1x1 struct]数据:[12488x87 bioma.data.DataMatrix]

创建一个MIAME对象。

exptGSE3327 = bio .data. miame (geoSeries)
exptGSE3327 =实验描述:作者姓名:Iiris,,Hovatta David,J,Lockhart Carrolee,,Barlow实验室:索尔克生物研究所联系方式:Carrolee,,Barlow URL: PubMedIDs: 16244648摘要:14个单词的摘要可用。使用Abstract属性。实验设计:一份8字的总结。使用ExptDesign属性。其他注释:{'ftp://ftp.ncbi.nlm.nih.gov/pub/geo/DATA/supplementary/series/GSE3327/GSE3327_RAW.tar'}

查看实验摘要及其PubMed id。

abstract = exptGSE3327。一个bstract pubmedID = exptGSE3327.PubMedID
关键词:小鼠品系与脑区比较pubmedID = '16244648'

创建一个ExpressionSet对象

ExpressionSet类是专门为微阵列基因表达实验数据设计的。组建一个ExpressionSet对象从刚才创建的不同数据对象中获取示例小鼠基因表达实验。

exptSet = bioma。ExpressionSet(exprsData,“SData”sData,...“FData”fData,...“Einfo”exptGSE3327)
实验数据:500个特征,26个样本元素名称:表达式样本数据:样本名称:A, B,…,Z (26 total) Sample variable names and meta information: Gender: Gender of the mouse in study Age: The number of weeks since mouse birth Type: Genetic characters Strain: The mouse strain Source: The tissue source for RNA collection Feature Data: Feature names: 100001_at, 100002_at, ...,100717_at (500 total) Feature variable names and meta information: GeneTitle: Gene title of a probe set GeneSymbol: Probe set gene symbol ChromosomalLocation: Probe set chromosomal locations Pathway: The pathway the genes involved in Experiment Information: use 'exptInfo(obj)'

您还可以创建一个ExpressionSet对象中的表达式值DataMatrix或者一个数字矩阵。

miniExprSet = bioma.ExpressionSet(exprsData)
实验数据:500个特征,26个样本元素名称:表达式样本数据:无特征数据:无实验信息:无

保存和加载一个ExpressionSet对象

微阵列实验的数据对象可以保存为文件。保存ExpressionSet对象exptSet到一个文件命名mouseExpressionSet.mat

保存mouseExpressionSetexptSet

清除MATLAB工作区中的变量。

清晰的dmexprs *mouseExptDatasData

加载文件mouseExpressionSet进入MATLAB工作区。

负载mouseExpressionSet

检查装载ExpressionSet对象。

exptSet.elementNames
ans = 1x1单元格数组{'表达式'}
exptSet。NSamples
Ans = 26
exptSet。NFeatures
Ans = 500

访问ExpressionSet对象的数据组件

可以使用许多方法来访问和更新存储在ExpressionSet对象。

您可以使用点表示法访问示例数据的列。

exptSet.Strain (1:5)
ans = 5x1单元阵列{'129S6/SvEvTac'} {'129S6/SvEvTac'} {'129S6/SvEvTac'} {'A/J '} {'A/J '}

方法检索特性名称featureNames方法。在本例中,特性名是数组上的探测集标识符。

featureNames (exptSet 1:5)
Ans = 5x1单元格数组{'100001_at'} {'100002_at'} {'100003_at'} {'100004_at'} {'100005_at'}

样本的唯一标识符可以通过sampleNames方法。

exptSet.sampleNames (1:5)
ans = 1 x5单元阵列{A} {B} {' C '} {' D '}{“E”}

sampleVarNames方法列出样例数据中的变量名。

exptSet.sampleVarNames
ans = 1 x5单元阵列{‘性别’}{‘年龄’}{'类型'}{“应变”}{'源'}

提取数据集包含样本信息的数组。

sDataset = sampleVarValues(exptSet)
sDataset =性别年龄模式菌株{‘男性’}8{“野生型”}{' 129 s6 / SvEvTac} B{‘男性’}8{“野生型”}{' 129 s6 / SvEvTac} 8 C{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 D{‘男性’}{“野生型”}{/ J的}8 E{‘男性’}{“野生型”}{/ J的}8 F{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 G{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 H{‘男性’}{“野生型”}{' 129 s6 / SvEvTac}{‘男性’}我八{“野生型”}{' 129 s6 / SvEvTac} J{‘男性’}8{“野生型”}{/ J的}8 K{‘男性’}{“野生型”}{/ J的}{‘男性’}8{“野生型”}{/ J的}8 M{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 N{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 O{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 P{‘男性’}{“野生型”}{' 129 s6 / SvEvTac}问{‘男性’}8{“野生型”}{/ J的}8 R{‘男性’}{“野生型”}{/ J的}8 S{‘男性’}{“野生型”}{' C57BL / 6 J '} 8 T{‘男性’}{“野生型”}{C57BL / 6阁下的}8 U{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 V{‘男性’}{“野生型”}{' 129 s6 / SvEvTac} 8 W{‘男性’}{“野生型”}{/ J的}X{‘男性’}8{野生类型的Y} {/ J”}{‘男性’}8{“野生型”}{' C57BL / 6 J '} Z{‘男性’}8{“野生型”}{' C57BL / 6 J '}源A{“杏仁核”}{“杏仁核”}C{“杏仁核”}D E{“杏仁核”}{“杏仁核”}F{“杏仁核”}G H{“杏仁核”}{}“扣带皮层”我{“扣带皮层”}J{“扣带皮层”}K{“扣带皮层”}L{“扣带皮层”}{}“扣带皮层”N{“扣带皮层”}O{‘海马’}P{‘海马’}{‘海马’}R{‘海马’}S{‘海马’}{‘海马’}T U{'下丘脑'}V{'下丘脑'}W{'下丘脑'}X{'下丘脑'}Y{'下丘脑'}Z{'下丘脑'}

检索ExptData对象,其中包含表达式值。可能不止一个DataMatrix对象中具有相同尺寸的对象ExptData对象。在一个ExpressionSet对象,总是有一个元素DataMatrix对象命名表达式包含表达式矩阵。

exptDS = exptData(exptSet)
exptDS =实验数据:500个特征,26个样本1个元素元素名称:表达式

只提取表达式DataMatrix实例。

dMatrix =表达式(exptSet);

返回的表达式DataMatrix应该和exprsDataDataMatrix前面创建的对象。

get (dMatrix)
名称:'mouseExprsData' RowNames: {500x1 cell} ColNames: {1x26 cell} NRows: 500 NCols: 26 NDims: 2 ElementClass: 'double'

获取PubMed的实验id存储在exptSet

exptSet.pubMedID
Ans = '16244648'

子集化一个ExpressionSet对象

您可以将ExpressionSet对象,以便您可以专注于感兴趣的示例和特性。第一个索引参数子集特征,第二个参数子集样本。

创建一个新的ExpressionSet对象,该对象由前五个特征和已命名的样本组成一个B,C

mySet = exptSet(1:5, {“一个”“B”“C”})
实验数据:5个特征,3个样本元素名称:表达式样本数据:样本名称:A, B, C样本变量名称和元信息:性别:被研究小鼠的性别年龄:小鼠出生的周数类型:遗传性状品系:小鼠品系来源:用于RNA收集的组织来源特征数据:特征名称:100001_at, 100002_at,…,100005_at(总共5个)特征变量名称和元信息:GeneTitle:探针集基因名称GeneSymbol:探针集基因符号ChromosomalLocation:探针集染色体位置Pathway:涉及基因的通路实验信息:使用'exptInfo(obj)'
大小(mySet)
Ans = 5 3
featureNames (mySet)
Ans = 5x1单元格数组{'100001_at'} {'100002_at'} {'100003_at'} {'100004_at'} {'100005_at'}
sampleNames (mySet)
ans = 1x3单元格数组{'A'} {'B'} {'C'}

你也可以创建一个只由海马体组织样本组成的子集。

hippocampusSet = exptSet(:, nominal(exptSet. source)==“海马”
实验数据:500个特征,6个样本元素名称:表达式样本数据:样本名称:O, P,…,T (6 total) Sample variable names and meta information: Gender: Gender of the mouse in study Age: The number of weeks since mouse birth Type: Genetic characters Strain: The mouse strain Source: The tissue source for RNA collection Feature Data: Feature names: 100001_at, 100002_at, ...,100717_at (500 total) Feature variable names and meta information: GeneTitle: Gene title of a probe set GeneSymbol: Probe set gene symbol ChromosomalLocation: Probe set chromosomal locations Pathway: The pathway the genes involved in Experiment Information: use 'exptInfo(obj)'
hippocampusSet。源
Ans = 6x1单元阵列{'海马体'}{'海马体'}{'海马体'}{'海马体'}{'海马体'}{'海马体'}
hippocampusExprs =表达式(hippocampusSet);
get (hippocampusExprs)
名称:'mouseExprsData' RowNames: {500x1 cell} ColNames: {'O' 'P' 'Q' 'R' 'S' 'T'} NRows: 500 NCols: 6 NDims: 2 ElementClass: 'double'

参考文献

[1] Hovatta, I.等,“乙醛酶1和谷胱甘肽还原酶1调节小鼠焦虑”,自然,438(7068):662- 6,2005。

[2] Brazma, A.等,“关于微阵列实验(MIAME)的最小信息-朝向微阵列数据标准”,Nat. Genet. 29(4):365-371, 2001。