主要内容

可视化微阵列数据

这个例子展示了各种各样的探索和可视化原始微阵列数据的方法。的例子使用微阵列数据的研究基因表达在老鼠大脑[1]。

探索微阵列数据集

布朗,V。M出版社。[1]使用微阵列研究大脑中的基因表达模式的鼠标帕金森病(PD)的药理模型诱导使用冰毒。这个实验的原始数据可以从基因表达综合网站加入使用数字GSE30[1]。

该文件mouse_h3pd.gpr使用的微阵列的数据包含一个在这项研究中,特别是从一个样本来自大脑的体素H3在帕金森病(PD)模型鼠。文件使用GenePix®GPR文件格式。立体像素样本与Cy3标签(绿色)和控制(从总RNA,而不是voxelated正常小鼠大脑)与Cy5标记。

GPR格式化文件提供大量信息数组包括均值、中值和标准偏差的每个点的前景和背景强度在635 nm波长(红色,Cy5频道)和532 nm波长(绿色,Cy3通道)。

命令gprread从文件中读取的数据结构。

pd = gprread (“mouse_h3pd.gpr”)
pd =结构体字段:标题:[1 x1 struct]数据:[9504 x38双]:[9504 x1双]列:x1双[9504]行:[9504 x1双]的名字:{9504}x1细胞id: {9504} x1细胞ColumnNames: {38 x1细胞}指数:[132 x72双]:[1 x1 struct]

您可以访问的字段结构使用符号。例如,访问第十列名称。

pd.ColumnNames (1:10)
ans = 10 x1单元阵列{X} {Y}{迪亚。'}{“F635值”}{‘F635意味着}{F635 SD的}{“B635值”}{‘B635意味着}{B635 SD的}{% > B635 + 1 SD的}

您还可以访问前十基因的名字。

pd.Names (1:10)
ans = 10 x1单元阵列{‘AA467053} {‘AA388323} {‘AA387625} {‘AA474342} {‘Myo1b} {‘AA473123} {‘AA387579} {‘AA387314} {‘AA467571} {0 x0 char}

微阵列数据的空间图像

maimage命令可以把微阵列数据结构和创建的伪彩色图像数据安排在相同的顺序点阵列,即。微阵列的空间情节。“F635值”字段显示红色的前景的像素值中位数(Cy5)通道。

图maimage (pd,“F635值”,“标题”,{“帕金森”模式”,的前景像素的中值,“红色频道”})

“F532值”字段对应于绿色的前景(Cy3)通道。

图maimage (pd,“F532值”,“标题”,{“帕金森”模式”,的前景像素的中值,“绿色通道”})

“B635值”字段显示了背景值中值的红色通道。注意到非常高的背景水平数组的右侧。

图maimage (pd,“B635值”,“标题”,{“帕金森”模式”,的背景像素的中值,“红色频道”})

“B532值”显示了背景值中值的绿色通道。

图maimage (pd,“B532值”,“标题”,{“帕金森”模式”,的背景像素的中值,“绿色通道”})

你现在可以考虑同样的大脑获得的数据体素的治疗控制鼠标。在这种情况下,体素与Cy3样本标记,和控制(从总RNA,不是大脑voxelated)与Cy5标记。

wt = gprread (“mouse_h3wt.gpr”)
wt =结构体字段:标题:[1 x1 struct]数据:[9504 x38双]:[9504 x1双]列:x1双[9504]行:[9504 x1双]的名字:{9504}x1细胞id: {9504} x1细胞ColumnNames: {38 x1细胞}指数:[132 x72双]:[1 x1 struct]

使用maimage显示的伪彩色图像前景和背景的未经处理的老鼠。的次要情节命令可以用来结合故事情节。

图次要情节(2 2 1);maimage (wt、“F635值”,“标题”,{“前景”,“(红色)”})次要情节(2,2,2);maimage (wt、“F532值”,“标题”,{“前景”,的(绿色)})次要情节(2、2、3);maimage (wt、“B635值”,“标题”,{“背景”,“(红色)”})次要情节(2、2、4);maimage (wt、“B532值”,“标题”,{“背景”,的(绿色)})注释(“文本框”,“字符串”,野生型像素值中位数的,“位置”(0.3 - 0.05 0.9 - 0.01),“EdgeColor”,“没有”,“字形大小”12);

如果你看看规模背景图像,你会注意到背景水平远高于PD鼠标和似乎有一些非随机影响Cy3频道这张幻灯片的背景。改变colormap有时可以提供更多的洞察在伪彩色图。更多的控制颜色,试试colormapeditor函数。你也可以右键单击colorbar调出各种选项修改colormap情节包括交互式colormap转移。

colormap

maimage命令是一个简单的方法来快速创建微阵列数据的伪彩色图像。然而,有时它是方便使用的创建可定制的情节显示亮度图像命令,如下所示。

使用magetfieldB532值字段中提取数据和索引字段索引数据。可以结合强度的背景情节给更多的对比图片。

b532Data = magetfield (wt,“B532值”);maskedData = b532Data;maskedData (b532Data < 500) = 500;maskedData (b532Data > 2000) = 2000;图次要情节(1、2、1);显示亮度图像(b532Data (wt.Indices)轴图像colorbar标题(“B532 WT、“)次要情节(1、2、2);显示亮度图像(maskedData (wt.Indices)轴图像colorbar标题(“增强B532 WT、“)

微阵列的数据

maboxplot函数可以用来查看数据的分布在每一个街区。

图次要情节(2,1,1)maboxplot (pd,“F532值”,“标题”,“帕金森的疾病模型老鼠”次要情节(2,1,2)maboxplot (pd,“B532值”,“标题”,“帕金森的疾病模型老鼠”)图次要情节(2,1,1)maboxplot (wt,“F532值”,“标题”,未经处理的小鼠的次要情节(2,1,2)maboxplot (wt,“B532值”,“标题”,未经处理的小鼠的)

从盒子里的情节你可以清楚地看到空间背景强度的影响。块1、3、5和7的左侧数组,和块号码2、4、6和8是右边。

微阵列数据结构中有两个列标注“F635值- B635”和“F532值- B532”。这些列中前景和背景中值之间的差异分别为635纳米通道和532纳米通道。这些测量实际的表达水平。在这些情节空间效果不太明显。

图次要情节(2,1,1)maboxplot (pd,“F635值——B635”,“标题”,“帕金森的疾病模型老鼠”次要情节(2,1,2)maboxplot (pd,“F532值——B532”,“标题”,“帕金森的疾病模型老鼠”)图次要情节(2,1,1)maboxplot (wt,“F635值——B635”,“标题”,未经处理的小鼠的次要情节(2,1,2)maboxplot (wt,“F532值——B532”,“标题”,未经处理的小鼠的)

微阵列数据的散点图

而不是处理数据在更大的结构,通常更容易提取数据到单独的变量。

cy5Data = magetfield (pd,“F635值——B635”);cy3Data = magetfield (pd,“F532值——B532”);

一个简单的方法来比较两个渠道的重对数情节。这个函数maloglog是用来做这个。点上面这个图的对角线对应基因表达水平更高H3体素的大脑作为一个整体。

图maloglog (cy5Data cy3Data)标题(“重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');
警告:零值将被忽略。警告:消极的价值观将被忽略。

注意,重对数函数给出了一些警告-和零元素。这是因为一些价值观的“F635值——B635”和“F532值——B532”列是零个或小于零。斑点,这可能会发生坏点或斑点杂交失败。同样,用积极,但非常小,前景和背景之间的差异也被认为是坏点。可以禁用使用这些警告警告命令。

warnState =警告;%保存当前警告状态警告(“关闭”,“bioinfo: maloglog: ZeroValues”);警告(“关闭”,“bioinfo: maloglog: NegativeValues”);图maloglog (cy5Data cy3Data)标题(“重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');警告(warnState);%重置警报状态

另一种简单地忽略或禁用警告从数据集中删除坏点。这可以通过找到点红色或绿色通道的值小于或等于阈值,例如10。

阈值= 10;badPoints = (cy5Data < =阈值)| (cy3Data < =阈值);

然后您可以删除这些点和重对数图绘制。

cy5Data (badPoints) = [];cy3Data (badPoints) = [];图maloglog (cy5Data cy3Data)标题(“精制重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');

情节分布可以通过标签标注不同的点与相应的基因。

图maloglog (cy5Data cy3Data,“标签”pd.Names (~ badPoints),“factorlines”2)标题(“重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');

试着用鼠标点击的一些异常值点。你会看到相关的基因的名字。大部分的异常值低于y = x线。事实上大部分的点是低于这条线。理想情况下的点应该是这条线的两边均匀分布。为了要实现这一目标,需要规范化。您可以使用manorm函数执行全球平均归一化。

normcy5 = manorm (cy5Data);normcy3 = manorm (cy3Data);

如果你画出规范化数据你会看到点是更多关于y = x线的均匀分布。

图maloglog (normcy5 normcy3,“标签”pd.Names (~ badPoints),“factorlines”2)标题(“归一化重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');

你会记得,芯片的背景不统一。您可以使用print-tip(块)标准化规范化分别每一块。这个函数manorm将自动执行块正常化if块可在微阵列数据结构的信息。

bn_cy5Data = manorm (pd,“F635值——B635”);bn_cy3Data = manorm (pd,“F532值——B532”);

而不是删除负面或点低于阈值,你可以设置他们南。这并不改变数据的大小或形状,但南点不会被显示在图。

bn_cy5Data (bn_cy5Data < = 0) =南;bn_cy3Data (bn_cy3Data < = 0) =南;图maloglog (bn_cy5Data bn_cy3Data,“标签”pd.Names,“factorlines”2)标题(精制,规范化的重对数散点图PD模型的);包含(“F635值——B635(控制));ylabel (“F532值——B532(体素H3) ');

这个函数mairplot用于创建一个强度与比情节规范化数据。如果名称-值对“PlotOnly”设置为false,您可以探索数据交互,如选择指向看到的名字相关的基因,标准化数据,强调差异的基因名称或衰减列表,或改变线的价值因素。

mairplot (normcy5 normcy3,“标签”pd.Names (~ badPoints),“PlotOnly”,真的,“标题”,的强度与PD模型的比例);

您可以使用正常化选项mairplot对数据执行洛斯正常化。

mairplot (normcy5 normcy3,“标签”pd.Names (~ badPoints),“PlotOnly”,真的,“正常化”,真的,“标题”,的强度与比PD模型(归一化)”);

GenePix是轴突的注册商标仪器公司。

引用

[1]布朗V.M.,et al., "Multiplex three dimensional brain gene expression mapping in a mouse model of Parkinson's disease", Genome Research, 12(6):868-84, 2002.