R语言因子实验设计和解释案例分析报告附代码数据

更新时间：2024-04-04 12:08:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

单因子DOE实验设计案例推荐度：
相关推荐

【原创】R语言报告论文（附代码数据）有问题到淘宝找“大数据部落”就可以了

R语言因子实验设计和解释案例分析报告

?示例1：两组比较 ?示例2：多个组

实例3：两个条件，两个基因型，一个交互项 o野生型治疗效果（主效应）。 o突变体治疗的效果

o没有治疗的突变型和野生型之间有什么区别？ o通过治疗，突变型和野生型有什么区别？ o基因型的不同反应（相互作用项）实例4：两个条件，三个基因型 o基因型I的条件效应（主效应） o基因型III的条件效应。 o基因型II的条件效应。 o在条件A下III与II的影响

o基因型III与基因型I的条件效应的相互作用项 ○基因型III与基因型II的条件效应的相互作用项。

为了允许iDEP中的复杂模型（http://ge-lab.org/idep/），我尝试了解如何构建事实模型，并从DESeq2中提取期望的结果。以下是基于DESeq2中resutls（）函数的帮助文档，以及Mike Love对用户提问的回答。

我想要做的一个重点是，当研究设计涉及多个因素时（参见上面关于基因型+治疗实例的图），结果的解释是棘手的。与R中的回归分析类似，分类因素的参考水平构成了我们的分歧的基础。然而，默认情况下，它们是按字母顺序确定的。选择每个因素的参考水平是至关重要的。否则你的系数可能会有所不同，这取决于你如何进入DESeq2的实验设计。这可以通过R中的relevel（）函数完成。参考级别是构成有意义比较基础的因素的基线级别。在野生型与突变型实验中，“野生型”是参考水平。在治疗与未治疗，参考水平显然是未经处理的。例3中的更多细节。

【原创】R语言报告论文（附代码数据）有问题到淘宝找“大数据部落”就可以了

例1：两组比较

首先制作一些示例数据。

library(DESeq2) dds<-makeExampleDESeqDataSet(n=10000,m=6) assay(dds)[1:10,] ## sample1 sample2 sample3 sample4 sample5 sample6 ## gene1 6 4 11 1 2 13 ## gene2 9 12 23 13 14 28 ## gene3 58 121 173 178 118 97 ## gene4 0 4 0 3 8 3 ## gene5 27 3 6 9 8 12 ## gene6 48 8 35 38 21 13 ## gene7 36 50 61 52 44 22 ## gene8 6 8 16 14 18 19 ## gene9 214 266 419 198 157 166 ## gene10 20 12 16 12 16 2 这是一个非常简单的实验设计，有两个条件。

colData(dds) ## DataFrame with 6 rows and 1 column ## condition ## ## sample1 A ## sample2 A ## sample3 A ## sample4 B ## sample5 B ## sample6 B dds<-DESeq(dds) resultsNames(dds) ## [1] \ 这显示了可用的结果。请注意，默认情况下，R会根据字母顺序为因素选择一个参考级别。这里A是参考水平。折叠变化定义为B与A比较。要更改参考级别，请尝试使用“同一个”（）函数。

【原创】R语言报告论文（附代码数据）有问题到淘宝找“大数据部落”就可以了

res<-results(dds, contrast=c(\,\,\)) res<-res[order(res$padj),] library(knitr) kable(res[1:5,-(3:4)]) gene9056 gene3087 gene3763 gene2054 gene4617

baseMean 360.168909 43.897516 72.409877 322.494963 6.227415

log2FoldChange

-2.045379 -2.203303 -1.834787 1.537408 6.125238

pvalue 0.0000000 0.0000173 0.0000434 0.0000681 0.0002019

padj 0.0001366 0.0858143 0.1434712 0.1689463 0.4008408

如果我们想用B作为控制，并用B作为基线定义倍数变化。那我们可以这样做：

res<-results(dds, contrast=c(\,\,\)) ix=which.min(res$padj) res<-res[order(res$padj),] kable(res[1:5,-(3:4)]) gene9056 gene3087 gene3763 gene2054 gene4617

baseMean 360.168909 43.897516 72.409877 322.494963 6.227415

log2FoldChange

2.045379 2.203303 1.834787 -1.537408 -6.125238

pvalue 0.0000000 0.0000173 0.0000434 0.0000681 0.0002019

padj 0.0001366 0.0858143 0.1434712 0.1689463 0.4008408

正如你所看到的，折叠的方向是完全相反的。这里我们展示最重要的基因。

barplot(assay(dds)[ix,],las=2, main=rownames(dds)[ix])

【原创】R语言报告论文（附代码数据）有问题到淘宝找“大数据部落”就可以了

示例2：多个组

假设我们有三个组A，B和C.

dds<-makeExampleDESeqDataSet(n=100,m=6) dds$condition<-factor(c(\,\,\,\,\,\)) dds<-DESeq(dds) res=results(dds, contrast=c(\,\,\)) res<-res[order(res$padj),] kable(res[1:5,-(3:4)])

gene2 gene20 gene34 gene35 gene41

baseMean 3.634986 4.678176 56.068672 537.847175 93.967810

log2FoldChange

-5.101773 -4.490982 -1.462155 -1.177240 1.064734

pvalue 0.0348679 0.0445664 0.0167820 0.0087913 0.0412034

padj 0.5515088 0.5515088 0.5515088 0.5515088 0.5515088

本文来源：https://www.bwwdw.com/article/betr.html

相关文章：