R语言之方差分析篇

当包含的因子是解释变量时,通常会从预测转向 级别差异的分析,即称作方差分析(ANOVA)
组间因子
因变量
自变量
【R语言之方差分析篇】均衡设计( )
组内因子
单因素组间方差分析
单因素组内方差分析
重复测量方差分析
主效应
交叉效应
因素方差分析
混淆因素
干扰变数
协变量
协方差
1、ANOVA模型拟合
1.aov()函数
语法:aov(,data=http://www.kingceram.com/post/)
R表达式中的特殊符号
符号
用法
~
分隔符号,左边为响应变量,右边为解释变量
eg:y~A+B+C
+
分隔解释变量

表示变量的交互项
eg:y~A+B+A:B
*
表示所有可能交互项
eg:y~A*B*C可展开为:y~A+B+C+A:B+A:C+B:C+A:B:C
^
表示交互项达到次数
eg:y~(A+B+C)^2展开为:y~A+B+C+A:B+A:C+B:C
.
表示包含除因变量外的所有变量
eg:若一个数据框包括变量y,A、B和C,代码y~.可展开为y~A+B+C
常见研究设计的表达式
设计
表达式
单因素ANOVA
y~A
含单个协变量的单因素
y~x+A
双因素ANOVA
y~A*B
含两个协变量的双因素
y~x1+x2+A*B
随机化区组
y~B+A(B是区组因子)
单因素组内ANOVA
y~A+Error(/A)
含单个组内因子(W)和单个组间因子(B)
的重复测量ANOVA

R语言之方差分析篇

文章插图
y~B*W+Error(/W)
非平衡设计时或存在协变量时,效应项的顺序对结果影响较大
越基础的效应应越需要放在表达式前面,首先是协变量、然后是主效应、接着是双因素的交互项,再接着是三因素的交互项
若研究不是正交的,一定要谨慎设置疚的顺序
2、单因素方差分析 (1)单因素方差分析
#单因素方差分析(感兴趣地是比较分类因子定义的两个或多个组别中的因变量均值)install.packages("multcomp")library(multcomp)attach(cholesterol)str(cholesterol)cholesteroltable(trt)aggregate(response,by=list(trt),FUN=mean)aggregate(response,by=list(trt),FUN=sd)fit<-aov(response~trt)summary(fit)library(gplots)plotmeans(response~trt,xlab="Treatment",ylab="Response",main="Mean Plot\n with 95%CI")
R语言之方差分析篇

文章插图
(2)多重比较
多重比较用于解决某一组别与其他的不同
()函数提供了对各组均值差异的成对检验,但与HH包存在兼容性问题((某些版本中);
TukeyHSD(fit)par(las=2)par(mar=c(5,4,6,2))plot(TukeyHSD(fit))
R语言之方差分析篇

文章插图

R语言之方差分析篇

文章插图
library(multcomp)par(mar=c(5,4,6,2))tuk<-glht(fit,linfct=mcp(trt="Tukey"))plot(cld(tuk,level=0.05),col="lightgrey")
R语言之方差分析篇

文章插图
(3)评估检验的假设条件
当因变量服从正态颁,各组方差相等时,可用Q-Q图来检验正态性假设
()要求用lm()拟合,若数据落 在95%的置信区间范围内,说明满足正态性假设 。
R提供的可以做方差齐性检验的函数
检验.test()
-检验 .test()
Brown-检验
离群点检验
car包中的()函数来检测离群点
3、单因素协方差分析