Aula 07: Análise de covariância

Objetivo dessa aula

O objetivo dessa aula é realizar uma análise de covariância de um experimento com um fator. Será utilizado o exemplo do livro do Montgomery sobre comprimento e diâmetro de fios de algodão.

Trabalhando com o arquivo de dados

Clique aqui para ver e copiar o arquivo com conjunto de dados.

Inicialmente faz-se a leitura e organização dos dados.

Note que neste caso tem-se 2 variáveis numéricas, a resposta (resp) e a covariável (cov).

Nesse exemplo, a resposta é o comprimento dos fios e o diâmetro a covariável.

> ex12 <- read.table("exemplo12.txt", header=T)  
> ex12  
 
> dim(ex12)  
[1] 15  3  
> names(ex12)  
[1] "maq"  "cov"  "resp"  
>  
> ex12$maq <- as.factor(ex12$maq)  
> is.numeric(ex12$cov)  
[1] TRUE  
> is.numeric(ex12$resp)  
[1] TRUE  
>  
> summary(ex12)  
 maq        cov             resp  
 1:5   Min.   :15.00   Min.   :32.0  
 2:5   1st Qu.:21.50   1st Qu.:36.5  
 3:5   Median :24.00   Median :40.0  
       Mean   :24.13   Mean   :40.2  
       3rd Qu.:27.00   3rd Qu.:43.0  
       Max.   :32.00   Max.   :49.0

Na análise de covariância os testes de significância tem que ser obtidos em ajustes separados.

É necessário verificar se o efeito da covariável influencia na variável resposta.

Análise exploratória

As estatísticas descritivas podem ser obtidas com as funções utilizadas nas aulas anteriores além de gráficos.

Nessa análise, tem-se o interesse de estudar a relação entre a variável resposta e a covariável. Como a metodologiade análise de covariância utiliza princípios da análise de regressão é natural que essa investigação utilize também procedimentos dessa área.

Portanto, inicialmente, pode-se fazer um gráfico de dispersão para avaliar a relação entre a variável resposta e a covariável.

attach(ex12)  
ex12.lm<-lm(cov~resp)  
plot(cov~resp)  
abline(ex12.lm$coef)

Observe que neste caso existe uma associação entre a variável resposta e a covariável.

Não é objetivo nessa análise, verificar a qualidade do ajuste do modelo. Claro, dependendo da forma da relação, isso deve ser incluido no modelo.

> cor(cov,resp)  
[1] 0.938542

Observação: para dados não completos, use a opção

cor(...,use="complete.obs")

Portanto, a relação entre essas variáveis pode estar afetando os resultados experimentais.

Para avaliar se esse efeito é significativo, faz-se a análise de covariância para examinar essa suspeita.

Análise de Covariância

Primeiro testa-se o intercepto (coeficiente β) da reta de regressão. Na análise de variância abaixo deve-se considerar apenas o teste referente à variável cov que neste caso está corrigida para o efeito de maq. Note que para isto a variável cov tem que ser a última na especificação do modelo.

> ex12.av <- aov(resp ~ maq + cov, data=ex12)  
> summary(ex12.av)  
            Df  Sum Sq Mean Sq F value    Pr(>F)  
maq          2 140.400  70.200  27.593 5.170e-05 ***  
cov          1 178.014 178.014  69.969 4.264e-06 ***  
Residuals   11  27.986   2.544  
---  
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

A seguir testa-se o efeito do fator maq corrigindo para o efeito da covariável. Para isto basta inverter a ordem dos termos na especificação do modelo.

> ex12.av <- aov(resp ~ cov + maq, data=ex12)  
> summary(ex12.av)  
            Df  Sum Sq Mean Sq  F value   Pr(>F)  
cov          1 305.130 305.130 119.9330 2.96e-07 ***  
maq          2  13.284   6.642   2.6106   0.1181  
Residuals   11  27.986   2.544  
---  
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Portanto, para esse experimento, a covariável teve um efeito significativo na interpretação dos resultados.

Caso o efeito da covariável fosse não significativo a análise poderia ser feita da forma habitual, ou seja, somente com o fator maq no modelo.

Observe que, nesse caso, as conclusões ainda seriam as mesmas. Mas, compare os p-valores para maq nas duas situações (com e sem a covariável) e observe que os valores são bem distintos.

summary(aov(resp~maq))

Ajustando as médias

Como o efeito da Covariável foi significativo, isso implica na correção das médias dos tratamentos.

Com o comando lm pode-se obter o valor de β da covariável diâmetro para correção das médias.

beta<-lm(resp~cov+maq)  
summary(beta)  
 
> beta$coef[2]  
      cov  
0.9539877

Depois, pode-se obter o valor da média corrigida, por exemplo da máquina 1:

media.resp<-tapply(resp,maq,mean)  
media.cov<-tapply(cov,maq,mean)  
media.cor1<-media.resp[1]-beta$coef[2]*(media.cov[1]-mean(cov))

Exercício

1.
Analise os dados do experimento abaixo, considerando um experimento com uma covariável, conduzido em um delineamento completamente casualizado.

Este experimento refere-se aos dados coletados por um pesquisador, que queria saber se o produto TBT (Tributil-Estanho) poderia estar afetando a atividade enzimática (nmol/min/mg) no cérebro e no músculo de peixes. Nesse caso, o pesquisador não conseguiu utilizar peixes com o mesmo peso pela dificuldade de encontrá-los na natureza.



Tabela 1: Atividade enzimática (nmol/min/mg) no cérebro e no músculo de peixes submetidos a presença de TBT e sem a presença de TBT (C).




TratamentospesoTBTcTBTm




C 64.144.5850.649
C 69.8 58.8 65.392
C 56.8 91.5 61.087
C 128 7.41 91.420
C 112 8.32 92.710
C 129 16.67 75.770
C 198 20.2461.610
C 140 15.1147.910
C 214 NA 15.510
TBT 98.240.1755.120
TBT 80.269.2442.046
TBT 79.816.5544.510
TBT 88.722.7795.242
TBT 79.539.8856.060
TBT 98.138.2870.516