Trabalhando com o arquivo de dados

Vamos considerar primeiro o exemplo da apostila retirado do livro de Montgomery. Clique aqui para ver e copiar o arquivo com o conjunto de dados.

Este experimento estuda a variabilidade de lotes e a diferença entre fornecedores com relação a pureza da matéria prima. A análise assume que os fornecedores são um efeito fixo enquanto que lotes são efeitos aleatórios.

Inicialmente vamos ler (importar) os dados para R com o comando read.table.

> ex06 <- read.table("exemplo06.txt", header=T)
> ex06

A seguir vamos examinar o objeto que contém os dados.

> dim(ex06)
[1] 36  3

> names(ex06)
[1] "forn" "lot"  "resp"

> is.factor(ex06$forn)
[1] FALSE
> is.factor(ex06$lot)
[1] FALSE

> ex06$forn <- as.factor(ex06$forn)
> ex06$lot <- as.factor(ex06$lot)

> is.factor(ex06$resp)
[1] FALSE
> is.numeric(ex06$resp)
[1] TRUE

> summary(ex06)
 forn   lot        resp        
 1:12   1:9   Min.   :-4.0000  
 2:12   2:9   1st Qu.:-1.0000  
 3:12   3:9   Median : 0.0000  
        4:9   Mean   : 0.3611  
              3rd Qu.: 2.0000  
              Max.   : 4.0000

Nos comandos acima verificamos que o objeto ex06 possui 36 linhas correspondentes às observações e 3 colunas que correspondem às variáveis forn (fornecedor), lot (lote) e resp (a variável resposta).

A seguir verificamos que forn e lot não foram lidas como fatores. NÃO podemos seguir as análise desta forma pois o R leria os valores destas variáveis como quantidades numéricas e não como indicadores dos nívies dos fatores. Para corrigir isto usamos o comando as.factor para indicar ao R que estas variáveis são fatores.

Finalmente verificamos que a variável resposta é numérica e produzimos um rápido resumo dos dados.

Na sequêcia deveríamos fazer uma análise exploratória, alguns gráficos descritivos etc, como na análise do experimento da aula anterior. Vamos deixar isto por conta do leitor e passar direto para a análise de variância.

ADILSON DOS ANJOS 2005-11-07