O objetivo dessa seção é utilizar o gráfico de dispersão para identificar possíveis relações de causa e efeito.
Serão utilizados os dados sobre o tempo de parada em um linha de produção: arquivo.
> linha<-read.table("linha.txt",header=T) > linha
Para fazer um gráfico de dispersão, utiliza-se a função plot(x,y)
.
Para os dados de tempo de parada da linha, pode-se estar interessado em avaliar se existe alguma relação entre o tempo de parada e turno de trabalho.
> attach(linha) > plot(turno,tempo)
Nesse gráfico, observa-se que não há uma estreita relação entre o turno de produção e tempo de parada. Em todos os turnos, o comportamento dos tempos de para possui o mesmo comportamento, considerando todos os códigos de parada.
Pode-se, também, investigar o comportamento dos tempos de parada para cada código. Um gráfico de dispersão entre códigos e tempo de parada mostra o comportamento desses dados.
> plot(cod,tempo)
No gráfico, aparecem códigos que possuem uma dispersão maior do que outros, além de as freqüências serem diferentes. Visualmente, por existirem muitos códigos de parada, o gráfico não ficou claro. Por isso, pode-se estudá-lo em partes. Por exemplo, visualizando apenas os códigos menores do que 100.
> plot(cod[which(cod<100)],tempo[which(cod<100)],cex=.2,pch=19)
Pode-se subdividir mais. Vamos experimentar estudar os códigos de 20 a 40.
plot(cod[which(cod<=40 & cod>=20)], tempo[which(cod<=40&cod>=20)], cex=.2,pch=19)
Pelo gráfico, pode-se perceber que o código 31 apresenta uma grande freqüência e com valores altos de tempo de parada. Para outros códigos, além da freqüência, o tempo total de parada é uma informação importante para descobrir qual código está causando mais tempo de parada.
> tapply(tempo[which(cod<=40 & cod>=20)], cod[which(cod<=40 & cod>=20)], sum) 31 32 33 34 35 36 38 5473 190 326 1081 737 396 47
Observe que os códigos 34 e 35 são os que possuem os maiores tempos totais de parada no período estudado.
O comnado pairs()
faz todos os possíveis gráficos de dispersão entre as colunas de um data.frame
.
> pairs(linha,cex=.3,pch=19)
Analise os gráficos!
adilson dos anjos 2008-09-18