Subsections

22 Gráfico de dispersão

Objetivo

O objetivo dessa seção é utilizar o gráfico de dispersão para identificar possíveis relações de causa e efeito.

Arquivo de dados

Serão utilizados os dados sobre o tempo de parada em um linha de produção: arquivo.

> linha<-read.table("linha.txt",header=T)
> linha

Gráfico de dispersão

Para fazer um gráfico de dispersão, utiliza-se a função plot(x,y).

Para os dados de tempo de parada da linha, pode-se estar interessado em avaliar se existe alguma relação entre o tempo de parada e turno de trabalho.

> attach(linha)
> plot(turno,tempo)

Nesse gráfico, observa-se que não há uma estreita relação entre o turno de produção e tempo de parada. Em todos os turnos, o comportamento dos tempos de para possui o mesmo comportamento, considerando todos os códigos de parada.

Pode-se, também, investigar o comportamento dos tempos de parada para cada código. Um gráfico de dispersão entre códigos e tempo de parada mostra o comportamento desses dados.

> plot(cod,tempo)

No gráfico, aparecem códigos que possuem uma dispersão maior do que outros, além de as freqüências serem diferentes. Visualmente, por existirem muitos códigos de parada, o gráfico não ficou claro. Por isso, pode-se estudá-lo em partes. Por exemplo, visualizando apenas os códigos menores do que 100.

> plot(cod[which(cod<100)],tempo[which(cod<100)],cex=.2,pch=19)

Pode-se subdividir mais. Vamos experimentar estudar os códigos de 20 a 40.

plot(cod[which(cod<=40 & cod>=20)], tempo[which(cod<=40&cod>=20)],
cex=.2,pch=19)

Pelo gráfico, pode-se perceber que o código 31 apresenta uma grande freqüência e com valores altos de tempo de parada. Para outros códigos, além da freqüência, o tempo total de parada é uma informação importante para descobrir qual código está causando mais tempo de parada.

> tapply(tempo[which(cod<=40 & cod>=20)], 
  cod[which(cod<=40 & cod>=20)], sum)
  31   32   33   34   35   36   38 
5473  190  326 1081  737  396   47

Observe que os códigos 34 e 35 são os que possuem os maiores tempos totais de parada no período estudado.

O comnado pairs() faz todos os possíveis gráficos de dispersão entre as colunas de um data.frame.

> pairs(linha,cex=.3,pch=19)

Analise os gráficos!

adilson dos anjos 2008-09-18