Revisão de matemática
Estatística multivariada: Os conceitos de média e variância podem ser estendidos a mais de uma variável. No caso de uma imagem de satélite, cada pixel contém informações de diferentes regiões do espectro eletromagnético, armazenada como valores digitais. Assim sendo, cada pixel pode ser descrito com um vetor:![](images/equacao-covariancia.gif)
Veja que nesta equação temos dois elementos: (x-média(x) ), ou seja a diferença entre o valor e a média em uma banda e (y-média(y) ), que é a diferença entre o valor na banda "y" e a média na banda "y". Estes dois elementos são multiplicados.
multiplicação | (y-média(y)) positivo | (y-média(y)) negativo |
(x-média(x) ) positivo | positivo | negativo |
(x-média(x) ) negativo | negativo | positivo |
Por outro lado, se valores abaixo da média em "y" ocorrem quando ocorrem valores acima da média em "x"? E valores acima da média em "y" são encontrados quando ocorrem valores abaixo da média em "x"(caso (b)? Neste caso, o resultado da multiplicação será sempre negativo e a covariância alta, mas negativa. Em ambos casos, pode-se dizer que existe dependência linear entre as variáveis "x" e "y", pois a dispersão tende a se alinhar.
Mas um valor alto de "x" pode estar associado a valores altos ou baixos de "y", sem nenhuma tendência (caso (c))? Neste caso, a somatória incluiria valores positivos e negativos, que iriam se compensar e o resultado seria um valor baixo, próximo de zero para a covariância.
Finalmente, a correlação entre duas bandas "x" e "y" pode ser calculada como:
Esta variável está diretamente associada à covariância.
Se a covariância for positiva, então a correlação será também positiva, porque o valor do desvio padrão, raiz da variância, é sempre positivo. A correlação varia entre -1 e +1.
No quadro ao lado são mostradas as matrizes de variância-covariância e correlação das bandas do azul, verde, vermelho, infravermelho próximo e infravermelho médio de uma região no Paraná. Pode dizer quais bandas são mais parecidas? e quais são mais diferentes (não tem correlação?). Pode-se dizer que, se a correlação for alta, as bandas são redundantes, ou seja, a informação de uma está contida na outra? E por que a diagonal da matriz de correlação contém apenas 1.00?
Para continuar voce pode voltar ao menu principal ou continuar parao próxima módulo de autovalores .
Jorge Centeno: centeno@ufpr.br