Otsu considera que o histograma, por ser uma representação da frequencia de ocorrência de os valores digitais na imagem, pode ser visto como a distribuição da probabilidade dos valores digitais ocorrer na imagem. Ou seja, se o valor da frequencia (ni) de um determinado valor digital (i) for baixo, a probabilidade deste (p(i)) é baixa. Então, o histograma da imagem pode ser tratado como uma Função Densidade de Probabilidade Discreta :
com i= 0,1,2,……255 (*pode ser outro valor máximo)
N = número total de pixels na imagem
Então, se um determinado limiar "T" for escolhido, ele divide os pixels em dois grupos: Grupo1 (entre [0, T-1] ) e Grupo2 (entre [T, 255]). Na figura ao lado são mostrados três casos de divisão dos valores do histograma com um limiar T, O primeiro grupo, escuro, é formado pelos pixels com valor abaixo do limiar. Como os grupos não são completamente uniformes, a dispersão de cada grupo em torno de sua média pode ser descrita pela sua variância (S).
É considerado que o Limiar ideal T é aquele que minimiza a variância (S) dentro das classes.
Na figura (a) A variância do primeiro grupo é baixa, mas a do segundo grupo é muito alta.
O inverso ocorre na figura (b).
A combinação da variância dos dois grupos pode ser estimada fazendo a soma ponderada das variâncias "dentro" de cada classe.
A ideia do método é obter grupos o mais uniformes possíveis como no caso da figura (c), ou seja, minimizar a soma das variâncias dentro de cada grupo.
Minimizar a variância dentro das classes equivale a Maximizar a variância "entre" classes:
var(entre) = var(total) - p1* var(Grupo1) + p2* var(Gupo2)
var(entre) = p1 *(m1-m)^2 + p2*(m2-m)^2
var(entre) = p1 *p2 *(m1-m2)^2
Operacionalmente, calcula-se todos os valores possíveis de T (1-254) e escolhe-se aquele que maximizar a variância "entre" classes. Para cada valor "i" calcula-se a média de cada grupo, a probabilidade de cada grupo e o peso de cada grupo, para assim poder determinar a variância entre as classes. Após calcular todas as possíveis variâncias, escolhe-se o limiar que está associado ao maior valor de var(entre).
Consulte:Otsu N.,"A Threshold Selection Method from Gray-level Histograms”, IEEE Transactions on Systems, Man and Cybernetics, v. SMC 9, no 1, pp.62-66, 1979.
Agora você pode voltar ao menu principal, ou ao menu desta aula ou continuar para o próximo módulo .
Jorge Centeno: centeno@ufpr.br