Grupo 08

Christiano Augusto Caldas Teixeira

Tema: Segmentação de imagens

Artigo Final: artigofinal.pdf

Apresentação: segmentacao_de_imagens_naturais.pdf


1 Revisão Bibliográfica

A segmentação de imagem é descrito como o processo responsável por subdividir uma dada imagem em regiões homogêneas, que compartilhem determinada similaridade. Esse processo é de grande relevância em visão computacional e processamento e análise de imagens, possuindo grandes desafios ainda em abertos e largamente estudados. O motivo dessa grande importância pode ser justificado pelo fato da segmentação ser o primeiro passo para a análise e processamento de imagens [Gonzalez, R. C. and Woods, R. E. (1992)].

O produto da segmentação, como já dito, serão regiões ou objetos considerados relevantes para contexto no qual o método foi aplicado, descartando qualquer tipo de informação da imagem sem importância. O grande desafio é conseguir determinar quais atributos em uma imagem podem ser considerados relevantes e, quais podem ser descartados. Infelizmente essa não é uma tarefa trivial, já que atributos relevantes para uma classe de imagens, podem não ser relevantes para outras classes. Além disso, existe o problema da subjetividade humana, onde cada indivíduo possui uma percepção única de uma dada imagem. Isso significa que pessoas diferentes poderão considerar conjuntos diferentes de atributos relevantes em uma mesma imagem.

Ao longo do tempo, inúmeros métodos para segmentação foram propostos e estudados, cada um se objetivando em solucionar os problemas descritos [Pal, N. R., & Pal, S. K. (1993)]. Mas devido à grande complexidade dos problemas, relacionados principalmente à percepção de uma imagem, esses métodos propostos são restritos para determinadas classes de imagens. Isso significa que a grande maioria dos métodos são capazes de realizar a segmentação com eficiência para determinado tipo de imagens, mas não conseguem manter a mesma eficiência quando se utiliza outra imagem de outra classe.

Devido a essa falta de métodos eficientes para classe ou tipo variados de imagens, além da grande quantidade de métodos eficientes, mas restritos à determinados contextos, uma grande quantidade de trabalhos envolvendo métodos adaptativos e capazes de inferir decisão vem sendo propostos. Esses métodos têm como principal objetivo encontrar, dentre um conjunto de métodos de segmentação, aquele mais eficiente para determinada imagem[Liu, J. e Yang, Y. H(1994) , Zhang, H., Cholleti, S., Goldman , S. A. e. Fritts(2006)].

1.1 Objetivos

Esse trabalho tem como principal objetivo desenvolver um modelo de segmentação capaz de extrair de uma imagem dada, qualquer região que seja natural. Espera-se que esse modelo desenvolvido seja capaz de reconhecer à partir de uma imagem, regiões naturais na cena, para que assim essas possam ser extraídas dessa imagem original.

2 Metodologia

O processo de segmentação não é trivial e atualmente existem várias técnicas distintas para diferentes tipos de imagens e diferentes objetivos. Devido à isso, é necessário realizar um estudo detalhado sobre a classe de imagens com o qual se pretende trabalhar, para que seja possível determinar a abordagem para a segmentação que permitirá que os objetivos propostos sejam alcançados.

O processo utilizado para este trabalho é descrito na Figura 1. Inicialmente é feito o estudo sobre as classes de imagens que deseja-se segmentar, de modo à descrever suas principais características e encontrar padrões para diferir uma classe da outra. Esse estudo irá gerar o conhecimento que será usado para a segmentação da imagem.

Com o conhecimento sobre a classe das imagens adquirido, o processo de segmentação se inicia com a inserção de uma imagem de entrada no processo. Essa imagem é subdividida em regiões por um processo P, onde cada uma dessas regiões é classificada de acordo com o conhecimento adquirido. Caso a região avaliada pertença à mais de uma classe, o processo de subdivisão P é aplicada à esse região até que cada subregião possa ser classificada com exatidão. O produto da etapa de classificação serão regiões rotuladas de acordo com sua classes, tornando simples o processo de segmentação, executado em seguida.

2.1 Estudo das imagens

A estudo das imagens é de fundamental importancia para a escolha do método de segmentação adequado, capaz distinguir as regiões de interesse com perfeição. Para este trabalho, essa etapa tem principal objetivo encontrar diferencas entre cenas naturais e artificiais para que essas possam ser extraídas e separadas para uma dada imagem entrada.

Em Geisler, W. S.(2007), é realizado um estudo estatístico sobre vários aspectos visuais de cenas naturais, onde são determinados os padrões e distribuições para cada um desses aspectos. Esse estudo servirá como base para o presente trabalho, uma vez que os estudos sobre as imagens serão feitos em cima dos aspectos descritos em Geisler, W. S.(2007). Em contrapartida, os padrões e distribuições estatisticas encontrados para cada um dos aspectos da imagem, serão recalculados à partir de um conjunto de imagens adquiridas exclusivamente para esse trabalho.

Para o início do estudo, é necessário criar uma base de imagens contendo imagens de cenas naturais e cenas artificiais. De modo à simplificar esse estudo e aumentar a confiança dos resultados, todas essas imagens serão adquiridias por uma mesma camera, utilizando a mesma configuração. Além disso, é necessário classificar todas essas imagens em uma das duas classes possíveis uma vez que é necessário conhecer à priori a classe de cada imagem utilizada.

Com todas as imagens adquiridas e classificadas iremos calcular todos os atributos descritos em Geisler, W. S.(2007) para cada imagem para que assim possamos determinar a valor médio de cada atributo para cada classe. Nas subseções à seguir, serão descritos todos esses atributos utilizados.

2.1.1 Luminosidade e Contraste

A luminosidade determina a intensidade da luz capturada pela camera em cada um dos espectros de cor. A distribuição de luminosidade das imagens pode ser obtida através da combinação do histograma de todas as imagens, dividido pela histograma da média.

Já o contraste determina a variação de cor e luminosidade em um ponto em relação aos seus vizinhos, sendo calculado pela razão entre devio-padrão e média de luminosidade na vizinhança.

2.1.2 Cores

2.1.3 Estruturas espaciais

2.1.4 Distância

2.15 Estrutura Espaco-temporal

2.2 Divisão da Imagem

O processo de divisão será responsável por subdividir uma dada matriz de entrada que representa a imagem ou uma região dessa, em regiões menores. Essa etapa do processo é fundamental para o desempenho do sistema, já que classificar uma região é menos trabalhoso que classificar cada ponto da imagem. Além disso, analisando imagens de cenas naturais e artificiais percebemos que os elementos de cada uma das classes se encontram concentrados em regiões distintas da imagem e não espalhadas ao longo desta. Isso torna o processo de divisão ainda mais adequado para o processo proposto.

Para esse trabalho, o método de divisão escolhido foi o QuadTree. A QuadTree é uma estrutura de dados em formato de árvore, onde cada nó possui sempre quatro filhos. Cada imagem será então subdividiade em 4 regiões de mesmo tamanho para que a etapa de classificação possa ser realizada. Cada um dessas regiões poderá ser divida novamente em quatro novas regiões menores se necessário e assim, sucessivamente.

2.3 Classificação

A etapa de classificação, como o próprio nome já diz, irá classficar uma dada região da imagem em função da distribuição de seus aspectos para cada uma das classes estudadas. Para que a classificação possa ser realizada, a quantização dos aspectos dessa região deve ser realizados da mesma forma que realizados para as imagens de estudo.

Com base nas distribuções obtidas em cada região, é possível comparar esses dados calculados com os mesmos dados na base de conhecimento para cada uma das classes. A partir dessas comparações, é possível aplicar funções de probalidade de modo à determinar qual a probabilidade da região pertencer a cada uma de nossas classes.

À partir do resultado obtidos, decide-se se este é satisfatório para classificar a região. Um resultado satisfatório será aquele em que a probablidade da imagem pertercer à uma classe apenas é maior que um dado limiar de aceitação pré determinado. Caso o limiar seja respeitado, inicia-se a etapa de segmentação. Caso contrário a região é dividida para que a classificação possa ser realizada em cada uma de suas partes.

2.4 Segmentação

Com o processo de classificação realizado, a segmentação se torna muito simples. Essa etapa do processo será responsável por extrair da imagem original, cada uma das regiões da imagem que pertençam à determinada classe, gerando como produto uma ou mais imagens, cada uma contendo elementos de uma mesma classe.

Referências:

Andreetto, M. ,  Zelnik-Manor, L. e  Perona, P.(2007)   Non-Parametric Probabilistic Image Segmentation. ICCV 2007. IEEE 11th International Conference on, 1-8.

Cheng H.D., Jiang X.H., Sun Y., Wang J. (2001) Color image segmentation: Advances and prospects Pattern Recognition, 34 (12), pp. 2259-2281.

Gonzalez, R. C. and Woods, R. E. (1992). Digital Image Processing. Addison-Wesley.

Liu, J. e Yang, Y. H(1994). Multiresolution Color Image Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 17(7), 689-700.

Pal, N. R., & Pal, S. K. (1993). A review on image segmentation techniques. Pattern Recognition, 26, 1277–1294.

Zhang, H., Cholleti, S., Goldman , S. A. e. Fritts, J. E., Meta-Evaluation of Image Segmentation Using Machine Learning, Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, vol. 1, pp. 1138-1145, 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition - Volume 1 (CVPR'06), 2006.