Uso de técnicas de reconhecimento de padrões para a detecção de logotipos em imagens. Introdução Reconhecimento de padrões é um estudo de técnicas de aprendizado de máquina que visam identificar padrões através de modelos estatísticos. As técnicas de reconhecimento de padrões possuem dois modos: treinamento e teste [1]. O modo de treinamento consiste em treinar a máquina para uma dada tarefa utilizando algum algoritmo de aprendizado. O treinamento por sua vez pode ser dividido em três fases: pré-processamento, extração de características e aprendizado. A fase de pré-processamento visa tratar os dados de entrada com o objetivo de reduzir o ruído, normalizar a entrada, segmentar áreas de interesse, enfim, trasformar a entrada de tal forma que apenas informações relevantes sejam realçadas. A fase de extração de características visa transformar a entrada em um conjunto de vetores contendo as características mais relevantes da entrada. A fase de aprendizado utiliza os vetores de características como entrada para algum algoritmo ou modelo de aprendizado de máquina, como redes neurais, k-means. O modo de teste tem por objetivo validar o que foi realizado durante o treinamento. Durante o teste, também são executadas a fase de pré-processamento e de extração de características, da mesma maneira em que foram executadas durante o modo de treinamento. No entanto, neste modo a terceira fase usa o algoritmo de aprendizado proposto para classificar os vetores obtidos. Proposta O objetivo deste trabalho consiste em investigar técnicas de pré-processamento, de extração de características e de algoritmos de aprendizado de máquina que se adequem ao problema de detecção do logotipo em imagens. O escopo deste problema será limitada a detecção de logotipos somente em imagens, visto que sua resolução pode ser posteriormente extendida para vídeos, pois um vídeo é uma sequência de imagens. Serão utilizadas informações de cores assim como informações do domínio da frequência dos logotipos a serem buscados. Pretende-se testar e comparar as seguintes técnicas: PCA (para análise da extração de características), k-means, redes neurais (para classificação e treinamento). Será utilizada para execução deste trabalho a ferramenta Scilab sob sistema operacional Linux. Para aprendizado de máquina, será utilizado a ferramenta de código aberto Weka [2]. Referências [1] Jain, Anil K. ; Duin, Robert P. W. ; Mao Jianchang. Statistical Pattern Recognition: A Review. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 22, NO. 1, JANUARY 2000. Disponível em http://www.mts.jhu.edu/~priebe/COURSES/FALL2003/550.730/jdm00.pdf. [2] Weka 3: Data Mining Software in Java. Disponível em http://www.cs.waikato.ac.nz/ml/weka/ Listas de exercícios: {{:cursos:visao:2010-1:grupo10:lista1.pdf|}} {{:cursos:visao:2010-1:grupo10:lista2.pdf|}} {{:cursos:visao:2010-1:grupo10:lista3.pdf|}} Artigo Final: {{:cursos:visao:2010-1:grupo10:artigo.pdf|}}