UNIVERSIDADE FEDERAL DE MINAS GERAIS \\ INSTITUTO DE CIÊNCIAS EXATAS \\ DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO \\ Curso: Pós Graduação em Ciência da Computação \\ Disciplina: Visão Computacional Sala 2029 ICEx, segundas e quartas, das 11:10h às 12:50h \\ 1º Semestre de 2008 Professor: Mario Fernando Montenegro Campos ([[mario@dcc.ufmg.br]]) \\ Monitor: Armando Alves Neto ([[aaneto@dcc.ufmg.br]]) ====== Plano de Curso ====== ===== Objetivo ===== O objetivo principal deste curso é prover uma visão panorâmica da área e dos fundamentos de visão computacional e suas aplicações. Ao final do curso o aluno deverá ser capaz de identificar os principais problemas e paradigmas, bem como as principais metodologias, algoritmos e heurísticas normalmente utilizados em Visão Computacional. A abordagem utilizada para se alcançar esse objetivo baseia-se, fundamentalmente, em utilizar o ferramental teórico na implementação de soluções para problemas reais, em particular, na realização de um trabalho específico a ser desenvolvido ao longo do semestre. ===== Pré-requisitos ===== Conhecimento básico de álgebra linear, cálculo, análise numérica e física. Conhecimento de pelo menos uma linguagem de programação (Matlab ou C, de preferência). ===== Descrição do Curso ===== Este é um curso introdutório em visão computacional, onde os principais problemas serão apresentados juntamente com técnicas clássicas para sua resolução. Inicialmente será apresentado o processo básico de captura e processamento de baixo nível da imagem. Ao processamento da imagem segue-se a identificação de características que venham a auxiliar na obtenção da forma espacial dos objetos na cena. Pontos relevantes de outras disciplinas como óptica, processamento digital de imagens, reconhecimento de padrões, belas artes, computação gráfica, psicofísica, psicologia e neuro-fisiologia também serão discutidos. Alguns princípios básicos para resolução de problemas em inteligência artificial, focalizando nas áreas de compreensão de imagens e robótica serão apresentados. Entretanto, não se trata de um curso introdutório de IA e portanto conhecimento prévio desta área não será necessário. Os tópicos a serem cobertos incluem: * Representação de imagem/forma/objeto; * Várias técnicas para recuperação de formas 3D; * Arquiteturas de visão e paralelismo. ===== Programa do Curso ===== O curso seguirá, aproximadamente, a seguinte estrutura baseada no livro de Trucco e Verri: - Visão geral, história e introdução à visão computacional; - Imagens Digitais; - Ruído na Imagem; - Características na Imagem; - Calibração de Câmeras; Estereópse. - Tópicos em Movimento, Shape-from-X, Reconhecimento e Localização. ===== Avaliação ===== O aproveitamento do aprendizado do aluno será medido por meio de exercícios, uma prova e principalmente um trabalho prático que será desenvolvido ao longo do semestre com relatórios e apresentações intermediárias, um artigo e apresentação final dos resultados. A distribuição de notas será a seguinte: ^ ^ Quantidade ^ Total ^ |Exercícios | 3 | 20% | |Prova | 2 | 20% | |Trabalho Prático | 1 | 40% | Exercícios deverão ser entregues pelo aluno na data marcada, no início da aula. A nota será reduzida de 20% do valor total para cada 24 horas de atraso na entrega. O trabalho prático será divido nas seguintes etapas: - Definição do tema - Revisão Bibliográfica - Metodologia a ser adotada - Planejamento dos experimentos - Resultados preliminares - Artigo - Apresentação * Cada etapa deverá ser disponibilizada na página www do aluno. A página deverá conter um //link// para um arquivo denominado primeiro_nome_do_aluno.zip. * A revisão bibliográfica deverá ser discutida criticamente, e não apenas conter menções a artigos. O arquivo .bib deverá estar disponível na página. * O artigo deverá ser escrito utilizando o LaTeX, e deverá ter 15 páginas no formato de submissão do Sibgrapi. * As apresentações serão realizadas ao final do semestre, em data a ser agendada, e serão de 15 minutos com 5 minutos para perguntas. ===== Referências Bibliográficas ===== * Emanuele Trucco and Alessandro Verri, Introductory Techniques for 3-D Computer Vision, Prentice Hall, New Jersey, 1998. * David A. Forsyth and Jean Ponce, Computer Vision - A Modern Approach, Prentice Hall, New Jersey, 2003. * Yi Ma, Stefano Soato, Jana Kosecka e Shanker Saastry - An Invitation to 3D Vision: From images to Geometric Models, 2006. * B.K.P. Horn, Robot Vision, MIT Press, 1986. * Dana Ballard and Christopher Brown, Computer Vision, Prentice Hall, 1982. * K. R. Castleman, Digital Image Processing, Prentice Hall, 1979. * Rafael C. Gonzalez and Richard E. Woods, Addison Wesley, Reading, 1992. * Stuart Russel and Peter Norvig, Artificial Intelligence - A Modern Approach, 2nd. Edition, Prentice-Hall, New Jersey, 2003.