Biblioteca Digital do Instituto Politécnico de Bragança   Instituto Politécnico de Bragança

Biblioteca Digital do IPB >
Escola Superior de Tecnologia e Gestão >
Informática e Comunicações >
IC - Teses de Doutoramento >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10198/1499

Título: Técnicas de segmentação e de classificação em imagens. Estudo de um caso de aplicação
Autor: Rodrigues, Pedro
Palavras-chave: Redes neuronais
Segmentação de imagens
Classificação de imagens
Computação quântica
Leucócitos
Neural networks
Image segmentation
Image classification
Quantum computation
Leukocytes
Issue Date: 2008
Editora: Universidade do Minho
Citação: Rodrigues, Pedro - Técnicas de segmentação e de classificação em imagens. Estudo de um caso de aplicação. Braga: Universidade do Minho, 2007. Tese de Doutoramento em Informática Industrial, Ramo de Electrónica Industrial
Resumo: Os processos de segmentação de imagens existentes continuam a estar intensamente relacionados com o problema para o qual foram pensados. Um sistema que produz segmentações de elevado sucesso num determinado problema pode falhar por completo se aplicado, sem modificações, a um outro problema. Mecanismos de segmentação que se aproximem, em capacidade generalista, ao sistema visual humano têm sido procurados pela comunidade científica. Nesta tese são estudadas técnicas e apresentados alguns contributos orientados para a melhoria da capacidade generalista e do desempenho dos sistemas de segmentação. Os processos de classificação de imagens podem aparecer como parte funcional aos mecanismos de segmentação ou então como utilizadores dos resultados da segmentação. Em qualquer das formas o problema da classificação, no caso do processamento de imagens, relaciona-se, também, com a capacidade generalista do método usado para a classificação. Os classificadores aqui estudados são estabelecidos, de forma automática, a partir de um conjunto de amostras de treino. A eficácia generalista desse treino está subjugada não só à qualidade de treino, mas também intrinsecamente à natureza dos classificadores. Estes tendem a diminuir o seu desempenho à medida que a dimensão estrutural do problema aumenta. Os contributos aqui correntes visam minimizar os problemas do aumento da dimensionalidade e simultaneamente obter um bom grau de generalização na classificação de imagens. O desempenho temporal destes mecanismos está, normalmente, relacionado de forma exponencial com o aumento do bom comportamento funcional. São consideradas algumas vertentes que visam minimizar este problema. O classificador estudado e comparado nesta tese é o SVM (Support Vector Machine). É proposto aqui como mecanismo adjuvante da segmentação e da classificação de imagens. São estudados os momentos de Zernike, descritores numéricos de regiões, que possibilitam a redução estrutural dos problemas de segmentação e de classificação. Relativamente à segmentação são mostradas as impossibilidades de se conseguir uma parametrização generalista. Deste facto, é descrito um processo que, partindo de uma base de segmentação multi-escala, procura, através de parametrização exaustiva e recorrendo à quântica computacional, atingir as melhores segmentações e por consequência as melhores classificações. Outros processos propostos nesta tese, que também buscam a generalização na segmentação de imagens e na classificação de imagens, são apresentados por conciliações entre estruturas de redes neuronais não supervisionadas (redes de acoplamento por pulsos –Pulse Coupled Neural Networks–) e estruturas de classificadores supervisionados (Support Vector Machine). Ainda relativamente às redes de acoplamento por pulsos, são apresentadas adições à sua estrutura com o objectivo de estas melhorarem o seu comportamento na codificação de contornos. Por que todos estes processos, apesar de produzirem algumas melhorias funcionais, demandam uma grande capacidade computacional, são também indicadas duas soluções de aceleração computacional. Estas propostas são de índole quântica. Uma tem vertente quântica menos dirigida e baseia-se nos fenómenos de difracção de partículas em orifícios circulares e na sua respectiva interferência e a outra é de natureza dirigida e integra-se na disciplina da computação quântica. É ainda demonstrada a possibilidade de a difracção de partículas em orifícios ser descrita por equações de funções de onda quântica. Image segmentation processes, nowadays, continue to be closely related to the problem for which they had been designed. A system that produces a highly accurate segmentation in one problem can fail if applied without modifications to another problem. Segmentation methods that were able to reach the generalization capacity of the human visual system have been pursued for the scientific community. In this thesis some contributions aimed at the improvement of the generalization capacity in segmentation systems are presented. Image classification processes can appear as a functional part in the segmentation mechanisms or can use the results of the segmentation to achieve their goals. In both cases, the classification problem in image processing becomes related also with the generalization capacity of the used classification method. The classifying processes studied here are generated, in an automatic form, from a set of training data. The generalist effectiveness of these trainings is a function not only of the quality of trainings, but also of the classifying nature. These tend to diminish their performance in relation to the growth of the structural dimension of the problem. The current contributions aim to minimize the curse of dimensionality problems and simultaneously to get a good generalization level in image classification. These systems show a temporal exponential growth with the proximity of optimum results. Some approaches towards reducing this problem are suggested. The classifier studied in this thesis is the SVM (Support Vector Machine). It is proposed as a component in the segmentation and in process of classification of images. The Zernike moments as numerical region descriptors are studied, since they enable structural dimension reduction in segmentation and classification. With regard to segmentation, the impracticality of achieving a generalist parameterization is shown. Then, a process is described that, having its origin in multiscale segmentation, attempts to achieve the better segmentation and consequently the better classification, using an exhaustive parameterization and using quantum computation. There are other proposed methods in this thesis that attempt to arrive at generalization in the segmentation and in the classification processes. They are formed by the conciliation among unsupervised neural networks (Pulse Coupled Neural Networks) and supervised classifiers (Support Vector Machine). With regard to the Pulse Coupled Neural Networks, components to increase the functional performance of the edge codification are added to its structure. All these processes bring some functional improvement, but the necessary computational effort to achieve it is huge. Thus, in this thesis two solutions to speed up some image processing methods are presented. One solution is constructed by using the particle diffraction phenomenon in circular apertures and its interferences. The other one uses quantum computation. In the quantum diffraction field, the possibility of describing the particle diffraction in circular apertures using wave function equations is proved. In this thesis the segmentation and the classification of leukocytes is the case study that was used to verify the behavior of the majority of these methods in natural images. O caso de aplicação estudado que serviu para avaliar, com imagens naturais, a maior parte dos processos, assenta na segmentação e na classificação visual de leucócitos humanos.
URI: http://hdl.handle.net/10198/1499
Appears in Collections:IC - Teses de Doutoramento

Files in This Item:

File Description SizeFormat
phd PJSR.pdf4,55 MBAdobe PDFView/Open

Statistics
FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 


  © Instituto Politécnico de Bragança - Biblioteca Digital - Feedback - Statistics
  Estamos no RCAAP Governo Português separator Ministério da Educação e Ciência   Fundação para a Ciência e a Tecnologia

Financiado por:

POS_C UE