Name: | Description: | Size: | Format: | |
---|---|---|---|---|
3.12 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
The inability of perceive all the color spectrum is a deficiency known as color blindness.
Generally, this kind of disease is caused by anomalies in the retinal cells or by their absence.
These cells are photoreceptors that show sensitivity to three different spectral light bands. In
this thesis specific color blindness type, known as Dichromacy, is treated. The Dichromacy is
a color vision defect in which, one of the three basic color mechanisms is lacking or not
functioning. It is the most significant colorblindness disease, having in account the incapacity
caused and knowing that it affects 3% of the world population. Protanopia, Deuteranopia and
Tritanopia are Dichromacy subclasses, each one affecting the perception of one of the tree
primary colors.
This disease is normally caused by a genetic source and has no treatment, neither based on
drugs nor based on surgery. It causes important limitations on the daily tasks execution and
can lead to several danger situations. For instance, buying fruits at the supermarket, choosing
clothes at the shop or in the traffic identifying the light colors.
There are several image processing algorithms that allow minimizing this problem. The used
methods are able to remap the original colors, which are not perceived by the color blindness
people, to the colors that are recognized by them. This is done trying not modifying the
original visual semantic. The most important methods that are able to perform those
transformations will be presented and discussed in this thesis, especially in what concerns to
their advantages and disadvantages to the image recognition by the color blind person.
Beyond the algorithms, a practical approach to the use of those techniques in mobile devices
is showed. Their ability to capture images (e.g. phone devices) can improve the everyday life
of the color blindness people and enrich their perception of reality.
The Human visual system is a very complex functional structure. From the retinal eye cells to
the visual cortex layers one can find a large number of physical phenomena contributing to
the performance of this mechanism. This fact makes the image processing tasks demand for
large computational power. The usually methods are able to map the pixels of the original image to the corrected image
concerning the color blindness spectral range. This process is supported by an optimization
task that allows keeping the visual semantic and, at the same time, increases the number of
perceived regions. However, these methods do not consider the spatial relation among the
color pixels, but only the relation among the color pixels values. This fact, in some images,
leads to an incorrect mapping, joining some regions that are separated in the original image.
The process presented in this thesis pretends to overcome this issue increasing the number of
visual situations that this type of algorithms is able to treat. The method is based on a texture
analysis process to demarcate the different colors of an image, thereby ensuring that the
mappings are not made to existing colors in the original image, which are belonging to
adjoining regions. Estamos tão acostumados ao nosso sistema visual que raramente nos apercebemos da
complexidade envolvida numa simples tarefa como abrir os olhos e visualizar o que nos
rodeia. Apesar de usarmos este sentido todos os dias, a visão é na realidade um fenómeno
bastante complicado e o olho é provavelmente um dos órgãos mais complexos do corpo
humano.
Estudos recentes indicam que cerca de 8% da população europeia apresenta anomalias ao
nível de algumas das células (cones) da retina. A nossa ferramenta primária de visão são os
olhos, são eles também um instrumento biológico de captura que, como uma simples câmara
fotográfica, recolhe, foca e processa a luz. A incapacidade do processo visual diferenciar
todas ou algumas cores é denominada de daltonismo; a ausência de um grupo de cones
sensíveis aos três comprimentos de onda (Longo, Médio e Curto) é chamado de dicromância
e pode apresentar-se sob a forma de protanopia, deuteranopia e tritanopia, respectivamente.
Esta perturbação tem normalmente origem genética, ocorre mais frequentemente nos
indivíduos de sexo masculino, pois está directamente ligado a uma anomalia no cromossoma
X. Até à data não existe cura nem com a ajuda de fármacos nem com intervenções cirúrgicas.
Torna-se então evidente desenvolver algoritmos (soluções) e implementá-los em mecanismos
que possam melhorar o dia-a-dia destas pessoas. A forte penetração de dispositivos móveis
(p.e. telemóveis, PDAs) nos mercados mundiais, equipados com sistemas de captação de
vídeo e imagem e com processadores mais rápidos, fazem deles uma opção estratégica, pois
acompanham, também eles, as pessoas no seu quotidiano. As tentativas de aumentar a
complexidade e o desempenho funcional dos algoritmos de correcção daltónica deparam-se
com as limitações ao nível da sua implementação física, este problema agrava-se quando
implementados em dispositivos móveis. A dissertação actual apresenta dois métodos de
correcção de imagens para deficientes de percepção da cor, no âmbito do processamento de
imagens, que permitem, por um lado, manter as cores naturais da imagem original e, por outro
lado, tornar perceptíveis as cores que são confundidas. No primeiro método, recorrendo ao
algoritmo proposto por Giovane R. Kuhn em 2008, são usados processos de quantização da
imagem original e recorre posteriormente a analogias físicas (mass-spring) para manter a
distância original entre as cores. No segundo método é sugerido um processo de análise de textura para demarcar as diferentes regiões de uma imagem garantindo assim que os
mapeamentos não serão feitos para cores, espacialmente adjacentes, já existentes na imagem
original.
Description
Keywords
Citation
Ferraz, Gilberto de Sousa (2011). Dispositivos móveis para a percepção cromática em deficientes dicromáticos. Bragança: Escola Superior de Tecnologia e Gestão. Dissertação em Sistemas de Informação
Publisher
Instituto Politécnico de Bragança, Escola Superior de Tecnologia e Gestão