Repository logo
 
Publication

Aglomeração não hierárquica em sistemas distribuídos de recuperação de informação

dc.contributor.authorExposto, José
dc.date.accessioned2010-02-12T16:36:50Z
dc.date.available2010-02-12T16:36:50Z
dc.date.issued1997
dc.description.abstractA procura de documentos relevantes em colecções de grandes dimensões é um processo que envolve uma carga computacional muito elevada e uma enorme necessidade em termos de capacidade de armazenamento de dados. Apesar de toda a investigação feita, no sentido de minimizar o espaço físico ocupado pelos documentos, através de técnicas de filtragem, eliminação de palavras comuns e radicalização, são ainda exigidas grandes necessidades de armazenamento devido ao grande número de documentos das colecções. Se aliarmos as técnicas de aglomeração à distribuição de cada um dos aglomerados, por máquinas ligadas por uma rede de grande velocidade, podemos repartir o espaço ocupado pela totalidade da colecção e tirar ainda partido da utilização concorrente do poder computacional de várias máquinas, quer no processo de classificação, quer no processo de selecção de documentos relevantes a pedidos de utilizadores. A investigação apresentada nesta tese tem por objectivo verificar as potencialidades reais da distribuição dos aglomerados de documentos e fazer uma estudo comparativo do desempenho de um sistema de Recuperação de Informação variando o número de aglomerados nos modos local e distribuído. The search for relevant documents in huge collections requires very high computer load and storage overhead. Although, many research has been made towards the minimization of the document overall space overhead through stoplist techniques and stemming, the storage needed to support 60 big collections is still very high. Putting together the decomposition of big collections using clustering algorithms, and their distribution in a high speed network, it would be possible to divide the total document space by each of the network machines, and yet to get concurrent computational processing resources from those same machines. It is the goal of this thesis to verify the real potentialities of clustering distribution making a comparative study of the performance of an Information Retrieval system changing the number of clusters and confronting a local and distributed mode of that system.pt
dc.identifier.citationExposto, José (1997). Aglomeração não hierárquica em sistemas distribuídos de recuperação de informação. Braga: Universidade do Minho. Dissertação de Mestrado em Informáticapt
dc.identifier.urihttp://hdl.handle.net/10198/1894
dc.language.isoporpt
dc.publisherUniversidade do Minhopt
dc.titleAglomeração não hierárquica em sistemas distribuídos de recuperação de informaçãopt
dc.typemaster thesis
dspace.entity.typePublication
person.familyNameExposto
person.givenNameJosé
person.identifier.ciencia-idDA10-808F-99EA
person.identifier.orcid0000-0003-3857-6083
person.identifier.scopus-author-id56619498700
rcaap.rightsopenAccesspt
rcaap.typemasterThesispt
relation.isAuthorOfPublication66fd8128-90b1-4754-936e-2d9e9e0829ec
relation.isAuthorOfPublication.latestForDiscovery66fd8128-90b1-4754-936e-2d9e9e0829ec

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
TESE.PDF
Size:
683.75 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.82 KB
Format:
Item-specific license agreed upon to submission
Description: