Loading...
27 results
Search Results
Now showing 1 - 10 of 27
- Aglomeração não hierárquica em sistemas distribuídos de recuperação de informaçãoPublication . Exposto, JoséA procura de documentos relevantes em colecções de grandes dimensões é um processo que envolve uma carga computacional muito elevada e uma enorme necessidade em termos de capacidade de armazenamento de dados. Apesar de toda a investigação feita, no sentido de minimizar o espaço físico ocupado pelos documentos, através de técnicas de filtragem, eliminação de palavras comuns e radicalização, são ainda exigidas grandes necessidades de armazenamento devido ao grande número de documentos das colecções. Se aliarmos as técnicas de aglomeração à distribuição de cada um dos aglomerados, por máquinas ligadas por uma rede de grande velocidade, podemos repartir o espaço ocupado pela totalidade da colecção e tirar ainda partido da utilização concorrente do poder computacional de várias máquinas, quer no processo de classificação, quer no processo de selecção de documentos relevantes a pedidos de utilizadores. A investigação apresentada nesta tese tem por objectivo verificar as potencialidades reais da distribuição dos aglomerados de documentos e fazer uma estudo comparativo do desempenho de um sistema de Recuperação de Informação variando o número de aglomerados nos modos local e distribuído. The search for relevant documents in huge collections requires very high computer load and storage overhead. Although, many research has been made towards the minimization of the document overall space overhead through stoplist techniques and stemming, the storage needed to support 60 big collections is still very high. Putting together the decomposition of big collections using clustering algorithms, and their distribution in a high speed network, it would be possible to divide the total document space by each of the network machines, and yet to get concurrent computational processing resources from those same machines. It is the goal of this thesis to verify the real potentialities of clustering distribution making a comparative study of the performance of an Information Retrieval system changing the number of clusters and confronting a local and distributed mode of that system.
- Red blood cells radial dispersion in blood flowing through microchannels: the role of temperaturePublication . Pinho, Diana; Rodrigues, Raquel Oliveira; Faustino, Vera; Yaginuma, Tomoko; Exposto, José; Lima, Rui A.The behavior of suspensions of individual blood cells, such as red blood cells (RBCs), flowing through microvessels and microfluidic systems depend strongly on the hematocrit (Hct), microvessel topology and cell properties. Although it is well known that blood rheological properties are temperature dependent, to the best of our knowledge no work has studied the role of the temperature on the RBCs dispersion. A powerful way to investigate this latter effect is through a high-speed video microscopy system, which provides detailed flow measurements of each individual RBC. Hence, the effect of temperature on the RBCs dispersion flowing through a 100 μm glass capillary was examined by means of a confocal micro-PTV system. Hundreds of labeled RBCs were tracked at moderate Hct (12%) and at four different temperatures, i.e., 25 °C, 32 °C, 37 °C and 42 °C. The results yielded an enhancement of the RBCs diffusion as the temperature increases. Hence, our findings show that RBCs radial dispersion is temperature dependent and as a result the temperature should not be ignored in future blood flow studies. We believe that this finding is important for a better understanding of blood mass transport mechanisms under both physiological and pathological conditions.
- Scalable multithreading in a low latency myrinet clusterPublication . Alves, Albano; Pina, António; Rufino, José; Exposto, JoséIn this paper we present some implementation details of a programming model – pCoR – that combines primitives to launch remote processes and threads with communication over Myrinet.B asically, we present the efforts we have made to achieve high performance communication among threads of parallel/distributed applications. The expected advantages of multiple threads launched across a low latency cluster of SMP workstations are emphasized with a graphical application that manages huge maps consisting of several JPEG images.
- Deploying applications in multi-SAN SMP Clusters (extended version)Publication . Alves, Albano; Pina, António; Rufino, José; Exposto, JoséThe effective exploitation of multi-SAN SMP clusters and the use of generic clusters to support complex information systems require new approaches; multi-SAN SMP clusters introduce new levels of parallelism and traditional environments are mainly used to run scientific computations. In this paper we present a novel approach to the exploitation of clusters that allows integrating in a unique metaphor: the representation of physical resources, the modelling of applications and the mapping of application into physical resources. The proposed abstractions favoured the development of an API that allows combining and benefiting from the shared memory, message passing and global memory paradigms.
- Projeto europeu para a educação em alterações climáticas e tecnologias web associadasPublication . Gonçalves, Vitor; Exposto, José; Patrício, Maria Raquel; Silva, Elisabete Mendes; Chumbo, Isabel; Garcia-Tartera, Francisco; Castiñeiras, PedroNesta última década, as alterações climáticas têm vindo a ser colocadas no topo da agenda mundial. Em algumas regiões, os efeitos correspondem a chuvas torrenciais e outros eventos climáticos extremos, noutras a secas e ondas extremas de calor. Espera-se que esses acontecimentos se intensifiquem nas próximas décadas. Uma vez que os países do arco do Mediterrâneo são particularmente vulneráveis às mudanças climáticas, pareceu-nos adequado propor um projeto que contribuísse para a formação de estudantes e professores europeus em questões de mudança climática. Assim, no âmbito do programa Erasmus+, Key Action: Cooperation for innovation and the exchange of good practices, Action Type: Strategic Partnerships for higher education, foi proposto e aprovado o projeto “CTwoSEAS - climate change: science, ethics and society”, referência n.º 2019-1-ES01-KA203-064188, que decorrerá de 01 de outubro de 2019 a 31 de julho de 2022. Desta parceria estratégica fazem parte as seguintes instituições: Complutense University of Madrid (Spain), Instituto Politécnico de Bragança (Portugal), Industrial and Business Education and Training Institute – SEV (Greece), Akdeniz University (Turkey) e University of Basilicata (Italy). O principal objetivo deste projeto é contribuir para uma sociedade mais instruída em questões de alterações climáticas, a fim de reforçar as políticas da UE contra a mudança climática, abordando o assunto do ponto de vista científico, ético-social, filosófico e económico. Assim, o projeto CTwoSEAS propõe o desenvolvimento multidisciplinar de um curso numa plataforma de e-Learning complementado com um espaço digital (página da web) e uma comunidade de prática. A integração de todas estas plataformas representa um aspeto crucial para contribuir para a usabilidade e a acessibilidade do ambiente web. No final do projeto, será realizado um evento intitulado "Mudança climática: da ciência à sociedade". Este evento será uma janela para divulgar o projeto a outras instituições de ensino da UE e ao público em geral. O presente resumo corresponde à apresentação em poster do projeto CTwoSEAS e dos seus parceiros, dos seus objetivos principais e respetivas etapas para alcançar os principais resultados: intellectual outputs: i) Guia metodológico (orientará o projeto e organização da temática, incluindo métodos inovadores de aprendizagem); ii) Guia de ensino e aprendizagem (incluirá objetivos e competências a abordar, o conteúdo, o plano estratégico de aprendizagem e de avaliação); iii) Comunidade de prática e respetiva plataforma de e-Learning onde será alojado o curso sobre alterações climáticas, entre outros recursos de aprendizagem. Espera-se que este projeto promova e reforce a cooperação entre as instituições parceiras e contribua para a melhoria da internacionalização de estudantes e professores. A longo prazo espera-se contribuir para uma sociedade mais instruída sobre questões climáticas e mais disposta a apoiar as políticas da União Europeia para minimizar as alterações climáticas.
- Full-speed scalability of the pDomus platform for DHTsPublication . Rufino, José; Pina, António; Alves, Albano; Exposto, José; Lopes, Rui PedroDomus is an architecture for Distributed Hash Tables (DHTs) tailored to a shared-all cluster environment. Domus DHTs build on a (dynamic) set of cluster nodes; each node may perform routing and/or storage tasks, for one or more DHTs, as a function of the node base (static) resources and of its (dynamic) state. Domus DHTs also benefit from a rich set of user-level attributes and operations. pDomus is a prototype of Domus that creates an environment where to evaluate the architecture concepts and features. In this paper, we present a set of experiments conduced to obtain figures of merit on the scalability of a specific DHT operation, with several lookup methods and storage technologies. The evaluation also involves a comparison with a database and a P2P-oriented DHT platform. The results are promising, and a motivation for further work.
- Estratégias de partição para a optimização da descarga distribuída de WebPublication . Exposto, JoséFace à imensidão de informação na Web, a descarga de páginas utilizada, por exemplo, em motores de pesquisa, sugere a criação de um sistema de agentes distribuídos (robôs) que descarreguem vários servidores em simultâneo. Porém, quando procuramos optimizar os mecanismos de descargas somos confrontados, pela necessidade de obedecer às actuais políticas de delicadeza que obrigam à existência de um intervalo de tempo mínimo entre dois pedidos de descarga, ao mesmo servidor. Uma outra dificuldade resulta da forma como as páginas estão distribuídas, uma vez que a maior percentagem está alojada em apenas um pequeno número de servidores, provocando um desnivelamento significativo entre servidores com poucas páginas e servidores (mais densos) com elevado número de páginas. O aumento do desempenho de cada agente é alcançável através da diminuição do intervalo de descarga, do aumento do número de conexões http persistentes e/ou repartindo as páginas existentes pelos servidores Web mais densos por vários robôs. No entanto, se considerarmos que o valor daquele intervalo deve permanecer constante, para o universo de todos os servidores, a tentativa de usar qualquer uma daquelas opções conduz necessariamente à violação das políticas de delicadeza. Todavia, sendo razoável esperar que a capacidade de processamento e comunicação de um servidor cresça na razão directa da respectiva densidade, podemos considerar que o intervalo de descarga pode ser reduzido na proporção inversa. Isto é, podemos fazer variar o tempo de delicadeza nos pedidos de descarga a um servidor no sentido de adaptar o intervalo à respectiva densidade. Esta dissertação surge como uma alternativa aos processos tradicionais da descarga da Web, capaz de reduzir o tempo total de descarga de páginas e minimizar a sobrecarga de comunicação necessária à sincronização de uma colecção de agentes distribuídos. Subjacente está uma infra-estrutura de comunicações e uma arquitectura de descarga que comporta a existência de entidades dedicadas ao particionamento do espaço Web e a sua alocação a um conjunto de robôs distribuídos, organizados hierarquicamente através da definição de entidades lógicas. Durante o processo de descarga das páginas é recolhida informação para gerar configurações de divisão da Web, através da aplicação de algoritmos de partição de grafos, baseados em modelos da Internet obtidos por aproximação calculada por caminhos mais curtos no grafo gerado. The hugeness of the Web suggests the creation of distributed agent systems (crawlers) to download several sites simultaneously, for instance, in search engine crawling operations. However, the optimization of crawling download operations faces the need to comply with current politeness policies which require a minimum period of time between two consecutive requests to same server. Another difficulty arises from the distribution of the number of pages on the servers, where a large percentage is hosted in a small number of servers, causing a significant unevenness between servers with few pages and dense servers with a lot of pages. On each crawler performance increase may be achieved through the reduction of the politeness time interval, increase of the number of http persistent connections and/or subdividing dense servers by several crawlers. Nevertheless, considering that the politeness interval should remain constant, for the universe of all the servers, any attempt to use any of the remaining options, leads, inevitably, to the violation of the politeness policies. However, considering the expectation that the density of a server grows proportional to its processing and communication capabilities, it is feasible to consider a reduction in the politeness interval inversely proportional. In other words, politeness interval may be adjusted during download requests to a server based on its density. This dissertation appears as an alternative to the traditional download processes, able to reduce the total page download time and to minimize the communication overhead required to synchronize the collection of distributed crawlers. Underneath the crawling’s operations lays a communication infrastructure and a download architecture embracing the existence of dedicated Web space partitioning entities and its allocation to the distributed crawler set, organized hierarchically through logical entities. Throughout the download process additional information is gathered to generate the resulting division of the Web through the application of graph partitioning algorithms based on models of the Internet obtained by approximation by shortest paths on the generated graph.
- meμ: unifying application modeling and cluster exploitationPublication . Alves, Albano; Pina, António; Rufino, José; Exposto, JoséThe increasing complexity of high-demand long-running applications has faced programmers with the need to take into account both development hardness and execution time. meu provides the flexibility to control the amount of computational and communication power being used in order to maximize resources utilization and to deliver high performance. In this paper we focus on the aspects of the paradigm that go beyond traditional message passing approaches, promoting the idea that by raising the abstraction level of programming models, programmers will make better use of the available resources with clear impact on both productivity and performance. We introduce the resource as the abstraction used to represent and manage both physical resources – nodes, memory, processors and communication technologies – and logical resources – modules, processes, tasks, threads, groups, etc. We also concentrate on the task of specifying, locating and aggregating resources in order to support the mapping of applications into the target cluster hardware and the explicit management of memory hierarchy.
- Domus - an architecture for cluster-oriented distributed Hash tablesPublication . Rufino, José; Pina, António; Alves, Albano; Exposto, JoséThis paper presents a high level description of Domus, an architecture for cluster-oriented Distributed hash Tables. As a data management layer, Domus supports the concurrent execution of multiple and heterogeneous DHTs, that may be simultaneously accessed by different distributed/parallel client applications. At system level, a load balancement mechanism allows for the (re)distribution of each DHT over cluster nodes, based on the monitoring of their resources, including CPUs, memory, storage and network. Two basic units of balancement are supported: vnodes, a coarse-grain unit, and partitions, a fine-grain unit. The design also takes advantage of the strict separation of object lookup and storage, at each cluster node, and for each DHT. Lookup follows a distributed strategy that benefits from the joint analysis of multiple partition-specific routing information, to shorten routing paths. Storage is accomplished through different kinds of data repositories, according to the specificity and requirements of each DHT.
- RoCL: a resource oriented communication libraryPublication . Alves, Albano; Pina, António; Rufino, José; Exposto, JoséRoCL is a communication library that aims to exploit the low-level communication facilities of today’s cluster networking hardware and to merge, via the resource oriented paradigm, those facilities and the high-level degree of parallelism achieved on SMP systems through multi-threading. The communication model defines three major entities – contexts, resources and buffers – which permit the design of high-level solutions. A low-level distributed directory is used to support resource registering and discovering. The usefulness and applicability of RoCL is briefly addressed through a basic modelling example – the implementation of TPVM over RoCL. Performance results for Myrinet and Gigabit Ethernet, currently supported in RoCL through GM and MVIA, respectively, are also presented.
- «
- 1 (current)
- 2
- 3
- »