Biblioteca Digital

6 resultados para parallel processing systems

em Biblioteca Digital de Teses e Dissertações Eletrônicas da UERJ

Implementação de algoritmos genéticos paralelos em uma arquitetura MPSoC.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Essa dissertação apresenta a implementação de um algoritmo genético paralelo utilizando o modelo de granularidade grossa, também conhecido como modelo das ilhas, para sistemas embutidos multiprocessados. Os sistemas embutidos multiprocessados estão tornando-se cada vez mais complexos, pressionados pela demanda por maior poder computacional requerido pelas aplicações, principalmente de multimídia, Internet e comunicações sem fio, que são executadas nesses sistemas. Algumas das referidas aplicações estão começando a utilizar algoritmos genéticos, que podem ser beneficiados pelas vantagens proporcionadas pelo processamento paralelo disponível em sistemas embutidos multiprocessados. No algoritmo genético paralelo do modelo das ilhas, cada processador do sistema embutido é responsável pela evolução de uma população de forma independente dos demais. A fim de acelerar o processo evolutivo, o operador de migração é executado em intervalos definidos para realizar a migração dos melhores indivíduos entre as ilhas. Diferentes topologias lógicas, tais como anel, vizinhança e broadcast, são analisadas na fase de migração de indivíduos. Resultados experimentais são gerados para a otimização de três funções encontradas na literatura.

Veja mais

DistributedCL: middleware de processamento distribuído em GPU com interface da API OpenCL.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Este trabalho apresenta a proposta de um middleware, chamado DistributedCL, que torna transparente o processamento paralelo em GPUs distribuídas. Com o suporte do middleware DistributedCL uma aplicação, preparada para utilizar a API OpenCL, pode executar de forma distribuída, utilizando GPUs remotas, de forma transparente e sem necessidade de alteração ou nova compilação do seu código. A arquitetura proposta para o middleware DistributedCL é modular, com camadas bem definidas e um protótipo foi construído de acordo com a arquitetura, onde foram empregados vários pontos de otimização, incluindo o envio de dados em lotes, comunicação assíncrona via rede e chamada assíncrona da API OpenCL. O protótipo do middleware DistributedCL foi avaliado com o uso de benchmarks disponíveis e também foi desenvolvido o benchmark CLBench, para avaliação de acordo com a quantidade dos dados. O desempenho do protótipo se mostrou bom, superior às propostas semelhantes, tendo alguns resultados próximos do ideal, sendo o tamanho dos dados para transmissão através da rede o maior fator limitante.

Veja mais

Paralelização do algoritmo FDK para reconstrução 3D de imagens tomográficas usando unidades gráficas de processamento e CUDA-C

Relevância:

80.00% 80.00%

Publicador:

Resumo:

A obtenção de imagens usando tomografia computadorizada revolucionou o diagnóstico de doenças na medicina e é usada amplamente em diferentes áreas da pesquisa científica. Como parte do processo de obtenção das imagens tomográficas tridimensionais um conjunto de radiografias são processadas por um algoritmo computacional, o mais usado atualmente é o algoritmo de Feldkamp, David e Kress (FDK). Os usos do processamento paralelo para acelerar os cálculos em algoritmos computacionais usando as diferentes tecnologias disponíveis no mercado têm mostrado sua utilidade para diminuir os tempos de processamento. No presente trabalho é apresentada a paralelização do algoritmo de reconstrução de imagens tridimensionais FDK usando unidades gráficas de processamento (GPU) e a linguagem CUDA-C. São apresentadas as GPUs como uma opção viável para executar computação paralela e abordados os conceitos introdutórios associados à tomografia computadorizada, GPUs, CUDA-C e processamento paralelo. A versão paralela do algoritmo FDK executada na GPU é comparada com uma versão serial do mesmo, mostrando maior velocidade de processamento. Os testes de desempenho foram feitos em duas GPUs de diferentes capacidades: a placa NVIDIA GeForce 9400GT (16 núcleos) e a placa NVIDIA Quadro 2000 (192 núcleos).

Veja mais

Coprocessador para operações quânticas.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

A demanda crescente por poder computacional estimulou a pesquisa e desenvolvimento de processadores digitais cada vez mais densos em termos de transistores e com clock mais rápido, porém não podendo desconsiderar aspectos limitantes como consumo, dissipação de calor, complexidade fabril e valor comercial. Em outra linha de tratamento da informação, está a computação quântica, que tem como repositório elementar de armazenamento a versão quântica do bit, o q-bit ou quantum bit, guardando a superposição de dois estados, diferentemente do bit clássico, o qual registra apenas um dos estados. Simuladores quânticos, executáveis em computadores convencionais, possibilitam a execução de algoritmos quânticos mas, devido ao fato de serem produtos de software, estão sujeitos à redução de desempenho em razão do modelo computacional e limitações de memória. Esta Dissertação trata de uma versão implementável em hardware de um coprocessador para simulação de operações quânticas, utilizando uma arquitetura dedicada à aplicação, com possibilidade de explorar o paralelismo por replicação de componentes e pipeline. A arquitetura inclui uma memória de estado quântico, na qual são armazenados os estados individuais e grupais dos q-bits; uma memória de rascunho, onde serão armazenados os operadores quânticos para dois ou mais q-bits construídos em tempo de execução; uma unidade de cálculo, responsável pela execução de produtos de números complexos, base dos produtos tensoriais e matriciais necessários à execução das operações quânticas; uma unidade de medição, necessária à determinação do estado quântico da máquina; e, uma unidade de controle, que permite controlar a operação correta dos componente da via de dados, utilizando um microprograma e alguns outros componentes auxiliares.

Veja mais

Um algoritmo em paralelo para solução de equações diferenciais evolutivas

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Este trabalho que envolve matemática aplicada e processamento paralelo: seu objetivo é avaliar uma estratégia de implementação em paralelo para algoritmos de diferenças finitas que aproximam a solução de equações diferenciais de evolução. A alternativa proposta é a substituição dos produtos matriz-vetor efetuados sequencialmente por multiplicações matriz-matriz aceleradas pelo método de Strassen em paralelo. O trabalho desenvolve testes visando verificar o ganho computacional relacionado a essa estratégia de paralelização, pois as aplicacações computacionais, que empregam a estratégia sequencial, possuem como característica o longo período de computação causado pelo grande volume de cálculo. Inclusive como alternativa, nós usamos o algoritmo em paralelo convencional para solução de algoritmos explícitos para solução de equações diferenciais parciais evolutivas no tempo. Portanto, de acordo com os resultados obtidos, nós observamos as características de cada estratégia em paralelo, tendo como principal objetivo diminuir o esforço computacional despendido.

Veja mais

Proposição de um indicador global de funcionalidade operacional para sistemas de processamento primário em instalações marítimas de produção de petróleo: estudo de caso para o sistema de separação e tratamento de óleo

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Este texto verificou o tema de monitoramento de processos de produção de petróleo em plataformas no mar de forma a propor indicadores globais para monitoramento da funcionalidade dos equipamentos que envolvem estes processos, permitindo a antecipação da tomada de decisão sobre suas eminentes quedas de disponibilidade. Para tal, buscando conhecer as áreas envolvidas na gestão de uma plataforma de petróleo no mar, foram identificados os principais sistemas relacionados ao processo de produção de petróleo e optou-se pelo Sistema de Separação e Tratamento de Óleo para desenvolvimento e validação dos indicadores propostos. O Indicador Global de Funcionalidade Operacional (IGFO) foi desenvolvido a partir dos dados disponíveis para monitoramento dos processos de produção de petróleo, focado nas visões das principais áreas envolvidas na gestão da plataforma. Este indicador foi elaborado com objetivo de simplificar a análise dos processos, permitindo assim aferir o desempenho das ações de monitoramento de processos em plataformas de petróleo, de modo a atuar de forma antecipativa, contribuindo com a identificação e a disseminação das melhores práticas de manutenção preditiva. Neste aspecto, os indicadores na forma de normalização utilizada permitem comparações em diversos níveis, tanto em relação as plataformas dentro de uma empresa, como plataformas de empresas diferentes. Os indicadores globais propostos obtiveram resultados que permitiram avaliar a queda de funcionalidade dos equipamentos do Sistema de Separação e Tratamento de Óleo durante o período avaliado, servindo de base para identificação das causas das falhas destes equipamentos. Assim sendo, pôde-se perceber que a utilização dos indicadores globais identificados pode responder com sucesso às necessidades propostas

Veja mais

6 resultados para parallel processing systems

em Biblioteca Digital de Teses e Dissertações Eletrônicas da UERJ

Filtro por publicador

Implementação de algoritmos genéticos paralelos em uma arquitetura MPSoC.

DistributedCL: middleware de processamento distribuído em GPU com interface da API OpenCL.

Paralelização do algoritmo FDK para reconstrução 3D de imagens tomográficas usando unidades gráficas de processamento e CUDA-C

Coprocessador para operações quânticas.

Um algoritmo em paralelo para solução de equações diferenciais evolutivas

Proposição de um indicador global de funcionalidade operacional para sistemas de processamento primário em instalações marítimas de produção de petróleo: estudo de caso para o sistema de separação e tratamento de óleo