Biblioteca Digital

949 resultados para Parallel programming (computer)

Dise��o e implementaci��n de un framework de presentaci��n para J2EE

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Dise��o de d'jNeko, un framework basado en acciones para la capa de presentaci��n de aplicaciones J2EE.

Veja mais

Tuning Performance of Multi-threaded programs

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Diplomity�� tarkastelee s��ikeistetty�� ohjelmointia rinnakkaisohjelmoinnin ylemm��ll�� hierarkiatasolla tarkastellen erityisesti hypers��ikeistysteknologiaa. Ty��ss�� tarkastellaan hypers��ikeistyksen hyvi�� ja huonoja puolia sek�� sen vaikutuksia rinnakkaisalgoritmeihin. Ty��n tavoitteena oli ymm��rt�� Intel Pentium 4 prosessorin hypers��ikeistyksen toteutus ja mahdollistaa sen hy��dynt��minen, miss�� se tuo suorituskyvyllist�� etua. Ty��ss�� ker��ttiin ja analysoitiin suorituskykytietoa ajamalla suuri joukko suorituskykytestej�� eri olosuhteissa (muistin k��sittely, k��nt��j��n asetukset, ymp��rist��muuttujat...). Ty��ss�� tarkasteltiin kahdentyyppisi�� algoritmeja: matriisioperaatioita ja lajittelua. N��iss�� sovelluksissa on s��nn��llinen muistink��ytt��kuvio, mik�� on kaksiter��inen miekka. Se on etu aritmeettis-loogisissa prosessoinnissa, mutta toisaalta huonontaa muistin suorituskyky��. Syyn�� siihen on nykyaikaisten prosessorien eritt��in hyv�� raaka suorituskyky s��nn��llist�� dataa k��sitelt��ess��, mutta muistiarkkitehtuuria rajoittaa v��limuistien koko ja useat puskurit. Kun ongelman koko ylitt�� tietyn rajan, todellinen suorituskyky voi pudota murto-osaan huippusuorituskyvyst��.

Veja mais

��tude des artefacts en tomodensitom��trie par simulation Monte Carlo

Relevância:

80.00% 80.00%

Publicador:

Resumo:

En radioth��rapie, la tomodensitom��trie (CT) fournit l��information anatomique du patient utile au calcul de dose durant la planification de traitement. Afin de consid��rer la composition h��t��rog��ne des tissus, des techniques de calcul telles que la m��thode Monte Carlo sont n��cessaires pour calculer la dose de mani��re exacte. L��importation des images CT dans un tel calcul exige que chaque voxel exprim�� en unit�� Hounsfield (HU) soit converti en une valeur physique telle que la densit�� lectronique (ED). Cette conversion est habituellement effectu��e �� l��aide d��une courbe d��talonnage HU-ED. Une anomalie ou artefact qui appara��t dans une image CT avant l��talonnage est susceptible d��assigner un mauvais tissu �� un voxel. Ces erreurs peuvent causer une perte cruciale de fiabilit�� du calcul de dose. Ce travail vise �� attribuer une valeur exacte aux voxels d��images CT afin d��assurer la fiabilit�� des calculs de dose durant la planification de traitement en radioth��rapie. Pour y parvenir, une ��tude est r��alis��e sur les artefacts qui sont reproduits par simulation Monte Carlo. Pour r��duire le temps de calcul, les simulations sont parall��lis��es et transpos��es sur un superordinateur. Une ��tude de sensibilit�� des nombres HU en pr��sence d��artefacts est ensuite r��alis��e par une analyse statistique des histogrammes. �� l��origine de nombreux artefacts, le durcissement de faisceau est ��tudi�� davantage. Une revue sur l��tat de l��art en mati��re de correction du durcissement de faisceau est pr��sent��e suivi d��une d��monstration explicite d��une correction empirique.

Veja mais

Nested parallelism for multi-core HPC systems using Java

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Since its introduction in 1993, the Message Passing Interface (MPI) has become a de facto standard for writing High Performance Computing (HPC) applications on clusters and Massively Parallel Processors (MPPs). The recent emergence of multi-core processor systems presents a new challenge for established parallel programming paradigms, including those based on MPI. This paper presents a new Java messaging system called MPJ Express. Using this system, we exploit multiple levels of parallelism - messaging and threading - to improve application performance on multi-core processors. We refer to our approach as nested parallelism. This MPI-like Java library can support nested parallelism by using Java or Java OpenMP (JOMP) threads within an MPJ Express process. Practicality of this approach is assessed by porting to Java a massively parallel structure formation code from Cosmology called Gadget-2. We introduce nested parallelism in the Java version of the simulation code and report good speed-ups. To the best of our knowledge it is the first time this kind of hybrid parallelism is demonstrated in a high performance Java application. (C) 2009 Elsevier Inc. All rights reserved.

Veja mais

Algoritmo evolutivo paralelo para o problema de atribui��o de localidades a an��is em redes sonet/sdh

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The telecommunications play a fundamental role in the contemporary society, having as one of its main roles to give people the possibility to connect them and integrate them into society in which they operate and, therewith, accelerate development through knowledge. But as new technologies are introduced on the market, increases the demand for new products and services that depend on the infrastructure offered, making the problems of planning of telecommunication networks become increasingly large and complex. Many of these problems, however, can be formulated as combinatorial optimization models, and the use of heuristic algorithms can help solve these issues in the planning phase. This paper proposes the development of a Parallel Evolutionary Algorithm to be applied to telecommunications problem known in the literature as SONET Ring Assignment Problem SRAP. This problem is the class NP-hard and arises during the physical planning of a telecommunication network and consists of determining the connections between locations (customers), satisfying a series of constrains of the lowest possible cost. Experimental results illustrate the effectiveness of the Evolutionary Algorithm parallel, over other methods, to obtain solutions that are either optimal or very close to it

Veja mais

Escalabilidade Paralela de um Algoritmo de Migra��o Reversa no Tempo (RTM) Pr��-empilhamento

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The seismic method is of extreme importance in geophysics. Mainly associated with oil exploration, this line of research focuses most of all investment in this area. The acquisition, processing and interpretation of seismic data are the parts that instantiate a seismic study. Seismic processing in particular is focused on the imaging that represents the geological structures in subsurface. Seismic processing has evolved significantly in recent decades due to the demands of the oil industry, and also due to the technological advances of hardware that achieved higher storage and digital information processing capabilities, which enabled the development of more sophisticated processing algorithms such as the ones that use of parallel architectures. One of the most important steps in seismic processing is imaging. Migration of seismic data is one of the techniques used for imaging, with the goal of obtaining a seismic section image that represents the geological structures the most accurately and faithfully as possible. The result of migration is a 2D or 3D image which it is possible to identify faults and salt domes among other structures of interest, such as potential hydrocarbon reservoirs. However, a migration fulfilled with quality and accuracy may be a long time consuming process, due to the mathematical algorithm heuristics and the extensive amount of data inputs and outputs involved in this process, which may take days, weeks and even months of uninterrupted execution on the supercomputers, representing large computational and financial costs, that could derail the implementation of these methods. Aiming at performance improvement, this work conducted the core parallelization of a Reverse Time Migration (RTM) algorithm, using the parallel programming model Open Multi-Processing (OpenMP), due to the large computational effort required by this migration technique. Furthermore, analyzes such as speedup, efficiency were performed, and ultimately, the identification of the algorithmic scalability degree with respect to the technological advancement expected by future processors

Veja mais

Projeto e implementa��o de uma plataforma MP-SoC usando SystemC

Relevância:

80.00% 80.00%

Publicador:

Resumo:

This work presents the concept, design and implementation of a MP-SoC platform, named STORM (MP-SoC DirecTory-Based PlatfORM). Currently the platform is composed of the following modules: SPARC V8 processor, GPOP processor, Cache module, Memory module, Directory module and two different modles of Network-on-Chip, NoCX4 and Obese Tree. All modules were implemented using SystemC, simulated and validated, individually or in group. The modules description is presented in details. For programming the platform in C it was implemented a SPARC assembler, fully compatible with gcc s generated assembly code. For the parallel programming it was implemented a library for mutex managing, using the due assembler s support. A total of 10 simulations of increasing complexity are presented for the validation of the presented concepts. The simulations include real parallel applications, such as matrix multiplication, Mergesort, KMP, Motion Estimation and DCT 2D

Veja mais

A transactional runtime system for the Cell/BE architecture

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Conselho Nacional de Desenvolvimento Cient��fico e Tecnol��gico (CNPq)

Veja mais

A development process proposal for the ERP5 system

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Modeling ERP software means capturing the information necessary for supporting enterprise management. This modeling process goes down through different abstraction layers, from enterprise modeling to code generation. Thus ERP is the kind of system where enterprise engineering undoubtedly has, or should have, a strong influence. For the case of Free/Open Source ERP, the lack of proper modeling methods and tools can jeopardize the advantage brought by source code availability. Therefore, the aim of this paper is to present a development process proposal for the Open Source ERP5 system. The proposed development process aims to cover different abstraction levels, taking into account well established standards and common practices, as well as platform issues. Its main goal is to provide an adaptable meta-process to ERP5 adopters. �� 2006 IEEE.

Veja mais

Algoritmos busca tabu paralelos aplicados ao planejamento da expans��o da transmiss��o de energia el��trica

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Coordena��o de Aperfei��oamento de Pessoal de N��vel Superior (CAPES)

Veja mais

Estrat��gia de decomposi��o aplicada ao problema de planejamento da expans��o de sistemas de distribui��o

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Funda��o de Amparo �� Pesquisa do Estado de S��o Paulo (FAPESP)

Veja mais

Modelagem 1D e 2,5D de dados do m��todo CSEM marinho em meios com anisotropia transversal inclinada

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Neste trabalho apresentamos a solu��o do campo eletromagn��tico gerado por um dipolo el��trico horizontal em meios transversalmente isotr��picos com eixo de simetria vertical (TIV) e com eixo de simetria inclinado (TII). Para modelos unidimensionais, o campo eletromagn��tico foi obtido por duas metodologias distintas: (1) solu��o semi-anal��tica das equa��es de Maxwell com aux��lio de potenciais vetores no caso TIV e (2) em modelos com anisotropia transversal inclinada o campo eletromagn��tico foi separado em prim��rio e secund��rio, e ent��o, o campo secund��rio foi calculado pelo m��todo de elementos finitos no dom��nio (kx, ky, z) da transformada de Fourier. Para estruturas bidimensionais, foi aplicada a mesma metodologia usado nos modelos TII unidimensionais, onde o campo secund��rio foi calculado pelo m��todo de elementos finitos no dom��nio (x, ky, z), da transformada de Fourier, com a utiliza��o de malhas n��o estruturadas para discretiza��o dos modelos. Estas respostas foram usados para avaliar os efeitos da anisotropia el��trica nos dados CSEM marinho 1D e 2,5D.

Veja mais

Avalia��o de Desempenho de Aplica��es Paralelas Utilizando MPI e PETSc

Relevância:

80.00% 80.00%

Publicador:

Resumo:

This work presents a study about the use of standards and directions on parallel programming in distributed systems, using the MPI standard and PETSc toolkit, performing an analysis of their performances over certain mathematic operations involving matrices. The concepts are used to develop applications to solve problems involving Principal Components Analysis (PCA), which are executed in a Beowulf cluster. The results are compared to the ones of an analogous application with sequencial execution, and then it is analized if there was any performance boost on the parallel application

Veja mais

MWRegEx : monitor web de expresiones regulares

Relevância:

80.00% 80.00%

Publicador:

Resumo:

[ES] El Trabajo de Fin de Grado, Monitor Web de Expresiones Regulares (MWRegEx), es una herramienta basada en tecnolog��as web, desarrollada usando el entorno Visual Studio. El objetivo principal de la aplicaci��n es dar apoyo a la docencia de expresiones regulares, en el marco de la ense��anza del manejo de ristras de caracteres en las asignaturas de programaci��n del Grado en Ingenier��a Inform��tica.�� La aplicaci��n permite obtener el dibujo de un aut��mata de una expresi��n regular, facilitando su comprensi��n; adem��s, permite aplicar la expresi��n a diferentes ristras de caracteres, mostrando las coincidencias encontradas, y ofrece una versi��n de la expresi��n adaptada a su uso en literales string de lenguajes como Java y otros. La herramienta se ha implementado en dos partes: un servicio web, escrito en C#, donde se realizan todos los an��lisis de las expresiones regulares y las ristras a contrastar; y un cliente web, implementado usando tecnolog��a asp.net, con JavaScript y JQuery, que gestiona la interfaz de usuario y muestra los resultados. Esta separaci��n permite que el servicio web pueda ser reutilizado con otras aplicaciones cliente. El aut��mata que representa una expresi��n regular esta dibujado usando la librer��a Rapha��l JavaScript que permite manejar los elementos SVG. Cada elemento de la expresi��n regular tiene un dibujo diferente y ��nico para as�� diferenciarlo. Toda la interfaz gr��fica de usuario est�� internacionalizada de manera tal que pueda adaptarse a diferentes idiomas y regiones sin la necesidad de realizar cambios de ingenier��a ni en el c��digo. Tanto el servicio web como la parte cliente est��n estructurados para que se puedan agregar nuevas modificaciones sin que esto genere una onda expansiva a lo largo de las diversas clases existentes.

Veja mais

Tecniche di ottimizzazione del software per sistemi su singolo chip per applicazioni di Nomadic Computing

Relevância:

80.00% 80.00%

Publicador:

Resumo:

I moderni sistemi embedded sono equipaggiati con risorse hardware che consentono l��esecuzione di applicazioni molto complesse come il decoding audio e video. La progettazione di simili sistemi deve soddisfare due esigenze opposte. Da un lato �� necessario fornire un elevato potenziale computazionale, dall��altro bisogna rispettare dei vincoli stringenti riguardo il consumo di energia. Uno dei trend pi�� diffusi per rispondere a queste esigenze opposte �� quello di integrare su uno stesso chip un numero elevato di processori caratterizzati da un design semplificato e da bassi consumi. Tuttavia, per sfruttare effettivamente il potenziale computazionale offerto da una batteria di processori�� necessario rivisitare pesantemente le metodologie di sviluppo delle applicazioni. Con l��avvento dei sistemi multi-processore su singolo chip (MPSoC) il parallel programming si �� diffuso largamente anche in ambito embedded. Tuttavia, i progressi nel campo della programmazione parallela non hanno mantenuto il passo con la capacit�� di integrare hardware parallelo su un singolo chip. Oltre all��introduzione di multipli processori, la necessit�� di ridurre i consumi degli MPSoC comporta altre soluzioni architetturali che hanno l��effetto diretto di complicare lo sviluppo delle applicazioni. Il design del sottosistema di memoria, in particolare, �� un problema critico. Integrare sul chip dei banchi di memoria consente dei tempi d��accesso molto brevi e dei consumi molto contenuti. Sfortunatamente, la quantit�� di memoria on-chip che pu�� essere integrata in un MPSoC �� molto limitata. Per questo motivo �� necessario aggiungere dei banchi di memoria off-chip, che hanno una capacit�� molto maggiore, come maggiori sono i consumi e i tempi d��accesso. La maggior parte degli MPSoC attualmente in commercio destina una parte del budget di area all��implementazione di memorie cache e/o scratchpad. Le scratchpad (SPM) sono spesso preferite alle cache nei sistemi MPSoC embedded, per motivi di maggiore predicibilit��, minore occupazione d��area e �� soprattutto �� minori consumi. Per contro, mentre l��uso delle cache �� completamente trasparente al programmatore, le SPM devono essere esplicitamente gestite dall��applicazione. Esporre l��organizzazione della gerarchia di memoria ll��applicazione consente di sfruttarne in maniera efficiente i vantaggi (ridotti tempi d��accesso e consumi). Per contro, per ottenere questi benefici �� necessario scrivere le applicazioni in maniera tale che i dati vengano partizionati e allocati sulle varie memorie in maniera opportuna. L��onere di questo compito complesso ricade ovviamente sul programmatore. Questo scenario descrive bene l��esigenza di modelli di programmazione e strumenti di supporto che semplifichino lo sviluppo di applicazioni parallele. In questa tesi viene presentato un framework per lo sviluppo di software per MPSoC embedded basato su OpenMP. OpenMP �� uno standard di fatto per la programmazione di multiprocessori con memoria shared, caratterizzato da un semplice approccio alla parallelizzazione tramite annotazioni (direttive per il compilatore). La sua interfaccia di programmazione consente di esprimere in maniera naturale e molto efficiente il parallelismo a livello di loop, molto diffuso tra le applicazioni embedded di tipo signal processing e multimedia. OpenMP costituisce un ottimo punto di partenza per la definizione di un modello di programmazione per MPSoC, soprattutto per la sua semplicit�� d��uso. D��altra parte, per sfruttare in maniera efficiente il potenziale computazionale di un MPSoC �� necessario rivisitare profondamente l��implementazione del supporto OpenMP sia nel compilatore che nell��ambiente di supporto a runtime. Tutti i costrutti per gestire il parallelismo, la suddivisione del lavoro e la sincronizzazione inter-processore comportano un costo in termini di overhead che deve essere minimizzato per non comprometterre i vantaggi della parallelizzazione. Questo pu�� essere ottenuto soltanto tramite una accurata analisi delle caratteristiche hardware e l��individuazione dei potenziali colli di bottiglia nell��architettura. Una implementazione del task management, della sincronizzazione a barriera e della condivisione dei dati che sfrutti efficientemente le risorse hardware consente di ottenere elevate performance e scalabilit��. La condivisione dei dati, nel modello OpenMP, merita particolare attenzione. In un modello a memoria condivisa le strutture dati (array, matrici) accedute dal programma sono fisicamente allocate su una unica risorsa di memoria raggiungibile da tutti i processori. Al crescere del numero di processori in un sistema, l��accesso concorrente ad una singola risorsa di memoria costituisce un evidente collo di bottiglia. Per alleviare la pressione sulle memorie e sul sistema di connessione vengono da noi studiate e proposte delle tecniche di partizionamento delle strutture dati. Queste tecniche richiedono che una singola entit�� di tipo array venga trattata nel programma come l��insieme di tanti sotto-array, ciascuno dei quali pu�� essere fisicamente allocato su una risorsa di memoria differente. Dal punto di vista del programma, indirizzare un array partizionato richiede che ad ogni accesso vengano eseguite delle istruzioni per ri-calcolare l��indirizzo fisico di destinazione. Questo �� chiaramente un compito lungo, complesso e soggetto ad errori. Per questo motivo, le nostre tecniche di partizionamento sono state integrate nella l��interfaccia di programmazione di OpenMP, che �� stata significativamente estesa. Specificamente, delle nuove direttive e clausole consentono al programmatore di annotare i dati di tipo array che si vuole partizionare e allocare in maniera distribuita sulla gerarchia di memoria. Sono stati inoltre sviluppati degli strumenti di supporto che consentono di raccogliere informazioni di profiling sul pattern di accesso agli array. Queste informazioni vengono sfruttate dal nostro compilatore per allocare le partizioni sulle varie risorse di memoria rispettando una relazione di affinit�� tra il task e i dati. Pi�� precisamente, i passi di allocazione nel nostro compilatore assegnano una determinata partizione alla memoria scratchpad locale al processore che ospita il task che effettua il numero maggiore di accessi alla stessa.

Veja mais

949 resultados para Parallel programming (computer)

Filtro por publicador