Biblioteca Digital

4 resultados para Hardware

em Repositorio Institucional de la Universidad de Málaga

Improvements in Hardware Transactional Memory for GPU Architectures

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In the multi-core CPU world, transactional memory (TM)has emerged as an alternative to lock-based programming for thread synchronization. Recent research proposes the use of TM in GPU architectures, where a high number of computing threads, organized in SIMT fashion, requires an effective synchronization method. In contrast to CPUs, GPUs offer two memory spaces: global memory and local memory. The local memory space serves as a shared scratch-pad for a subset of the computing threads, and it is used by programmers to speed-up their applications thanks to its low latency. Prior work from the authors proposed a lightweight hardware TM (HTM) support based in the local memory, modifying the SIMT execution model and adding a conflict detection mechanism. An efficient implementation of these features is key in order to provide an effective synchronization mechanism at the local memory level. After a quick description of the main features of our HTM design for GPU local memory, in this work we gather together a number of proposals designed with the aim of improving those mechanisms with high impact on performance. Firstly, the SIMT execution model is modified to increase the parallelism of the application when transactions must be serialized in order to make forward progress. Secondly, the conflict detection mechanism is optimized depending on application characteristics, such us the read/write sets, the probability of conflict between transactions and the existence of read-only transactions. As these features can be present in hardware simultaneously, it is a task of the compiler and runtime to determine which ones are more important for a given application. This work includes a discussion on the analysis to be done in order to choose the best configuration solution.

Veja mais

Aportaciones al hardware para sensores t��ctiles inteligentes basados en FPGAs

Relevância:

20.00% 20.00%

Publicador:

Resumo:

En esta tesis doctoral se presentan distintas soluciones para la adquisici��n de datos provenientes de matrices de sensores resistivos, y en concreto de sensores t��ctiles piezorresistivos. Los circuitos propuestos reducen el hardware de acondicionamiento y adquisici��n cl��sico, implementado una conexi��n directa entre el sensor y el dispositivo digital (FPGA) que recibe los datos. El objetivo es la adquisici��n en paralelo y con bajo coste y consumo de ��rea de grandes cantidades de datos provenientes de los sensores matriciales, aprovechando las capacidades de las FPGAs para llevar a cabo medidas simult��neas de varios sensores. Dependiendo del tipo de direccionamiento que pueda ser empleado, dos soluciones son propuestas. En el caso donde el n��mero de unidades sensoriales de la matriz no sea excesivamente alto y el direccionamiento pueda ser realizado sin compartir conexionado, el valor de resistencia de los distintos elementos de la matriz se obtiene a partir del tiempo de descarga de una red RC o integrador pasivo que incluye al sensor. Por otro lado, para matrices con un gran n��mero de elementos o donde el direccionamiento de los mismos haga uso de conexiones compartidas, el uso de un circuito integrador activo reduce la diafon��a entre los elementos medidos simult��neamente. El an��lisis y caracterizaci��n de los circuitos propuestos para un rango de resistencias de un sensor t��ctil piezorresistivo da lugar a una resoluci��n efectiva en la conversi��n anal��gico-digital de 10 bits y 8 bits para los circuitos de conexi��n directa basados en el integrador pasivo y activo, respectivamente. En cuanto a la exactitud en la medida del valor de resistencia, se alcanzan errores relativos del 0,066% (integrador pasivo) y del 0,77% (integrador activo), empleando una novedosa t��cnica de calibraci��n que hace uso de un ��nico elemento de referencia. Por ��ltimo, se propone una arquitectura para un sistema t��ctil basada en los circuitos anteriormente citados. Dos implementaciones se han desarrollado: un prototipo para caracterizaci��n y pruebas de laboratorio, y otro para un demostrador en una mano rob��tica comercial (mano de Barrett). Con estas realizaciones se comprueba que el sistema t��ctil es capaz de realizar el refresco del conjunto de sensores con una tasa lo suficientemente alta para aplicaciones que requieran una r��pida respuesta din��mica (por ejemplo, detecci��n de deslizamiento de objetos en tareas de manipulaci��n con manos rob��ticas). Adem��s, el paralelismo de las FPGAs no s��lo se explota en la adquisici��n de datos, sino que el pre-procesado que puede realizarse en el sensor inteligente resultante tiene un gran potencial. Como ejemplo, en este trabajo se extraen los momentos geom��tricos y la elipse asociados a las im��genes t��ctiles adquiridas por cada uno de los sensores que conforman el sistema.

Veja mais

Insights into the Fallback Path of Best-Effort Hardware Transactional Memory Systems

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Current industry proposals for Hardware Transactional Memory (HTM) focus on best-effort solutions (BE-HTM) where hardware limits are imposed on transactions. These designs may show a significant performance degradation due to high contention scenarios and different hardware and operating system limitations that abort transactions, e.g. cache overflows, hardware and software exceptions, etc. To deal with these events and to ensure forward progress, BE-HTM systems usually provide a software fallback path to execute a lock-based version of the code. In this paper, we propose a hardware implementation of an irrevocability mechanism as an alternative to the software fallback path to gain insight into the hardware improvements that could enhance the execution of such a fallback. Our mechanism anticipates the abort that causes the transaction serialization, and stalls other transactions in the system so that transactional work loss is mini- mized. In addition, we evaluate the main software fallback path approaches and propose the use of ticket locks that hold precise information of the number of transactions waiting to enter the fallback. Thus, the separation of transactional and fallback execution can be achieved in a precise manner. The evaluation is carried out using the Simics/GEMS simulator and the complete range of STAMP transactional suite benchmarks. We obtain significant performance benefits of around twice the speedup and an abort reduction of 50% over the software fallback path for a number of benchmarks.

Veja mais

Irrevocabilidad Relajada para Memoria Transaccional Hardware

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Los sistemas comerciales que ofrecen memoria transaccional (TM) implementan un sistema hardware best-effort (BE-HTM) con limitaciones. Es necesario programar un fallback software basado en cerrojos para asegurar el progreso de la aplicaci��n. En este art��culo se propone un nuevo tipo de irrevocabilidad hardware (un modo transaccional que marca las transacciones como no abortables) para hacer frente a las limitaciones de los sistemas BE-HTM de una manera mas eficiente, y para liberar a al usuario de tener que programar un fallback. Se basa en el concepto de suscripci��n relajada utilizada o en el contexto de la programaci��n de fallbacks basada o en cerrojos, donde la transacci��n se suscribe al cerrojo al final de la misma en lugar de al principio. El mecanismo de irrevocabilidad relajada hardware no involucra cambios en el protocolo de coherencia y se compara con su hom��logo software, que proponemos como un fallback con suscripci��n relajada de espera escapada. Tambi��n proponemos la irrevocabilidad relajada con anticipaci��n, un mecanismo que no se puede implementar en software, y que mejora el rendimiento de las aplicaciones con m��ltiples reemplazos de bloques transaccionales de cach��. La evaluaci��n de las propuestas se lleva a cabo con el simulador Simics/GEMS junto con la suite de benchmarks STAMP, y se obtiene una mejora de rendimiento sobre el fallback del 14% al 28% para algunos benchmarks.

Veja mais

4 resultados para Hardware

em Repositorio Institucional de la Universidad de Málaga

Filtro por publicador

Improvements in Hardware Transactional Memory for GPU Architectures

Aportaciones al hardware para sensores t��ctiles inteligentes basados en FPGAs

Insights into the Fallback Path of Best-Effort Hardware Transactional Memory Systems

Irrevocabilidad Relajada para Memoria Transaccional Hardware