929 resultados para Clock Synchronization
Resumo:
Decimal multiplication is an integral part of financial, commercial, and internet-based computations. This paper presents a novel double digit decimal multiplication (DDDM) technique that performs 2 digit multiplications simultaneously in one clock cycle. This design offers low latency and high throughput. When multiplying two n-digit operands to produce a 2n-digit product, the design has a latency of (n / 2) 1 cycles. The paper presents area and delay comparisons for 7-digit, 16-digit, 34-digit double digit decimal multipliers on different families of Xilinx, Altera, Actel and Quick Logic FPGAs. The multipliers presented can be extended to support decimal floating-point multiplication for IEEE P754 standard
Resumo:
Decimal multiplication is an integral part of financial, commercial, and internet-based computations. This paper presents a novel double digit decimal multiplication (DDDM) technique that offers low latency and high throughput. This design performs two digit multiplications simultaneously in one clock cycle. Double digit fixed point decimal multipliers for 7digit, 16 digit and 34 digit are simulated using Leonardo Spectrum from Mentor Graphics Corporation using ASIC Library. The paper also presents area and delay comparisons for these fixed point multipliers on Xilinx, Altera, Actel and Quick logic FPGAs. This multiplier design can be extended to support decimal floating point multiplication for IEEE 754- 2008 standard.
Resumo:
The modern telecommunication industry demands higher capacity networks with high data rate. Orthogonal frequency division multiplexing (OFDM) is a promising technique for high data rate wireless communications at reasonable complexity in wireless channels. OFDM has been adopted for many types of wireless systems like wireless local area networks such as IEEE 802.11a, and digital audio/video broadcasting (DAB/DVB). The proposed research focuses on a concatenated coding scheme that improve the performance of OFDM based wireless communications. It uses a Redundant Residue Number System (RRNS) code as the outer code and a convolutional code as the inner code. The bit error rate (BER) performances of the proposed system under different channel conditions are investigated. These include the effect of additive white Gaussian noise (AWGN), multipath delay spread, peak power clipping and frame start synchronization error. The simulation results show that the proposed RRNS-Convolutional concatenated coding (RCCC) scheme provides significant improvement in the system performance by exploiting the inherent properties of RRNS.
Resumo:
The towed array electronics is essentially a multichannel real time data acquisition system. The major challenges involved in it are the simultaneous acquisition of data from multiple channels, telemetry of the data over tow cable (several kilometres in some systems) and synchronization with the onboard receiver for accurate reconstruction. A serial protocol is best suited to transmit the data to onboard electronics since number of wires inside the tow cable is limited. The best transmission medium for data over large distances is the optical fibre. In this a two step approach towards the realization of a reliable telemetry scheme for the sensor data using standard protocols is described. The two schemes are discussed in this paper. The first scheme is for conversion of parallel, time-multiplexed multi-sensor data to Ethernet. Existing towed arrays can be upgraded to ethernet using this scheme. Here the last lap of the transmission is by Ethernet over Fibre. For the next generation of towed arrays it is required to digitize and convert the data to ethernet close to the sensor. This is the second scheme. At the heart of this design is the Analog-to-Ethernet node. In addition to a more reliable interface, this helps in easier fault detection and firmware updates in the field for the towed arrays. The design challenges and considerations for incorporating a network of embedded devices within the array are highlighted
Resumo:
Digitales stochastisches Magnetfeld-Sensorarray Stefan Rohrer Im Rahmen eines mehrjährigen Forschungsprojektes, gefördert von der Deutschen Forschungsgesellschaft (DFG), wurden am Institut für Mikroelektronik (IPM) der Universität Kassel digitale Magnetfeldsensoren mit einer Breite bis zu 1 µm entwickelt. Die vorliegende Dissertation stellt ein aus diesem Forschungsprojekt entstandenes Magnetfeld-Sensorarray vor, das speziell dazu entworfen wurde, um digitale Magnetfelder schnell und auf minimaler Fläche mit einer guten räumlichen und zeitlichen Auflösung zu detektieren. Der noch in einem 1,0µm-CMOS-Prozess gefertigte Test-Chip arbeitet bis zu einer Taktfrequenz von 27 MHz bei einem Sensorabstand von 6,75 µm. Damit ist er das derzeit kleinste und schnellste digitale Magnetfeld-Sensorarray in einem Standard-CMOS-Prozess. Konvertiert auf eine 0,09µm-Technologie können Frequenzen bis 1 GHz erreicht werden bei einem Sensorabstand von unter 1 µm. In der Dissertation werden die wichtigsten Ergebnisse des Projekts detailliert beschrieben. Basis des Sensors ist eine rückgekoppelte Inverter-Anordnung. Als magnetfeldsensitives Element dient ein auf dem Hall-Effekt basierender Doppel-Drain-MAGFET, der das Verhalten der Kippschaltung beeinflusst. Aus den digitalen Ausgangsdaten kann die Stärke und die Polarität des Magnetfelds bestimmt werden. Die Gesamtanordnung bildet einen stochastischen Magnetfeld-Sensor. In der Arbeit wird ein Modell für das Kippverhalten der rückgekoppelten Inverter präsentiert. Die Rauscheinflüsse des Sensors werden analysiert und in einem stochastischen Differentialgleichungssystem modelliert. Die Lösung der stochastischen Differentialgleichung zeigt die Entwicklung der Wahrscheinlichkeitsverteilung des Ausgangssignals über die Zeit und welche Einflussfaktoren die Fehlerwahrscheinlichkeit des Sensors beeinflussen. Sie gibt Hinweise darauf, welche Parameter für das Design und Layout eines stochastischen Sensors zu einem optimalen Ergebnis führen. Die auf den theoretischen Berechnungen basierenden Schaltungen und Layout-Komponenten eines digitalen stochastischen Sensors werden in der Arbeit vorgestellt. Aufgrund der technologisch bedingten Prozesstoleranzen ist für jeden Detektor eine eigene kompensierende Kalibrierung erforderlich. Unterschiedliche Realisierungen dafür werden präsentiert und bewertet. Zur genaueren Modellierung wird ein SPICE-Modell aufgestellt und damit für das Kippverhalten des Sensors eine stochastische Differentialgleichung mit SPICE-bestimmten Koeffizienten hergeleitet. Gegenüber den Standard-Magnetfeldsensoren bietet die stochastische digitale Auswertung den Vorteil einer flexiblen Messung. Man kann wählen zwischen schnellen Messungen bei reduzierter Genauigkeit und einer hohen lokalen Auflösung oder einer hohen Genauigkeit bei der Auswertung langsam veränderlicher Magnetfelder im Bereich von unter 1 mT. Die Arbeit präsentiert die Messergebnisse des Testchips. Die gemessene Empfindlichkeit und die Fehlerwahrscheinlichkeit sowie die optimalen Arbeitspunkte und die Kennliniencharakteristik werden dargestellt. Die relative Empfindlichkeit der MAGFETs beträgt 0,0075/T. Die damit erzielbaren Fehlerwahrscheinlichkeiten werden in der Arbeit aufgelistet. Verglichen mit dem theoretischen Modell zeigt das gemessene Kippverhalten der stochastischen Sensoren eine gute Übereinstimmung. Verschiedene Messungen von analogen und digitalen Magnetfeldern bestätigen die Anwendbarkeit des Sensors für schnelle Magnetfeldmessungen bis 27 MHz auch bei kleinen Magnetfeldern unter 1 mT. Die Messungen der Sensorcharakteristik in Abhängigkeit von der Temperatur zeigen, dass die Empfindlichkeit bei sehr tiefen Temperaturen deutlich steigt aufgrund der Abnahme des Rauschens. Eine Zusammenfassung und ein ausführliches Literaturverzeichnis geben einen Überblick über den Stand der Technik.
Resumo:
In dieser Arbeit wird ein generisches Modell fuer synchrone Gruppenarbeit auf gemeinsamen Informationsraeumen entwickelt. Fuer die Entwicklung dieses Modells muessen die Grundfunktionen fuer Anwendungen der synchronen Gruppenarbeit realisiert werden. Neben der Modellierung des Datenraumes (Datenmodell) und der operationellen Schnittstelle (Interaktionsmodell), muessen Mechanismen fuer die Darstellung der Aktivitaeten der Gruppenmitglieder auf dem Informationsraum (Awareness), sowie fuer die Synchronisierung gleichzeitiger Zugriffe verschiedener Benutzer auf dem Datenraum realisiert werden (Nebenlaeufgkeitskontrolle). Das Grundproblem bei der Loesung der Nebenlaeufigkeit liegt bei der Aufgabe der Isolation aus den klassischen ACID-Transaktionen zu gunsten von Awareness. Die rapide Entwicklung von Techniken der mobilen Kommunikation ermoeglicht den Einsatz dieser Geraete fuer den Zugriff auf Daten im Internet. Durch UMTSund WLAN-Technologien koennen Mobilgeraete fuer Anwendungen ueber die reine Kommunikation hinaus eingesetzt werden. Eine natuerliche Folge dieser Entwicklung sind Anwendungen fuer die Zusammenarbeit mehrerer Benutzer. In der Arbeit wird daher auf die Unterstuetzung mobiler Geraete besonderen Wert gelegt. Die Interaktion der Benutzer auf den gemeinsamen Datenraum wird durch einfache Navigationsoperationen mit einem Cursor (Finger) realisiert, wobei der Datenraum durch XML-Dokumente dargestellt wird. Die Visualisierung basiert auf der Transformierung von XML-Dokumenten in andere XML-basierte Sprachen wie HTML oder SVG durch XSLT-Stylesheets. Awareness-Informationen werden, aehnlich dem Fokus/Nimbus-Modell, von der Interaktion der Benutzer und der Ermittlung der sichtbaren Objekte bei dem Benutzer hergeleitet. Fuer eine geeignete Kontrolle der Nebenlaeufigkeit wurde der Begriff der visuellen Transaktion eingefuehrt, wo die Auswirkungen einer Transaktion von anderen Benutzern (Transaktionen) beobachtet werden koennen. Die Synchronisierung basiert auf einem Sperrverfahren und der Einfuehrung der neuen W-Sperre und der Grundoperationen readV und writeV. Das Modell (Groupware-Server) wird in der Arbeit in einem Prototyp implementiert. Weiterhin wird eine Java-Anwendung sowohl auf einem Desktop PC als auch auf einem Pocket PC (iPAQ 3970) implementiert, welche die Einsetzbarkeit dieses Prototyps demonstriert.
Resumo:
The process of developing software that takes advantage of multiple processors is commonly referred to as parallel programming. For various reasons, this process is much harder than the sequential case. For decades, parallel programming has been a problem for a small niche only: engineers working on parallelizing mostly numerical applications in High Performance Computing. This has changed with the advent of multi-core processors in mainstream computer architectures. Parallel programming in our days becomes a problem for a much larger group of developers. The main objective of this thesis was to find ways to make parallel programming easier for them. Different aims were identified in order to reach the objective: research the state of the art of parallel programming today, improve the education of software developers about the topic, and provide programmers with powerful abstractions to make their work easier. To reach these aims, several key steps were taken. To start with, a survey was conducted among parallel programmers to find out about the state of the art. More than 250 people participated, yielding results about the parallel programming systems and languages in use, as well as about common problems with these systems. Furthermore, a study was conducted in university classes on parallel programming. It resulted in a list of frequently made mistakes that were analyzed and used to create a programmers' checklist to avoid them in the future. For programmers' education, an online resource was setup to collect experiences and knowledge in the field of parallel programming - called the Parawiki. Another key step in this direction was the creation of the Thinking Parallel weblog, where more than 50.000 readers to date have read essays on the topic. For the third aim (powerful abstractions), it was decided to concentrate on one parallel programming system: OpenMP. Its ease of use and high level of abstraction were the most important reasons for this decision. Two different research directions were pursued. The first one resulted in a parallel library called AthenaMP. It contains so-called generic components, derived from design patterns for parallel programming. These include functionality to enhance the locks provided by OpenMP, to perform operations on large amounts of data (data-parallel programming), and to enable the implementation of irregular algorithms using task pools. AthenaMP itself serves a triple role: the components are well-documented and can be used directly in programs, it enables developers to study the source code and learn from it, and it is possible for compiler writers to use it as a testing ground for their OpenMP compilers. The second research direction was targeted at changing the OpenMP specification to make the system more powerful. The main contributions here were a proposal to enable thread-cancellation and a proposal to avoid busy waiting. Both were implemented in a research compiler, shown to be useful in example applications, and proposed to the OpenMP Language Committee.
Resumo:
To various degrees, insects in nature adapt to and live with two fundamental environmental rhythms around them: (1) the daily rhythm of light and dark, and (2) the yearly seasonal rhythm of the changing photoperiod (length of light per day). It is hypothesized that two biological clocks evolved in organisms on earth which allow them to harmonize successfully with the two environmental rhythms: (1) the circadian clock, which orchestrates circadian rhythms in physiology and behavior, and (2) the photoperiodic clock, which allows for physiological adaptations to changes in photoperiod during the course of the year (insect photoperiodism). The circadian rhythm is endogenous and continues in constant conditions, while photoperiodism requires specific light inputs of a minimal duration. Output pathways from both clocks control neurosecretory cells which regulate growth and reproduction. This dissertation focuses on the question whether different photoperiods change the network and physiology of the circadian clock of an originally equatorial cockroach species. It is assumed that photoperiod-dependent plasticity of the cockroach circadian clock allows for adaptations in physiology and behavior without the need for a separate photoperiodic clock circuit. The Madeira cockroach Rhyparobia maderae is a well established circadian clock model system. Lesion and transplantation studies identified the accessory medulla (aMe), a small neuropil with about 250 neurons, as the cockroach circadian pacemaker. Among them, the pigment-dispersing factor immunoreactive (PDF-ir) neurons anterior to the aMe (aPDFMes) play a key role as inputs to and outputs of the circadian clock system. The aim of my doctoral thesis was to examine whether and how different photoperiods modify the circadian clock system. With immunocytochemical studies, three-dimensional (3D) reconstruction, standardization and Ca2+-imaging technique, my studies revealed that raising cockroaches in different photoperiods changed the neuronal network of the circadian clock (Wei and Stengl, 2011). In addition, different photoperiods affected the physiology of single, isolated circadian pacemaker neurons. This thesis provides new evidence for the involvement of the circadian clock in insect photoperiodism. The data suggest that the circadian pacemaker system of the Madeira cockroach has the plasticity and potential to allow for physiological adaptations to different photoperiods. Therefore, it may express also properties of a photoperiodic clock.
Resumo:
Der Wechsel von Tag und Nacht erzeugt einen regelmäßigen Rhythmus von verschiedenen Umweltreizen, allen voran Licht und Temperatur. Fast jedes bis zum heutigen Tage untersuchte Lebewesen besitzt einen endogenen Mechanismus zur Zeitwahrnehmung, und diese "innere Uhr" befähigt Lebewesen dazu, sich vorausschauend an rhythmische Umwelt-Änderungen anzupassen. Circadiane Rhythmen bestehen auch ohne jegliche äußere Reize und basieren auf einem molekularen Rückkopplungs-Mechanismus, der Rhythmen in Genexpression und Proteinkonzentration von etwa 24 Stunden erzeugt. Obwohl sich die grundsätzlichen Mechanismen und Komponenten dieses molekularen Uhrwerks in allen Insekten ähneln, zeigte sich jedoch immer mehr, dass es im Detail doch wesentliche Unterschiede zwischen verschiedenen Insektengruppen gibt. Während das molekulare Uhrwerk der Fruchtfliege Drosophila melanogaster inzwischen sehr gut untersucht ist, fehlen bei den meisten Insektengruppen immernoch eingehende Untersuchungen. Fast nichts ist über die molekulare Basis von circadianen Rhythmen bei der Schabe Rhyparobia maderae bekannt, obwohl diese Art bereits seit Langem als Modellorganismus in der Chronobiologie dient. Um mit der Forschung am molekularen, circadianen System von R. maderae zu beginnen, wurde die Struktur und das Expressionsprofil der core feedback loop Gene per, tim1 und cry2 analysiert. Mittels degenerierten Primern und RACE konnte das vollständige offene Leseraster (OLR) von rmPer und rmCry2, und ein Teil des rmTim1 OLR kloniert werden. Eine phylogenetische Analyse gruppierte rmPER und rmCRY2 gemeinsam mit den Orthologa hemimetaboler Insekten. Viele bei D. melanogaster funktionell charakterisierte Domänen sind bei diesen Proteinen konserviert, was auf eine ähnliche Funktion in der inneren Uhr von R. maderae hinweist. Mittels quantitativer PCR konnte gezeigt werden, dass die mRNA von rmPer, rmTim1 und rmCry2 in verschiedenen Lichtregimen in der gleichen Phasenlage Tageszeit-abhängig schwankt. Die Phasenlage stellte sich bei unterschiedlichen Photoperioden jeweils relativ zum Beginn der Skotophase ein, mit Maxima in der ersten Hälfte der Nacht. Auch im Dauerdunkel zeigen sich Rhythmen in der rmTim1 und rmCry2 Expression. Die Amplitude der rmPer Expressionsrhythmen war jedoch so gering, dass keine signifikanten Unterschiede zwischen den einzelnen Zeitgeberzeiten (ZT) festgestellt werden konnten. Mittels Laufrad-Assays wurde untersucht wie Kurz- und Langtag Lichtregime die Verhaltensrhythmen beeinflussen. Es konnten nur Unterschiede in der Periodenlänge unter freilaufenden Bedingungen festgestellt werden, wenn höhere Lichtintensitäten (1000lx) zur Synchronisation (entrainment) genutzt wurden. Die Periode des freilaufenden Rhythmus war bei Tieren aus dem Kurztag länger. Die photoperiodische Plastizität zeigte sich also auch auf Verhaltensebene, obwohl höhere Lichtintensitäten notwendig waren um einen Effekt zu beobachten. Basierend auf den Sequenzen der zuvor klonierten OLR wurden gegen rmPER, rmTIM1 und rmCRY2 gerichtete Antikörper hergestellt. Die Antikörper gegen rmPER und rmTIM1 erkannten in western blots sehr wahrscheinlich spezifisch das jeweilige Protein. Zeitreihen von Gehirngewebe-Homogenisaten zeigten keinen offensichtlichen circadianen Rhythmus in der Proteinkonzentration, wahrscheinlich auf Grund einer Oszillation mit niedriger Amplitude. In Immunhistochemischen Färbungen konnte nur mit dem gegen rmPER gerichteten Antikörper aus Kaninchen ein Signal beobachtet werden. Beinahe jede Zelle des Zentralnervensystems war rmPER-immunreaktiv im Zellkern. Es konnten keine Unterschiede zwischen den untersuchten ZTs festgestellt werden, ähnlich wie bei den western blot Zeitreihen. In dieser Studie konnten erstmals molekulare Daten der circadianen Uhr von R. maderae erfasst und dargestellt werden. Die Uhrgene per, tim1 und cry2 werden in dieser Schabenart exprimiert und ihre Domänenstruktur sowie das circadiane Expressionsmuster ähneln dem hypothetischen ursprünglichen Insektenuhrwerk, welches der circadianen Uhr von Vertebraten nahesteht. Das molekulare Uhrwerk von R. maderae kann sich an unterschiedliche Photoperioden anpassen, und diese Anpassungen manifestieren sich im Expressionsprofil der untersuchten Uhrgene ebenso wie im Verhalten.
Resumo:
The insect neuropeptide pigment-dispersing factor (PDF) is a functional ortholog of vasoactive intestinal polypeptide, the coupling factor of the mammalian circadian pacemaker. Despite of PDF's importance for synchronized circadian locomotor activity rhythms its signaling is not well understood. We studied PDF signaling in primary cell cultures of the accessory medulla, the circadian pacemaker of the Madeira cockroach. In Ca2+ imaging studies four types of PDF-responses were distinguished. In regularly bursting type 1 pacemakers PDF application resulted in dose-dependent long-lasting increases in Ca2+ baseline concentration and frequency of oscillating Ca2+ transients. Adenylyl cyclase antagonists prevented PDF-responses in type 1 cells, indicating that PDF signaled via elevation of intracellular cAMP levels. In contrast, in type 2 pacemakers PDF transiently raised intracellular Ca2+ levels even after blocking adenylyl cyclase activity. In patch clamp experiments the previously characterized types 1–4 could not be identified. Instead, PDF-responses were categorized according to ion channels affected. Application of PDF inhibited outward potassium or inward sodium currents, sometimes in the same neuron. In a comparison of Ca2+ imaging and patch clamp experiments we hypothesized that in type 1 cells PDF-dependent rises in cAMP concentrations block primarily outward K+ currents. Possibly, this PDF-dependent depolarization underlies PDF-dependent phase advances of pacemakers. Finally, we propose that PDF-dependent concomitant modulation of K+ and Na+ channels in coupled pacemakers causes ultradian membrane potential oscillations as prerequisite to efficient synchronization via resonance.
Resumo:
Circadiane Schrittmacher koordinieren die täglichen Rhythmen in Physiologie und Verhalten in lebenden Organismen. Die Madeira Schabe Rhyparobia maderae (Synonym: Leucophaea maderae) ist ein gut etabliertes Modell, um die neuronalen Mechanismen der circadianen Rhythmen bei Insekten zu studieren. Die akzessorische Medulla (AME) in den optischen Loben des Gehirns wurde als das circadiane Schrittmacherzentrum der Madeira Schabe identifiziert, das circadiane Rhythmen in der Laufaktivität steuert. Über die Neurotransmitter der Eingangswege in das circadiane System der Madeira Schabe ist noch nicht viel bekannt. Das Hauptziel dieser Arbeit war es, mögliche Eingangssignale in die innere Uhr der Madeira Schabe zu bestimmen. An primären Zellkulturen von AME-Neuronen wurden Calcium-Imaging Experimente durchgeführt, um die Neurotransmitter-abhängigen Veränderungen in der intrazellulären Calcium-Konzentration zu messen. Darüber hinaus wurde die Signalkaskade des Neuropeptids Pigment Dispersing Factor (PDF), dem wichtigsten Kopplungsfaktor in circadianen Schrittmachern von Insekten, in Calcium-Imaging und Förster-Resonanzenergietransfer (FRET) Experimenten untersucht. Acetylcholin (ACh) erhöht die intrazelluläre Calcium-Konzentration in der Mehrzahl der circadianen Schrittmacherneurone der Madeiraschabe. Applikation von GABA, Serotonin und Octopamin erhöhten oder reduzierten die intrazelluläre Calcium-Konzentration in den AME-Neuronen, während Histamin und Glutamat die intrazelluläre Calcium-Konzentration ausschließlich reduzierten. Pharmakologische Experimente zeigten, dass die AME-Neurone ACh über ionotrope nikotinische ACh-Rezeptoren detektierten, während GABA über ionotrope GABAA-Rezeptoren und metabotrope GABAB-Rezeptoren detektiert wurde. Diese Ergebnisse deuten darauf hin, dass die circadiane Aktivität der Schabe durch verschiedene Eingänge, einschließlich ACh, GABA, Glutamat, Histamin, Octopamin und Serotonin, moduliert wird. Bei den FRET Studien wurde ein Proteinkinase A (PKA)-basierter FRET Sensor zur Detektion von cyclischem AMP (cAMP) verwendet. Es wurde gezeigt, dass PDF über Adenylylcyclase-abhängige und -unabhängige Signalwege wirken kann. Zusätzlich wurden Laufrad-Assays durchgeführt, um Phasenverschiebungen im Rhythmus der circadianen Laufaktivität zu detektieren, nachdem der Neurotransmitter Histamin zu verschiedenen circadianen Zeiten injiziert wurde. Histamin-Injektionen durch die Komplexaugen der Schabe ergaben eine biphasische Phasenantwortkurve (phase response curve) mit Phasenverzögerungen in der Laufaktivität am späten subjektiven Tag und am Beginn der subjektiven Nacht und Phasenbeschleunigungen in der späten subjektiven Nacht. Schließlich wurde eine extrazelluläre Ableittechnik an lebenden Schaben etabliert, die gleichzeitige Langzeit-Ableitungen von der AME, des Komplexauges (Elektroretinogramm = ERG), und der Beinmuskulatur (Elektromyogramm = EMG) für mehrere Tage ermöglichte. Diese Methode bietet einen Ausgangspunkt für weitere elektrophysiologische Untersuchungen des circadianen Systems der Schabe, in denen Substanzen (z.B. Neurotransmitter und Neuropeptide) analysiert werden können, die einen Einfluss auf den circadianen Rhythmus in der Laufaktivität haben
Resumo:
This thesis defines Pi, a parallel architecture interface that separates model and machine issues, allowing them to be addressed independently. This provides greater flexibility for both the model and machine builder. Pi addresses a set of common parallel model requirements including low latency communication, fast task switching, low cost synchronization, efficient storage management, the ability to exploit locality, and efficient support for sequential code. Since Pi provides generic parallel operations, it can efficiently support many parallel programming models including hybrids of existing models. Pi also forms a basis of comparison for architectural components.
Resumo:
Scheduling tasks to efficiently use the available processor resources is crucial to minimizing the runtime of applications on shared-memory parallel processors. One factor that contributes to poor processor utilization is the idle time caused by long latency operations, such as remote memory references or processor synchronization operations. One way of tolerating this latency is to use a processor with multiple hardware contexts that can rapidly switch to executing another thread of computation whenever a long latency operation occurs, thus increasing processor utilization by overlapping computation with communication. Although multiple contexts are effective for tolerating latency, this effectiveness can be limited by memory and network bandwidth, by cache interference effects among the multiple contexts, and by critical tasks sharing processor resources with less critical tasks. This thesis presents techniques that increase the effectiveness of multiple contexts by intelligently scheduling threads to make more efficient use of processor pipeline, bandwidth, and cache resources. This thesis proposes thread prioritization as a fundamental mechanism for directing the thread schedule on a multiple-context processor. A priority is assigned to each thread either statically or dynamically and is used by the thread scheduler to decide which threads to load in the contexts, and to decide which context to switch to on a context switch. We develop a multiple-context model that integrates both cache and network effects, and shows how thread prioritization can both maintain high processor utilization, and limit increases in critical path runtime caused by multithreading. The model also shows that in order to be effective in bandwidth limited applications, thread prioritization must be extended to prioritize memory requests. We show how simple hardware can prioritize the running of threads in the multiple contexts, and the issuing of requests to both the local memory and the network. Simulation experiments show how thread prioritization is used in a variety of applications. Thread prioritization can improve the performance of synchronization primitives by minimizing the number of processor cycles wasted in spinning and devoting more cycles to critical threads. Thread prioritization can be used in combination with other techniques to improve cache performance and minimize cache interference between different working sets in the cache. For applications that are critical path limited, thread prioritization can improve performance by allowing processor resources to be devoted preferentially to critical threads. These experimental results show that thread prioritization is a mechanism that can be used to implement a wide range of scheduling policies.
Resumo:
The furious pace of Moore's Law is driving computer architecture into a realm where the the speed of light is the dominant factor in system latencies. The number of clock cycles to span a chip are increasing, while the number of bits that can be accessed within a clock cycle is decreasing. Hence, it is becoming more difficult to hide latency. One alternative solution is to reduce latency by migrating threads and data, but the overhead of existing implementations has previously made migration an unserviceable solution so far. I present an architecture, implementation, and mechanisms that reduces the overhead of migration to the point where migration is a viable supplement to other latency hiding mechanisms, such as multithreading. The architecture is abstract, and presents programmers with a simple, uniform fine-grained multithreaded parallel programming model with implicit memory management. In other words, the spatial nature and implementation details (such as the number of processors) of a parallel machine are entirely hidden from the programmer. Compiler writers are encouraged to devise programming languages for the machine that guide a programmer to express their ideas in terms of objects, since objects exhibit an inherent physical locality of data and code. The machine implementation can then leverage this locality to automatically distribute data and threads across the physical machine by using a set of high performance migration mechanisms. An implementation of this architecture could migrate a null thread in 66 cycles -- over a factor of 1000 improvement over previous work. Performance also scales well; the time required to move a typical thread is only 4 to 5 times that of a null thread. Data migration performance is similar, and scales linearly with data block size. Since the performance of the migration mechanism is on par with that of an L2 cache, the implementation simulated in my work has no data caches and relies instead on multithreading and the migration mechanism to hide and reduce access latencies.
Resumo:
In this paper, we address this problem through the design of a semiactive controller based on the mixed H2/H∞ control theory. The vibrations caused by the seismic motions are mitigated by a semiactive damper installed in the bottom of the structure. It is meant by semiactive damper, a device that absorbs but cannot inject energy into the system. Sufficient conditions for the design of a desired control are given in terms of linear matrix inequalities (LMIs). A controller that guarantees asymptotic stability and a mixed H2/H∞ performance is then developed. An algorithm is proposed to handle the semiactive nature of the actuator. The performance of the controller is experimentally evaluated in a real-time hybrid testing facility that consists of a physical specimen (a small-scale magnetorheological damper) and a numerical model (a large-scale three-story building)