11 resultados para Parallel corpora

em AMS Tesi di Laurea - Alm@DL - Università di Bologna


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Following the internationalization of contemporary higher education, academic institutions based in non-English speaking countries are increasingly urged to produce contents in English to address international prospective students and personnel, as well as to increase their attractiveness. The demand for English translations in the institutional academic domain is consequently increasing at a rate exceeding the capacity of the translation profession. Resources for assisting non-native authors and translators in the production of appropriate texts in L2 are therefore required in order to help academic institutions and professionals streamline their translation workload. Some of these resources include: (i) parallel corpora to train machine translation systems and multilingual authoring tools; and (ii) translation memories for computer-aided tools. The purpose of this study is to create and evaluate reference resources like the ones mentioned in (i) and (ii) through the automatic sentence alignment of a large set of Italian and English as a Lingua Franca (ELF) institutional academic texts given as equivalent but not necessarily parallel (i.e. translated). In this framework, a set of aligning algorithms and alignment tools is examined in order to identify the most profitable one(s) in terms of accuracy and time- and cost-effectiveness. In order to determine the text pairs to align, a sample is selected according to document length similarity (characters) and subsequently evaluated in terms of extent of noisiness/parallelism, alignment accuracy and content leverageability. The results of these analyses serve as the basis for the creation of an aligned bilingual corpus of academic course descriptions, which is eventually used to create a translation memory in TMX format.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

L'obiettivo della tesi è la compilazione del glossario culinario italiano-russo che “racchiudere” termini culinari artusiani e propone una versione russa basandosi anche sulla traduzione parziale del libro in lingua russa. La tesi si divide in sette parti: introduzione, capitoli primo, secondo, terzo e quarto, conclusione e bibliografia. Il primo capitolo introduce la figura di Pellegrino Artusi con brevi cenni sulla sua vita e tratteggia, altresì, le peripezie ed il successo internazionale della sua opera ed il suo approdo in Russia. Il secondo capitolo è dedicato alla ricerca terminologica e alle fasi propedeutiche alla creazione del glossario. Inoltre, vengono spiegate le risorse usate per la creazione dei corpora. Avendo a disposizione la traduzione parziale de “La scienza in cucina e l'arte di mangiar bene” in russo (traduzione di I. Alekberova) fornita dalla Casa Artusi, si cerca di spiegare la scelta dei termini italiani messi a confronto con quelli esistenti nella traduzione russa. Il terzo capitolo introduce il glossario stesso preceduto da una breve spiegazione. Ogni “entrata” contiene il termine, la sua categoria grammaticale e la sua definizione in entrambe le lingue, seguita nella maggior parte dei casi dalle collocazioni o dagli esempi d'uso oppure dai sinonimi. Il quarto capitolo presenta commenti alla compilazione del glossario. Qui vengono analizzati i problemi riscontrati durante la fase compilativa, si presentano le soluzioni trovate e si forniscono esempi concreti. Ci sono anche commenti alle voci non presenti nel glossario. Infine, vi è una breve conclusione del percorso affrontato seguita dalla bibliografia e dalla sitografia. ENGLISH The purpose of this dissertation is to present a bilingual Italian-Russian glossary based on the culinary terms drawn from Artusi's cooking book "The Science of Cooking and the Art of Fine dining". The dissertation consists of an introduction, 4 chapters, conclusions and a list of bibliography. An introduction presents an overview of the entire dissertation. The first chapter includes a presentation of Pellegrino Artusi, brief introduction to his life, his book and the success it has had around the world and mainly in Russia. The second chapter focuses on the creation and use of comparable and parallel corpora that have been created ad hoc for the purpose of the glossary. It also describes the different programs that have been used in order to select the terminology. The third chapter presents the structure of the bilingual culinary glossary followed by the glossary itself. Each entry contains the term, its gramatical category and the definition in both languages followed by, in most but not all cases, collocation, synonyms and additional notes. The fourth chapter presents an analysis of the compilation of the glossary combined with comments and examples. This chapter is followed by final conclusions of the present dissertation. The last part contains a bibliography that includes all the resources that have been used for the completion of this dissertation followed by the webliography.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La tesi si articola in quattro parti. La prima, di stampo femminista, propone una panoramica sul femminicidio come fenomeno sociale e sulla relativa situazione giuridica internazionale. La seconda tratta in generale la stampa di qualità, supporto mediatico prescelto per l'analisi linguistica. La terza parte propone un micro-corpus di stampa italiana sul tema del femminicidio e la quarta un micro-corpus di stampa francese sull' "Affaire DSK", entrambe corredate di un' analisi del componente lessicale e discorsivo (Analyse du discours). E' un lavoro comparativo, i cui risultati hanno permesso di mettere in evidenza e provare come la stampa di qualità italiana e francese tendano a veicolare in modo implicito un'immagine sessista, sterotipata e discriminatoria del femminicidio e della vittima di violenza.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Complex networks analysis is a very popular topic in computer science. Unfortunately this networks, extracted from different contexts, are usually very large and the analysis may be very complicated: computation of metrics on these structures could be very complex. Among all metrics we analyse the extraction of subnetworks called communities: they are groups of nodes that probably play the same role within the whole structure. Communities extraction is an interesting operation in many different fields (biology, economics,...). In this work we present a parallel community detection algorithm that can operate on networks with huge number of nodes and edges. After an introduction to graph theory and high performance computing, we will explain our design strategies and our implementation. Then, we will show some performance evaluation made on a distributed memory architectures i.e. the supercomputer IBM-BlueGene/Q "Fermi" at the CINECA supercomputing center, Italy, and we will comment our results.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Contacts between languages have always led to mutual influence. Today, the position of authority of the English language affects Italian in many ways, especially in the scientific and technical fields. When new studies conceived in the English-speaking world reach the Italian public, we are faced not only with the translation of texts, but most importantly the rendition of theoretical constructs that do not always have a suitable rendering in the target language. That is why we often find anglicisms in Italian texts. This work aims to show their frequency in a specific field, underlying how and when they are used, and sometimes preferred to the Italian corresponding word. This dissertation looks at a sample of essays from the specialised magazine “Lavoro Sociale”, published by Edizioni Centro Studi Erickson, searching for borrowings from English and discussing their use in order to make hypotheses on the reasons of this phenomenon, against the wider background of translation studies and translation universals research. What I am more interested in is the understanding of the similarities and differences in the use of anglicisms by authors of Italian texts and translators from English into Italian, so that I can figure out what the main dynamics and tendencies are. The whole paper is has four parts. Chapter 1 briefly explains the theoretical background on translation studies, and introduces and discusses the notion of translation universals. After that, the research methodology and theoretical background on linguistic borrowings (especially anglicisms) in Italian are summarized. Chapter 2 presents the study, explaining the organisation of the material, the methodology used and the object of interest. Chapter 3 is the core of the dissertation because it contains the qualitative and quantitative data taken from the texts and the examination of the dynamics of the use of anglicisms. Finally, Chapter 4 compares the conclusions drawn from the previous chapter with the opinions of authors, translators and proof-readers, whom I asked to answer a questionnaire written specifically to investigate the mechanisms and choices behind their use of anglicisms.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The aim of this dissertation is to analyze the language of evaluation in Italian, English and French sustainability reports in order to observe how firms build their corporate image and to investigate the kind of relationship they develop with their stakeholders. The analysis is carried out by applying Martin & White's Appraisal theory and corpus linguistics methods. For the purposes of this research, a multilingual specialized corpus of sustainability reports has been created, which is the result of two different levels of compilation. At the first level, three sub-corpora have been created with the aim of representing three different languages (Italian, English and French): at this level, the research on evaluative language will show that a standardization process of sustainability reports is underway. At the second level of compilation, each of the three sub-corpora has been split in two further sub-corpora, representative of two different business sectors: at this level, the research will show how the sector where firms operate directly influences the choice of the topics to be discussed. The first chapter of this dissertation introduces the concept of evaluative language, with a particular focus on the framework of Appraisal theory. The second chapter deals with corpus linguistics and describes different types of corpora, the search methods and the criteria for the compilation of corpora. The third chapter discusses the concepts of Corporate Social Responsibility and sustainability reports, focusing mainly on the reporting principles and the linguistic patterns of this genre, and provides an overview of the main guidelines and certifications for the reporting of sustainability actions. Chapter four is dedicated to the description of the methodology used for this research, while the last chapter presents and discusses the results of the analysis, in an attempt to draw generalizations on the use of evaluative language in this emerging genre.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Il punto di partenza del presente lavoro di ricerca terminologica è stato il soggiorno formativo presso la Direzione generale della Traduzione (DGT) della Commissione Europea di Lussemburgo. Il progetto di tirocinio, ovvero l’aggiornamento e la revisione di schede IATE afferenti al dominio finanziario, e gli aspetti problematici riscontrati durante la compilazione di tali schede hanno portato alla definizione della presente tesi. Lo studio si prefigge di analizzare la ricezione della terminologia precipua della regolamentazione di Basilea 3, esaminando il fenomeno della variazione linguistica in corpora italiani e tedeschi. Nel primo capitolo si descrive brevemente l’esperienza di tirocinio svolto presso la DGT, si presenta la banca dati IATE, l’attività terminologica eseguita e si illustrano le considerazioni che hanno portato allo sviluppo del progetto di tesi. Nel secondo capitolo si approfondisce il dominio investigato, descrivendo a grandi linee la crisi finanziaria che ha portato alla redazione della nuova normativa di Basilea 3, e si presentano i punti fondamentali degli Accordi di Basilea 3. Il terzo capitolo offre una panoramica sulle caratteristiche del linguaggio economico-finanziario e sulle conseguenze della nuova regolamentazione dal punto di vista linguistico, sottolineando le peculiarità della terminologia analizzata. Nel quarto capitolo si descrivono la metodologia seguita e le risorse utilizzate per il progetto di tesi, ovvero corpora ad hoc in lingua italiana e tedesca per l’analisi dei termini e le relative schede terminologiche. Il quinto capitolo si concentra sul fenomeno della variazione linguistica, fornendo un quadro teorico dei diversi approcci alla terminologia, cui segue l’analisi dei corpora e il commento dei risultati ottenuti; si considerano quindi le riflessioni teoriche alla luce di quanto emerso dalla disamina dei corpora. Infine, nell'appendice sono riportate le schede terminologiche IATE compilate durante il periodo di tirocinio e le schede terminologiche redatte a seguito dell’analisi del presente elaborato.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

L’obiettivo del presente lavoro è illustrare la creazione di due corpora bilingui italiano-inglese di libretti d’opera di Giuseppe Verdi, annotati e indicizzati, e descrivere le potenzialità di queste risorse. Il progetto è nato dalla volontà di indagare l’effettiva possibilità di gestione e consultazione di testi poetici tramite corpora in studi translation-driven, optando in particolare per il genere libretto d’opera in considerazione della sua complessità, derivante anche dal fatto che il contenuto testuale è fortemente condizionato dalla musica. Il primo corpus, chiamato LiVeGi, si compone di cinque opere di Giuseppe Verdi e relativa traduzione inglese: Ernani, Il Trovatore, La Traviata, Aida e Falstaff; il secondo corpus, nominato FaLiVe, contiene l’originale italiano dell’opera Falstaff e due traduzioni inglesi, realizzate a circa un secolo di distanza l’una dall’altra. All’analisi del genere libretto e delle caratteristiche principali delle cinque opere selezionate (Capitolo 1), segue una panoramica della prassi traduttiva dei lavori verdiani nel Regno Unito e negli Stati Uniti (Capitolo 2) e la presentazione delle nozioni di Digital Humanities e di linguistica computazionale, all’interno delle quali si colloca il presente studio (Capitolo 3). La sezione centrale (Capitolo 4) presenta nel dettaglio tutte le fasi pratiche di creazione dei due corpora, in particolare selezione e reperimento del materiale, OCR, ripulitura, annotazione e uniformazione dei metacaratteri, part-of-speech tagging, indicizzazione e allineamento, terminando con la descrizione delle risorse ottenute. Il lavoro si conclude (Capitolo 5) con l’illustrazione delle potenzialità dei due corpora creati e le possibilità di ricerca offerte, presentando, a titolo d’esempio, due case study: il linguaggio delle protagoniste tragiche nei libretti di Verdi in traduzione (studio realizzato sul corpus LiVeGi) e la traduzione delle ingiurie nel Falstaff (attraverso il corpus FaLiVe).

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In questo elaborato vengono presentate la traduzione di un estratto di un romanzo di Terry Pratchett, The fifth elephant, e l’analisi di questa traduzione, realizzata con l’aiuto di un corpus costruito ad hoc per questa ricerca. Nel corpus sono state inserite le traduzioni italiane di otto romanzi differenti, scritti dallo stesso autore, Terry Pratchett, e tradotti da tre traduttrici professioniste. Questo corpus è stato ideato appositamente per coadiuvare il processo di traduzione dell’estratto e per esemplificare un metodo di analisi del lavoro di traduttori professionisti. Questo tipo di analisi, nota come translational stylistics, ha lo scopo di identificare le differenze esistenti a livello stilistico tra i traduttori, cercando nello specifico quegli elementi che permettano di identificare e distinguere tra loro i lavori di un determinato traduttore da quelli di un altro, a prescindere dal testo di partenza. Questo elaborato si apre con la descrizione tecnica di un corpus, spiegandone gli utilizzi nel campo della ricerca e i metodi di costruzione. In seguito viene fornita una panoramica dell’autore e delle sue opere, e vengono fornite informazioni sulle traduzioni in italiano di questi romanzi e sulle traduttrici che le hanno elaborate. Viene quindi presentata la traduzione dell’estratto, seguita da un’analisi dei problemi traduttivi affrontati durante il processo di traduzione e di come il corpus abbia aiutato a risolvere e superare queste difficoltà. Infine viene presentato uno studio di caso sulla translational stylistics che mostra le differenze a livello di stile esistenti tra i lavori di traduttori diversi.