Aquest article presenta una mostra dels resultats de l’anàlisi detallada de locucions, col·locacions i altres elements fraseològics i d’ordre de mots significatius quant a la caracterització del cabal de llenguatge literari de Joan Roís de Corella. Aquesta anàlisi es fa amb metodologia interdisciplinar de base de lingüistica de corpus i de diacronia lingüistica, i amb el concurs de les tecnologies de la informació i la comunicació (humanitats digitals), que s’apliquen a l’anàlisi de l’aportació lèxica i estilística d’un autor clau com és Roís de Corella a fide calibrar el grau de sintonia i, alhora, d’especificitat del seu llenguatge literari; en quin grau coincideix el seu llenguatge literari amb el d’altres grans clàssics culturals de la Corona d’Aragó, i en què basa, alhora, Roís de Corella la clau de la seua mestria estilística.


L’estudi de la neologia és indestriable de l’estudi del canvi lingüístic i, doncs, de la diacronia. Ens proposem ací descriure el procés de canvi semàntic que va experimentar el verb esmar, forma patrimonial del llatí *adaestimare, paral·lela del cultisme estimar. Aquesta recerca es fonamenta en l’aprofitament dels corpus textuals i altres materials despullats manualment. Sobre aquests materials, s’ha assajat l’anàlisi de la subjectivació i de les inferències que proposa la teoria de la inferència invitada del canvi semàntic (= TIICS).


The reprise evidential conditional (REC) is nowadays not very usual in Catalan: it is restricted to journalistic language and to some very formal genres (such as academic or legal language), it is not present in spontaneous discourse. On the one hand, it has been described among the rather new modality values of the conditional. On the other, the normative tradition tended to reject it for being a gallicism, or to describe it as an unsuitable neologism. Thanks to the extraction from text corpora, we surprisingly find this REC in Catalan from the beginning of the fourteenth century to the contemporary age, with semantic and pragmatic nuances and different evidence of grammaticalization. Due to the current interest in evidentiality, the REC has been widely studied in French, Italian and Portuguese, focusing mainly on its contemporary uses and not so intensively on the diachronic process that could explain the origin of this value. In line with this research, that we initiated studying the epistemic and evidential future in Catalan, our aim is to describe: a) the pragmatic context that could have been the initial point of the REC in the thirteenth century, before we find indisputable attestations of this use; b) the path of semantic change followed by the conditional from a ‘future in the past’ tense to the acquisition of epistemic and evidential values; and c) the role played by invited inferences, subjectification and intersubjectification in this change.


It is almost 20 years since a series of conferences known as CULT (Corpus Use and Learning to Translate) started. The first and second took place in Bertinoro, Italy, back in 1997 and 2000, respectively. The third was held in 2004 in Barcelona, and the fourth in 2015 in Alicante. Each was organized by a few enthusiastic lecturers and scholars who also happened to be corpus lovers. Guy Aston, Silvia Bernardini, Dominic Stewart and Federico Zanettin, from the Universitá di Bologna; Allison Beeby, Patricia Rodríguez-Inés and Pilar Sánchez-Gijón, from the Universitat Autònoma de Barcelona; and Daniel Gallego-Hernández, from the Universidad de Alicante, organized CULT conferences in the belief that spreading the word about the usefulness of corpora for teaching and professional translation purposes would have positive results.


Statistical machine translation (SMT) is an approach to Machine Translation (MT) that uses statistical models whose parameter estimation is based on the analysis of existing human translations (contained in bilingual corpora). From a translation student’s standpoint, this dissertation aims to explain how a phrase-based SMT system works, to determine the role of the statistical models it uses in the translation process and to assess the quality of the translations provided that system is trained with in-domain goodquality corpora. To that end, a phrase-based SMT system based on Moses has been trained and subsequently used for the English to Spanish translation of two texts related in topic to the training data. Finally, the quality of this output texts produced by the system has been assessed through a quantitative evaluation carried out with three different automatic evaluation measures and a qualitative evaluation based on the Multidimensional Quality Metrics (MQM).


Il progetto di questa tesi nasce da un accordo stipulato tra il Laboratorio di Terminologia della Scuola di Lingue e Letterature, Traduzione e Interpretazione di Forlì e l’Organizzazione delle Nazioni Unite per l’Alimentazione e l’Agricoltura (FAO) per la stesura di tesi di laurea in ambito terminologico in collaborazione con il Servizio Programmazione e Documentazione delle Riunioni (CPAM) della FAO. Con il presente lavoro si intende svolgere una ricerca terminologica in inglese e in russo nell'ambito delle risorse genetiche animali e, nello specifico, delle biotecnologie e della salute animale e creare un database terminologico bilingue, inglese-russo, utilizzabile anche nei programmi di traduzione assistita. Nel primo capitolo viene presentata una panoramica della FAO, della sua storia, delle sue missioni e dei suoi obiettivi. Il secondo capitolo tratta la Divisione Produzione e Salute Animale della FAO che si occupa delle risorse genetiche animali e delle biotecnologie e salute animali, dominio e sottodominio del progetto per questa tesi. Il terzo capitolo riguarda le lingue speciali, le loro caratteristiche, il loro rapporto con la lingua comune e la tipologia testuale dei corpora utilizzati per la ricerca terminologica. Nel quarto capitolo si parla di terminologia e dell’attività terminologica illustrando approcci e correnti della terminologia moderna e descrivendo brevemente le peculiarità della terminologia delle biotecnologie. Infine, il quinto capitolo presenta l’intero progetto di ricerca terminologica, dalla fase preparatoria alla fase di revisione, soffermandosi, in particolare, sul procedimento di compilazione e conversione delle schede terminologiche per la creazione del database bilingue. In appendice, a fine tesi, sono allegate le mappe concettuali, le schede terminologiche del file di Microsoft Excel e il database terminologico bilingue inglese-russo.


Lo studio si occupa di fluency e analizza alcuni aspetti che la definiscono (pause vuote, pause piene, segnali discorsivi, riformulazioni). Si analizzano frequenza e durata di tali fenomeni, attraverso due corpora di produzioni orali di due gruppi di parlanti della lingua inglese: gli studenti italiani del corso di Mediazione Linguistica Interculturale della Scuola di Lingue, Letterature, Interpretazione e Traduzione di Forlì, Università di Bologna, e partecipanti britannici di un programma radiofonico. Si è ritenuto utile comparare le produzioni orali di studenti della lingua inglese a quelle di oratori pubblici madrelingua. Si è cercato di bilanciare i due corpora in termini di genere. Sono stati utilzzati i software Praat, per identificare la morfologia e la durata delle variabili, e Notetab Light, per l'annotazione dei corpora. I risultati della ricerca mostrano che le differenze maggiori tra i due gruppi risiedono nella durata delle pause vuote e nella frequenza, durata e e varietà di suoni delle pause piene, oltre a sillabe aggiuntive, sillabe allungate e riformulazioni. Le sillabe aggiuntive appaiono tipiche della produzione orale degli studenti italiani, in quanto, per la maggior parte, le parole della lingua italiana terminano con un suono vocalico. E' inoltre emersa una questione di genere. Le parlanti di sesso femminile, in entrambi i corpora, impiegano maggiormente le variabili della fluency prese in esame, rispetto ai parlanti di sesso maschile. Sulla base di questa ricerca e ricerche future si potranno ideare moduli di insegnamento dell'inglese basati sulla fluency come fattore primario di competenza linguistica. Il Capitolo 1 introduce lo studio. Il Capitolo 2 presenta lo stato dell'arte sul tema. Il Capitolo 3 presenta la metodologia dello studio. Il Capitolo 4 è dedicato a illustrare e discutere i risultati della ricerca. Il Capitolo 5 presenta considerazioni conclusive e future prospettive per l'insegnamento dell'inglese e per la ricerca.


Con il presente lavoro si vuole introdurre un settore finora poco trattato in merito a una ricerca terminologica. Ho avuto modo di avvicinarmi al karting in un passato recente e volevo saperne di più. Così ho cercato la commistione dei due mondi: quello della terminologia per traduttori e quello delle piste e dei motori. Poiché un traduttore deve necessariamente capire il settore che tratta e traduce con questa tesi si vuole mettere a disposizione uno strumento per la ricerca terminologica in italiano e in tedesco. Il primo capitolo introduce la nascita di questo sport, suo sviluppo, arrivo in Italia e delle categorie attuali. Seguirà poi la parte di terminologia e delle lingue speciali soffermandosi sulla lingua speciale della tecnologia automobilistica. La parte pratica della ricerca, costruzione dei corpora e dei sistemi concettuali viene descritta nel terzo capitolo di metodologia e analisi e nel capitolo conclusivo viene presentato il database terminologico con le sue schede in appendice.


Ascidians (Ascidiacea: Tunicata) are sessile suspension feeders that represent dominant epifaunal components of the Southern Ocean shelf benthos and play a significant role in the pelagic-benthic coupling. Here, we report the results of a first study on the relationship between the distribution patterns of eight common and/or abundant (putative) ascidian species, and environmental drivers in the waters off the northern Antarctic Peninsula. During RV Polarstern cruise XXIX/3 (PS81) in January-March 2013, we used seabed imaging surveys along 28 photographic transects of 2 km length each at water depths from 70 to 770 m in three regions (northwestern Weddell Sea, southern Bransfield Strait and southern Drake Passage), differing in their general environmental setting, primarily oceanographic characteristics and sea-ice dynamics, to comparatively analyze the spatial patterns in the abundance of the selected ascidians, reliably to be identified in the photographs, at three nested spatial scales. At a regional (100-km) scale, the ascidian assemblages of the Weddell Sea differed significantly from those of the other two regions, whereas at an intermediate 10-km scale no such differences were detected among habitat types (bank, upper slope, slope, deep/canyon) on the shelf and at the shelf break within each region. These spatial patterns were superimposed by a marked small-scale (10-m) patchiness of ascidian distribution within the 2-km-long transects. Among the environmental variables considered in our study, a combination of water-mass characteristics, sea-ice dynamics (approximated by 5-year averages in sea-ice cover in the region of or surrounding the photographic stations), as well as the seabed ruggedness, was identified as explaining best the distribution patterns of the ascidians.


Bouvet (Bouvetøya) is a geologically young and very remote island just south of the Polar Front. Here we report samples taken during the RV "Polarstern" cruise ANTXXI/2 on 3 days in November 2003 and January 2004. This work was part of SCAR's EASIZ programme and intended, by providing data on the marine fauna of this "white gap" in the Atlantic sector of the Southern Ocean, to contribute to identifying the role of Bouvet in the faunal exchange between the Sub- and high Antarctic. While this goal demands extensive molecular analysis of the material sampled (future work), a checklist of the samples and data at hand widens the faunal and environmental inventory substantially. We suggest some preliminary conclusions on the relationship of Bouvet Island's fauna with that of other regions, such as Magellanic South America, the Antarctic Peninsula, and the high Antarctic Weddell Sea, which have been sampled previously. There seem to be different connections for individual higher taxa rather than a generally valid consistent picture.


Contiene con portadilla propia: Hermanni Boerhaave ... De mercurio experimenta ...


This study investigates the expression of epistemic modality in a corpus of Ghanaian Pidgin English (GhaPE). The epistemic expressions are manually identified and thereafter distinguished from each other in terms of grammatical status and their indication of different epistemic and evidential notions. 7 different elements are found, ranging from 1 pre-verbal marker, 1 adverb, 2 particles and 3 complement-taking predicates. The results indicate, in line with existing research, that to differentiate between usage properties of individual modal expressions it may be necessary to subdivide them in terms of not only epistemic but also evidential meanings. Moreover, a functional parallel between the GhaPE particle abi, the Swedish modal particle väl and the Spanish adverbs a lo mejor and igual is demonstrated, with respect to their simultaneous function of expressing epistemic probability and asking the hearer for confirmation. Finally, the results suggest, contrary to previous accounts, that the pre-verbal marker fit may indicate epistemic possibility without the addition of a preceding irrealis marker go. It is proposed that future researchers should make use of bigger corpora in order to arrive at a more ample conception of both individual modal categories and their interrelations.


Com o propósito de incrementar suas campanhas mercadológicas, muitas organizações, recorrem às ferramentas de mídias sociais hospedadas na Internet. Com isso, procuram o aumento de produtividade com adoção de sistemas automatizados de reprodução de mensagens, ou mesmo de recursos de acesso direto, inserindo mensagens de caráter persuasivo nos fóruns de discussões em comunidades online. Uma certa falta de sensibilidade para com o trato comunicacional, num meio potencialmente promissor, mas que pede uma outra interpretação, para posterior ação. Frequentemente implica em uma possibilidade de reverberação indicando ser imprescindível maior atenção na elaboração e no direcionamento desses fluxos comunicacionais, acentuadamente os de propósitos persuasivos. Nesse sentido, o presente trabalho propõe o estudo de comunidades online nas quais possamos a partir da identificação dos fatores que levem à sua formação, analisar e interpretar sua estrutura e seus fluxos comunicacionais, tais que, indiquem seus elementos agregadores. Para tal, com os preceitos metodológicos observados, objetivou-se demonstrar que, com esses componentes, as análises podem ser desenvolvidas para melhor adequação de estratégias de relacionamentos, possibilitando ações inerentes ao processo comunicacional mercadológico com essas comunidades. A metodologia ora empregada envolveu análise estrutural da rede com aplicações de softwares como UCINET, integrado com NetDraw, e dos fluxos comunicacionais, que formaram o corpora, analisado com a suíte Wordsmith Tools. Uma rede formada em comunidade hospedada na ferramenta orkut, por meio da obtenção dos conteúdos de fóruns temáticos, forneceu o corpora para as análises lexicais. Os resultados obtidos puderam caracterizar, não só a própria existência da rede social, como as potencialidades de relacionamento, a partir de interpretações de fluxos dialógicos de seus elementos agregadores, por meio de recursos visuais (grafos), estatísticos e lexicais.


The use of ontologies as representations of knowledge is widespread but their construction, until recently, has been entirely manual. We argue in this paper for the use of text corpora and automated natural language processing methods for the construction of ontologies. We delineate the challenges and present criteria for the selection of appropriate methods. We distinguish three ma jor steps in ontology building: associating terms, constructing hierarchies and labelling relations. A number of methods are presented for these purposes but we conclude that the issue of data-sparsity still is a ma jor challenge. We argue for the use of resources external tot he domain specific corpus.