945 resultados para Parallel Corpus
Resumo:
In this paper, we describe a machine-translated parallel English corpus for the NTCIR Chinese, Japanese and Korean (CJK) Wikipedia collections. This document collection is named CJK2E Wikipedia XML corpus. The corpus could be used by the information retrieval research community and knowledge sharing in Wikipedia in many ways; for example, this corpus could be used for experimentations in cross-lingual information retrieval, cross-lingual link discovery, or omni-lingual information retrieval research. Furthermore, the translated CJK articles could be used to further expand the current coverage of the English Wikipedia.
Resumo:
The paper relates about our ongoing work on the creation of a corpus of Bulgarian and Ukrainian parallel texts. We discuss some differences in the approaches and the interpretation of some concepts, as well as various problems associated with the construction of our corpus, in particular the occasional ‘nonparallelism’ of original and translated texts. We give examples of the application of the parallel corpus for the study of lexical semantics and note the outstanding role of the corpus in the lexicographic description of Ukrainian and Bulgarian translation equivalents. We draw attention to the importance of creating parallel corpora as objects of national as well as global cultural heritage.
Resumo:
Dissertação de mest., Natural Language Processing & Human Language Technology, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2011
Resumo:
Em Portugal, o turismo é uma actividade económica que gera ganhos significativos e a promoção turística do país no mercado externo assenta cada vez mais na criação de sites multilingues. Este artigo examina um corpus constituído por textos provenientes de sites de Regiões de Turismo de Portugal, em português, e as respectivas traduções para inglês, com o objectivo de demonstrar o modo como os tradutores adicionam informação inexistente no texto original. Através da análise desta característica específica dos sites oficiais traduzidos para promover o destino ―Portugal‖ no mercado externo pretende salientar-se a importância que as estratégias de tradução assumem no marketing do destino turístico, uma vez que a informação adicionada cria uma determinada imagem de uma região. Em termos teóricos e metodológicos, este artigo enquadra-se no âmbito da Linguística de Corpus.
Resumo:
Em Portugal, o turismo é uma actividade económica que gera ganhos significativos e a promoção turística do país no mercado externo assenta cada vez mais na criação de sites multilingues. Este artigo examina um corpus constituído por textos provenientes de sites de Regiões de Turismo de Portugal, em português, e as respectivas traduções para inglês, com o objectivo de demonstrar o modo como os tradutores adicionam informação inexistente no texto original. Através da análise desta característica específica dos sites oficiais traduzidos para promover o destino ―Portugal‖ no mercado externo pretende salientar-se a importância que as estratégias de tradução assumem no marketing do destino turístico, uma vez que a informação adicionada cria uma determinada imagem de uma região. Em termos teóricos e metodológicos, este artigo enquadra-se no âmbito da Linguística de Corpus.
Resumo:
Les travaux entrepris dans le cadre de la présente thèse portent sur l’analyse de l’équivalence terminologique en corpus parallèle et en corpus comparable. Plus spécifiquement, nous nous intéressons aux corpus de textes spécialisés appartenant au domaine du changement climatique. Une des originalités de cette étude réside dans l’analyse des équivalents de termes simples. Les bases théoriques sur lesquelles nous nous appuyons sont la terminologie textuelle (Bourigault et Slodzian 1999) et l’approche lexico-sémantique (L’Homme 2005). Cette étude poursuit deux objectifs. Le premier est d’effectuer une analyse comparative de l’équivalence dans les deux types de corpus afin de vérifier si l’équivalence terminologique observable dans les corpus parallèles se distingue de celle que l’on trouve dans les corpus comparables. Le deuxième consiste à comparer dans le détail les équivalents associés à un même terme anglais, afin de les décrire et de les répertorier pour en dégager une typologie. L’analyse détaillée des équivalents français de 343 termes anglais est menée à bien grâce à l’exploitation d’outils informatiques (extracteur de termes, aligneur de textes, etc.) et à la mise en place d’une méthodologie rigoureuse divisée en trois parties. La première partie qui est commune aux deux objectifs de la recherche concerne l’élaboration des corpus, la validation des termes anglais et le repérage des équivalents français dans les deux corpus. La deuxième partie décrit les critères sur lesquels nous nous appuyons pour comparer les équivalents des deux types de corpus. La troisième partie met en place la typologie des équivalents associés à un même terme anglais. Les résultats pour le premier objectif montrent que sur les 343 termes anglais analysés, les termes présentant des équivalents critiquables dans les deux corpus sont relativement peu élevés (12), tandis que le nombre de termes présentant des similitudes d’équivalence entre les corpus est très élevé (272 équivalents identiques et 55 équivalents non critiquables). L’analyse comparative décrite dans ce chapitre confirme notre hypothèse selon laquelle la terminologie employée dans les corpus parallèles ne se démarque pas de celle des corpus comparables. Les résultats pour le deuxième objectif montrent que de nombreux termes anglais sont rendus par plusieurs équivalents (70 % des termes analysés). Il est aussi constaté que ce ne sont pas les synonymes qui forment le groupe le plus important des équivalents, mais les quasi-synonymes. En outre, les équivalents appartenant à une autre partie du discours constituent une part importante des équivalents. Ainsi, la typologie élaborée dans cette thèse présente des mécanismes de l’équivalence terminologique peu décrits aussi systématiquement dans les travaux antérieurs.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
This research, theoretically founded on Corpus Linguistics and Phraseology, has the purpose of extracting and analyzing general language and specialized collocations in the medical field, taken from a parallel corpus comprised of transcriptions of the TV serial Grey’s Anatomy. Based on this extraction, it is proposed a compilation of a bilingual glossary, so that the referred material can be used by learner translators as well as English language teachers.
Resumo:
The main purpose of this article is to investigate the social and linguistic behaviors of a translator, analyzing the use of simplification aspects in the translational process into English of the Anthropology developed by Darcy Ribeiro. With this aim, we used a parallel corpus composed by the work O povo brasileiro (1995) and by its respective translation, performed by Rabassa. The methodology used is that of Corpus-Based Translation Studies (BAKER, 1993, 1995, 1996; CAMARGO, 2005, 2007), Corpus Linguistics (BERBER SARDINHA, 2004) and Terminology (BARROS, 2004). We also adopted Sociology of Translation theories (SIMEONI, 1998, 2007; GOUANVIC,1999, 2005), as well as the habitus conception, proposed by Bourdieu (1980). Results show that this simplification may be found in Ribeiro’s translated texts, indicating the difficulties of conceptualizing the Brazilian universe in English
Resumo:
The main purpose of this article is to investigate the social and linguistic behaviors (the habitus) of a translator in face of cultural barriers in translation, analyzing the use of explicitation aspects in the translational process into English of the terminological Brazilianisms developed by Darcy Ribeiro. With this aim, we used a parallel corpus composed by the work O povo brasileiro (1995) and by its respective translation, performed by Rabassa. The methodology used is that of Corpus-Based Translation Studies (BAKER, 1993, 1995, 1996, 2000; CAMARGO, 2005, 2007), Corpus Linguistics (BERBER SARDINHA, 2004) and Terminology (BARROS, 2004). For data analysis, we adopted Sociology of Translation theories (SIMEONI, 1998, 2007; GOUANVIC, 1995, 1999), as well as the habitus conception, proposed by the sociologist Pierre Bourdieu (1980). We believe that, as pointed by Baker`s theories (1996), explicitation is a translator`s tendency or procedure, which explains, in the translated text, parts of the original text that have been left implicit by the author. Results show that this action may be found in Ribeiro’s translated texts, indicating the difficult of conceptualizing the Brazilian universe in English.