856 resultados para corpus paralelo


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Considerando a língua como um produto da sociedade, mas também como um meio fundamental para o estabelecimento de relações entre os homens, procuramos perceber o seu lugar na sociedade globalizada, com o objectivo de desenvolver uma metodologia de análise terminológica que contribua para uma maior qualidade da comunicação especializada na sociedade em rede. Este trabalho está organizado em duas partes, sendo a primeira dedicada à reflexão sobre o papel da língua na sociedade em rede, focando questões essenciais em torno da tensão existente entre o multilinguismo e a hegemonia do inglês enquanto lingua franca, sobretudo no espaço europeu. Interessa-nos, por um lado, reflectir sobre a definição de políticas linguísticas, concretamente na Europa multilingue dos 28, e, por outro, salientar o papel preponderante que a língua tem na transmissão do conhecimento. A segunda parte deste trabalho concretiza a investigação efectuada na primeira com base na análise do relato financeiro, um domínio do saber que não só é inerentemente multilingue ¾ porque a sua aplicação é transnacional ¾ mas também reflecte a tensão identificada na primeira parte, na medida em que o inglês assume, no mundo dos negócios em geral e nos mercados financeiros em particular, o papel hegemónico de lingua franca. A abordagem terminológica que defendemos é semasiológica para fins onomasiológicos, pelo que partimos da análise do texto de especialidade, organizado em corpora de especialidade. Discutimos subsequentemente os resultados da nossa análise com os especialistas que os irão validar e cuja colaboração em diversos vi momentos do processo de análise terminológica e conceptual é fundamental para garantir a qualidade dos recursos terminológicos produzidos. Nesta óptica, exploramos um corpus de textos legislativos no âmbito do Sistema de Normalização Contabilística (SNC), de modo a delinearmos uma metodologia de trabalho que, no futuro, conduzirá à construção de uma base de dados terminológica do relato financeiro. Concomitantemente, efectuamos também um estudo sobre a Estrutura Conceptual do SNC, para o qual elaboramos uma comparação ao nível da tradução especializada no relato financeiro, com base num corpus paralelo composto pela legislação contabilística internacional endossada pela União Europeia. Utilizamos o corpus paralelo constituído por textos redigidos originalmente em inglês e traduzidos para português, em articulação com o corpus de especialidade criado com a legislação relativa ao normativo contabilístico português, para testar uma metodologia de extracção de equivalentes. Defendemos, por fim, que a harmonização no relato financeiro para além de se reger por políticas contabilísticas comuns, deve ter subjacentes questões terminológicas. É necessário, portanto, harmonizar a terminologia do relato financeiro, possibilitando aos especialistas uma comunicação em português isenta da interferência do inglês herdado das normas internacionais, através dos dois processos que identificamos: a tradução e a adaptação das Normas Internacionais de Contabilidade.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Memoria de máster (Universidad de León, 2010). Incluye anexos. Resumen basado en el de la publicación

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Expone el estudio de los problemas que, en la comunicación internacional, presentan los lenguajes de la filosofía y las ciencias, en concreto, cuando se materializan a través de la lengua alemana y española. Se acomete el estudio del grupo nominal alemán y la distribución de sus componentes en torno al núcleo nominal, atendiendo a las funciones semánticas que los modificadores asumen en el discurso filosófico y científico. Asimismo, se describen y analizan las resoluciones españolas típicas de los complejos nominales alemanes, ofreciendo pautas de actuación traslativa. El estudio se realiza siguiendo una metodología contrastiva y observando las exigencias metodológicas de la lingüística de corpus. Junto al propio estudio microdiscursivo de la caracterización nominal, se tienen en consideración los diferentes factores macro y mediodiscursivos que intervienen en la comunicación filosófica y científica hispano germánica en el ámbito de la traducción. El material que utiliza para establecer el corpus de referencia está formado por artículos filosóficos y científicos de procedencia alemana publicados en la Revista de Occidente, fundada por José Ortega y Gasset en 1923, y sus originales alemanes. El corpus paralelo FIALES (Filosofía Alemán-Español) reúne 77 binomios textuales y en torno a un millón de palabras. Los análisis realizados permiten llegar a una serie de conclusiones sobre la manera de conceptualizar y precisar términos en los textos filosóficos y científicos alemanes y sobre la manera de trasladarlos al español. Se constata que los sintagmas que contienen los conceptos analizados, solo caracterizados en un 60 por ciento de los casos. Se observa que los recursos lingüísticos especializados en alemán para la explicación de la función semántica de clase no se centran exclusivamente en el adjetivo, sino que incluyen la construcción de genitivo y los compuestos nominales. En cambio, en español si cabe contemplar al adjetivo como un recurso lingüístico especializado en la función de clase, probablemente a causa de la doble capacidad de posicionamiento respecto al núcleo. Por último, el uso reiterado de ciertas construcciones en la traducción de los recursos lingüísticos alemanes, permite postular el uso central de un recurso español frente a otros concurrentes en la traducción. En definitiva, se puede constatar que las traducciones españolas han dado respuesta a la creación incesante del lenguaje filosófico y científico alemán en campos tan dispares como la física, la psicología y la filosofía.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Pós-graduação em Estudos Linguísticos - IBILCE

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Este trabalho teve por objetivo analisar o estilo de João Ubaldo Ribeiro enquanto autotradutor e também compará-lo ao seu estilo enquanto autor, por meio de um corpus paralelo formado pelas obras Sargento Getúlio/Sergeant Getulio e Viva o povo brasileiro/An invincible memory. A fundamentação teórica apoia-se na abordagem interdisciplinar proposta por Camargo (2005, 2007) envolvendo os estudos de tradução baseados em corpus (Baker, 1996, 2000, 2004) e a linguística de corpus (Berber Sardinha, 2004). Para uma observação do seu perfil estilístico, procurei identificar usos linguísticos característicos e individuais, ou seja, traços de seu comportamento linguístico relacionados à variação vocabular. Quanto aos resultados, foi possível observar que, enquanto participante como autotradutor, Ubaldo Ribeiro revela um padrão estilístico distintivo e preferencial que apresenta menor variação lexical. Em contraste, na situação de participante como autor, Ubaldo Ribeiro mostra padrões estilísticos com maior variação. A diversidade de vocabulário já era esperada para o escritor João Ubaldo, uma vez que a crítica literária enfatiza a sua habilidade na exploração do verbo brasileiro. Ao considerar a forma padronizada como uma indicação do uso que o autotradutor faz da linguagem, pode-se destacar, apesar da influência de possíveis variáveis, que a diferença menor registrada para Sergeant Getulio (3,69) e acentuadamente mais baixa para An invincible memory (4,73) constituem marcas significativas da utilização dos padrões estilísticos próprios desse tradutor de si mesmo, revelando o impacto da extensão dessas diferenças em contraste com a escrita do autor, respectivamente em Sargento Getúlio e Viva o povo brasileiro.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Brazil was one of the countries that stood out in the list of nations that publishes more articles in scientific journals. From 2007 to 2008, the Brazilian scientific production has moved from 15th to 13rd place in the world ranking published articles in professional journals. However, 60% of articles published by the Brazilians are in Portuguese, which makes the Brazilian work have little international attention. The purpose of this research is to build and analyze a parallel corpus composed of a book of Remote Sensing and its translation in the direction English into Portuguese in order to create a glossary of most recurrent terms in the literature of Remote Sensing. The achievement of these goals will take for theoretical and methodological foundation the Corpus-Based Translation Studies (BAKER, 1993, 1995, 1996; CAMARGO, 2005), Corpus Linguistics (BERBER SARDINHA, 2004) and principles of Terminology (BARROS, 2004; KRIEGER & FINATTO, 2004). It will also use Wordsmith Tools program and its tools. Besides the parallel corpus, we will also build two comparable corpora respectively from articles published in Brazilian and international journals in the area. The first results show that the translators made use of greater variation of vocabulary in their translations, which can be a way to make the text more clear to the reader. For the analysis of glossary entries, professionals from the National Institute for Space Research - INPE, will be consulted and their views aggregated to this research to give consistency to the production of the proposed bilingual glossary.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

The aim of this research is to build and analyze a parallel corpus in the field of remote sensing in order to identify, according to its frequency, specialized collocations in English and then search for their equivalents in Portuguese. The research is based on the interdisciplinary approach of Corpus-Based Translation Studies (BAKER, 1995; CAMARGO, 2007), Corpus Linguistics (BERBER SARDINHA, 2004; TOGNINI-BONELLI, 2001), Phraseology (ORENHA-OTTAIANO, 2009; PAVEL, 1993), and some principles of Terminology (BARROS, 2004). For manipulating the corpora, the program WordSmith Tools (SCOTT, 2012) version 6.0 is used. To support this study, two comparable corpora in English and Portuguese were also built from articles published in both national and international journals in remote sensing. The results show that the collocations in Portuguese seem to be still in the process of conventionalization, as the translators made use of greater variation in their translational options, which can be a way to make the text clearer for the reader.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

[EN] This article focuses on a specific feature found in tourist guidebooks –the recurrent use of foreign expressions or “third language”. It presents the findings of a comparative analysis of a parallel corpus made up of twenty guidebooks: ten guidebooks originally written in English and their corresponding translated versions in Spanish, describing different countries and cities (all of them published by Lonely Planet), focusing on those chapters in which the writer includes practical information. The purpose of the study is to analyze the use of the third language in the English and Spanish versions and to determine and identify the translation strategies used by the translators to transfer these linguistic elements from one language to the other.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

La principal aportación de esta tesis doctoral ha sido la propuesta y evaluación de un sistema de traducción automática que permite la comunicación entre personas oyentes y sordas. Este sistema está formado a su vez por dos sistemas: un traductor de habla en español a Lengua de Signos Española (LSE) escrita y que posteriormente se representa mediante un agente animado; y un generador de habla en español a partir de una secuencia de signos escritos mediante glosas. El primero de ellos consta de un reconocedor de habla, un módulo de traducción entre lenguas y un agente animado que representa los signos en LSE. El segundo sistema está formado por una interfaz gráfica donde se puede especificar una secuencia de signos mediante glosas (palabras en mayúscula que representan los signos), un módulo de traducción entre lenguas y un conversor texto-habla. Para el desarrollo del sistema de traducción, en primer lugar se ha generado un corpus paralelo de 7696 frases en español con sus correspondientes traducciones a LSE. Estas frases pertenecen a cuatro dominios de aplicación distintos: la renovación del Documento Nacional de Identidad, la renovación del permiso de conducir, un servicio de información de autobuses urbanos y la recepción de un hotel. Además, se ha generado una base de datos con más de 1000 signos almacenados en cuatro sistemas distintos de signo-escritura. En segundo lugar, se ha desarrollado un módulo de traducción automática que integra dos técnicas de traducción con una estructura jerárquica: la primera basada en memoria y la segunda estadística. Además, se ha implementado un módulo de pre-procesamiento de las frases en español que, mediante su incorporación al módulo de traducción estadística, permite mejorar significativamente la tasa de traducción. En esta tesis también se ha mejorado la versión de la interfaz de traducción de LSE a habla. Por un lado, se han incorporado nuevas características que mejoran su usabilidad y, por otro, se ha integrado un traductor de lenguaje SMS (Short Message Service – Servicio de Mensajes Cortos) a español, que permite especificar la secuencia a traducir en lenguaje SMS, además de mediante una secuencia de glosas. El sistema de traducción propuesto se ha evaluado con usuarios reales en dos dominios de aplicación: un servicio de información de autobuses de la Empresa Municipal de Transportes de Madrid y la recepción del Hotel Intur Palacio San Martín de Madrid. En la evaluación estuvieron implicadas personas sordas y empleados de los dos servicios. Se extrajeron medidas objetivas (obtenidas por el sistema automáticamente) y subjetivas (mediante cuestionarios a los usuarios). Los resultados fueron muy positivos gracias a la opinión de los usuarios de la evaluación, que validaron el funcionamiento del sistema de traducción y dieron información valiosa para futuras líneas de trabajo. Por otro lado, tras la integración de cada uno de los módulos de los dos sistemas de traducción (habla-LSE y LSE-habla), los resultados de la evaluación y la experiencia adquirida en todo el proceso, una aportación importante de esta tesis doctoral es la propuesta de metodología de desarrollo de sistemas de traducción de habla a lengua de signos en los dos sentidos de la comunicación. En esta metodología se detallan los pasos a seguir para desarrollar el sistema de traducción para un nuevo dominio de aplicación. Además, la metodología describe cómo diseñar cada uno de los módulos del sistema para mejorar su flexibilidad, de manera que resulte más sencillo adaptar el sistema desarrollado a un nuevo dominio de aplicación. Finalmente, en esta tesis se analizan algunas técnicas para seleccionar las frases de un corpus paralelo fuera de dominio para entrenar el modelo de traducción cuando se quieren traducir frases de un nuevo dominio de aplicación; así como técnicas para seleccionar qué frases del nuevo dominio resultan más interesantes que traduzcan los expertos en LSE para entrenar el modelo de traducción. El objetivo es conseguir una buena tasa de traducción con la menor cantidad posible de frases. ABSTRACT The main contribution of this thesis has been the proposal and evaluation of an automatic translation system for improving the communication between hearing and deaf people. This system is made up of two systems: a Spanish into Spanish Sign Language (LSE – Lengua de Signos Española) translator and a Spanish generator from LSE sign sequences. The first one consists of a speech recognizer, a language translation module and an avatar that represents the sign sequence. The second one is made up an interface for specifying the sign sequence, a language translation module and a text-to-speech conversor. For the translation system development, firstly, a parallel corpus has been generated with 7,696 Spanish sentences and their LSE translations. These sentences are related to four different application domains: the renewal of the Identity Document, the renewal of the driver license, a bus information service and a hotel reception. Moreover, a sign database has been generated with more than 1,000 signs described in four different signwriting systems. Secondly, it has been developed an automatic translation module that integrates two translation techniques in a hierarchical structure: the first one is a memory-based technique and the second one is statistical. Furthermore, a pre processing module for the Spanish sentences has been implemented. By incorporating this pre processing module into the statistical translation module, the accuracy of the translation module improves significantly. In this thesis, the LSE into speech translation interface has been improved. On the one hand, new characteristics that improve its usability have been incorporated and, on the other hand, a SMS language into Spanish translator has been integrated, that lets specifying in SMS language the sequence to translate, besides by specifying a sign sequence. The proposed translation system has been evaluated in two application domains: a bus information service of the Empresa Municipal de Transportes of Madrid and the Hotel Intur Palacio San Martín reception. This evaluation has involved both deaf people and services employees. Objective measurements (given automatically by the system) and subjective measurements (given by user questionnaires) were extracted during the evaluation. Results have been very positive, thanks to the user opinions during the evaluation that validated the system performance and gave important information for future work. Finally, after the integration of each module of the two translation systems (speech- LSE and LSE-speech), obtaining the evaluation results and considering the experience throughout the process, a methodology for developing speech into sign language (and vice versa) into a new domain has been proposed in this thesis. This methodology includes the steps to follow for developing the translation system in a new application domain. Moreover, this methodology proposes the way to improve the flexibility of each system module, so that the adaptation of the system to a new application domain can be easier. On the other hand, some techniques are analyzed for selecting the out-of-domain parallel corpus sentences in order to train the translation module in a new domain; as well as techniques for selecting which in-domain sentences are more interesting for translating them (by LSE experts) in order to train the translation model.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The QUT-NOISE-TIMIT corpus consists of 600 hours of noisy speech sequences designed to enable a thorough evaluation of voice activity detection (VAD) algorithms across a wide variety of common background noise scenarios. In order to construct the final mixed-speech database, a collection of over 10 hours of background noise was conducted across 10 unique locations covering 5 common noise scenarios, to create the QUT-NOISE corpus. This background noise corpus was then mixed with speech events chosen from the TIMIT clean speech corpus over a wide variety of noise lengths, signal-to-noise ratios (SNRs) and active speech proportions to form the mixed-speech QUT-NOISE-TIMIT corpus. The evaluation of five baseline VAD systems on the QUT-NOISE-TIMIT corpus is conducted to validate the data and show that the variety of noise available will allow for better evaluation of VAD systems than existing approaches in the literature.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Extracellular matrix regulates many cellular processes likely to be important for development and regression of corpora lutea. Therefore, we identified the types and components of the extracellular matrix of the human corpus luteum at different stages of the menstrual cycle. Two different types of extracellular matrix were identified by electron microscopy; subendothelial basal laminas and an interstitial matrix located as aggregates at irregular intervals between the non-vascular cells. No basal laminas were associated with luteal cells. At all stages, collagen type IV α1 and laminins α5, β2 and γ1 were localized by immunohistochemistry to subendothelial basal laminas, and collagen type IV α1 and laminins α2, α5, β1 and β2 localized in the interstitial matrix. Laminin α4 and β1 chains occurred in the subendothelial basal lamina from mid-luteal stage to regression; at earlier stages, a punctate pattern of staining was observed. Therefore, human luteal subendothelial basal laminas potentially contain laminin 11 during early luteal development and, additionally, laminins 8, 9 and 10 at the mid-luteal phase. Laminin α1 and α3 chains were not detected in corpora lutea. Versican localized to the connective tissue extremities of the corpus luteum. Thus, during the formation of the human corpus luteum, remodelling of extracellular matrix does not result in basal laminas as present in the adrenal cortex or ovarian follicle. Instead, novel aggregates of interstitial matrix of collagen and laminin are deposited within the luteal parenchyma, and it remains to be seen whether this matrix is important for maintaining the luteal cell phenotype.