1000 resultados para constitution des corpus
Resumo:
La traduction statistique requiert des corpus parallèles en grande quantité. L’obtention de tels corpus passe par l’alignement automatique au niveau des phrases. L’alignement des corpus parallèles a reçu beaucoup d’attention dans les années quatre vingt et cette étape est considérée comme résolue par la communauté. Nous montrons dans notre mémoire que ce n’est pas le cas et proposons un nouvel aligneur que nous comparons à des algorithmes à l’état de l’art. Notre aligneur est simple, rapide et permet d’aligner une très grande quantité de données. Il produit des résultats souvent meilleurs que ceux produits par les aligneurs les plus élaborés. Nous analysons la robustesse de notre aligneur en fonction du genre des textes à aligner et du bruit qu’ils contiennent. Pour cela, nos expériences se décomposent en deux grandes parties. Dans la première partie, nous travaillons sur le corpus BAF où nous mesurons la qualité d’alignement produit en fonction du bruit qui atteint les 60%. Dans la deuxième partie, nous travaillons sur le corpus EuroParl où nous revisitons la procédure d’alignement avec laquelle le corpus Europarl a été préparé et montrons que de meilleures performances au niveau des systèmes de traduction statistique peuvent être obtenues en utilisant notre aligneur.
Les chaînes de références dans des corpus textuels trilingues : Critères et finalité de la recherche
Resumo:
En la obra Stylistique comparée du français et de l?anglais, Vinay y Darbelnet señalan el valor de la traducción como disciplina auxiliar de la Lingüística (1977: 25). Sin entrar en el debate sobre el alcance de las nociones de traducción y transcodificación, se entiende que en toda situación de lenguas en contactos, como es el caso de la traducción, el universal de interferencia influye sobre los mecanismos discursivos relacionados con la memoria, de manera tal que la producción de un texto traducido sin visibilidad de interferencia supone esfuerzos especiales por parte del traductor (Toury, 2004: 345). En el marco de esta problemática, nuestro estudio respecto de las cadenas referenciales (CR) en corpora trilingües se fundamenta en los trabajos de Ariel (1990) y, especialmente de Schnedecker (1997, 2005), en cuanto a las expresiones referenciales que mantienen la cohesión del texto y sus relaciones con la accesibilidad al referente. Los resultados de este estudio descriptivo y contrastivo a partir de un corpus de textos trilingües podrán contribuir al conocimiento del macroproceso de traducción y, por consiguiente, a la formación de traductores. Asimismo, esta presentación se inscribe en el marco de la Traductología y aspira a ser un aporte a otras disciplinas, especialmente a la Lingüística, en una relación de reciprocidad (García, 2012: 78)