Biblioteca Digital

1 resultado para Didactique du français

em DI-fusion - The institutional repository of Université Libre de Bruxelles

Traitement de données issues d'un corpus écrit multilingue. Approche agile pour l'analyse du discours eurorégional

Relevância:

30.00% 30.00%

Publicador:

Resumo:

L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l’appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qualifions d’« agile » en raison de son caractère souple et itératif. La plateforme d’analyse élaborée permet de disposer de résultats utiles à l’analyse qualitative ultérieure du discours eurorégional. Elle articule un logiciel d'analyse morphosyntaxique éprouvé (TreeTagger) à des programmes (Perl) et à une base de données (SQLite) développés pour optimiser les requêtes multilingues simultanées et l’exportation automatique des résultats. Les fonctionnalités liées à la localisation contextualisée de mots- pivots, au recueil de dénominations et à la détection de segments répétés nous servent ici de guides pour exprimer les besoins de la recherche, les problèmes rencontrés et les solutions proposées. L'analyse d'observables récurrents, à savoir les notions de décision et de responsabilité, illustre le propos.

Veja mais

1 resultado para Didactique du français

em DI-fusion - The institutional repository of Université Libre de Bruxelles

Filtro por publicador

Traitement de données issues d'un corpus écrit multilingue. Approche agile pour l'analyse du discours eurorégional