Traitement de données issues d'un corpus écrit multilingue. Approche agile pour l'analyse du discours eurorégional


Autoria(s): Hermand, Marie-Hélène; Thouraud, Emmanuel
Data(s)

2015

Resumo

L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l’appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qualifions d’« agile » en raison de son caractère souple et itératif. La plateforme d’analyse élaborée permet de disposer de résultats utiles à l’analyse qualitative ultérieure du discours eurorégional. Elle articule un logiciel d'analyse morphosyntaxique éprouvé (TreeTagger) à des programmes (Perl) et à une base de données (SQLite) développés pour optimiser les requêtes multilingues simultanées et l’exportation automatique des résultats. Les fonctionnalités liées à la localisation contextualisée de mots- pivots, au recueil de dénominations et à la détection de segments répétés nous servent ici de guides pour exprimer les besoins de la recherche, les problèmes rencontrés et les solutions proposées. L'analyse d'observables récurrents, à savoir les notions de décision et de responsabilité, illustre le propos.

info:eu-repo/semantics/published

Formato

1 full-text file(s): application/pdf

Identificador

https://dipot.ulb.ac.be/dspace/bitstream/2013/220542/3/HERMAND-shsconf_icodoc2015_01009.pdf

http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/220542

Idioma(s)

fr

Direitos

1 full-text file(s): info:eu-repo/semantics/restrictedAccess

Fonte

In: Actes du colloque ICODOC 2015 "Corpus complexes et enjeux méthodologiques :de la collecte de données à leur analyse". SHS Web of Conferences

Palavras-Chave #Information et communication #Analyse de discours multilingue #Analyse de discours multigenre #Modélisation agile #Textométrie
Tipo

info:eu-repo/semantics/conferencePaper

info:ulb-repo/semantics/conferencePaper

info:ulb-repo/semantics/openurl/proceeding