Traitement de données issues d'un corpus écrit multilingue. Approche agile pour l'analyse du discours eurorégional
Data(s) |
2015
|
---|---|
Resumo |
L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l’appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qualifions d’« agile » en raison de son caractère souple et itératif. La plateforme d’analyse élaborée permet de disposer de résultats utiles à l’analyse qualitative ultérieure du discours eurorégional. Elle articule un logiciel d'analyse morphosyntaxique éprouvé (TreeTagger) à des programmes (Perl) et à une base de données (SQLite) développés pour optimiser les requêtes multilingues simultanées et l’exportation automatique des résultats. Les fonctionnalités liées à la localisation contextualisée de mots- pivots, au recueil de dénominations et à la détection de segments répétés nous servent ici de guides pour exprimer les besoins de la recherche, les problèmes rencontrés et les solutions proposées. L'analyse d'observables récurrents, à savoir les notions de décision et de responsabilité, illustre le propos. info:eu-repo/semantics/published |
Formato |
1 full-text file(s): application/pdf |
Identificador |
https://dipot.ulb.ac.be/dspace/bitstream/2013/220542/3/HERMAND-shsconf_icodoc2015_01009.pdf http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/220542 |
Idioma(s) |
fr |
Direitos |
1 full-text file(s): info:eu-repo/semantics/restrictedAccess |
Fonte |
In: Actes du colloque ICODOC 2015 "Corpus complexes et enjeux méthodologiques :de la collecte de données à leur analyse". SHS Web of Conferences |
Palavras-Chave | #Information et communication #Analyse de discours multilingue #Analyse de discours multigenre #Modélisation agile #Textométrie |
Tipo |
info:eu-repo/semantics/conferencePaper info:ulb-repo/semantics/conferencePaper info:ulb-repo/semantics/openurl/proceeding |