933 resultados para analyse du corpus


Relevância:

100.00% 100.00%

Publicador:

Resumo:

L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l’appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qualifions d’« agile » en raison de son caractère souple et itératif. La plateforme d’analyse élaborée permet de disposer de résultats utiles à l’analyse qualitative ultérieure du discours eurorégional. Elle articule un logiciel d'analyse morphosyntaxique éprouvé (TreeTagger) à des programmes (Perl) et à une base de données (SQLite) développés pour optimiser les requêtes multilingues simultanées et l’exportation automatique des résultats. Les fonctionnalités liées à la localisation contextualisée de mots- pivots, au recueil de dénominations et à la détection de segments répétés nous servent ici de guides pour exprimer les besoins de la recherche, les problèmes rencontrés et les solutions proposées. L'analyse d'observables récurrents, à savoir les notions de décision et de responsabilité, illustre le propos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ce mémoire de maitrise vise à dresser un portrait des erreurs syntaxiques des élèves du secondaire en analysant un corpus de textes de cinq groupes du Québec, de la 1re à la 5e secondaire. Les résultats actuels aux épreuves ministérielles des élèves de 5e secondaire nous indiquent que les élèves éprouvent des difficultés avec l’écriture du français. Une analyse approfondie nous permet de comprendre que l’amélioration de la situation passe par une meilleure connaissance des erreurs syntaxiques des élèves. En nous appuyant sur la grille de Boivin et Pinsonneault (2014), nous avons analysé les données provenant du codage des textes d’élèves de la 1re à la 5e secondaire. L’analyse de ces données nous a permis de constater que parmi les sept grandes catégories d’erreurs de la grille, c’est en syntaxe que les élèves commettent le plus d’erreurs. Une incursion au cœur des six sous-catégories de la syntaxe a révélé que la ponctuation causait le plus de problème aux élèves, et ce, à tous les niveaux. Les erreurs liées à la détermination de la catégorie grammaticale des mots (homophones) arrivaient en deuxième place. Par la suite, nous avons précisé davantage l’analyse en déterminant, pour chacun des codes, l’évolution du nombre d’erreurs d’un niveau du secondaire à l’autre. Il est ressorti de cette étude que les deux principales erreurs, basées sur les sous-catégories syntaxiques, sont celles portant sur l’usage de la virgule et celles liées à la confusion qui existe encore un verbe terminant par «er» et un adjectif ou un participe passé terminant par «é-e-s».

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dans le cadre des travaux du Centre d'analyse et de traitement informatique du français québécois (CATIFQ) sur la caractérisation des textes de langue publique québécoise, la présente étude porte sur le vocabulaire sociopolitique en situation officielle au Québec. Cette étude est basée sur un corpus de mémoires présentés à la Commission Bélanger-Campeau sur l'avenir politique et constitutionnel du Québec. Constitué à partir d'une norme élaborée au CATIFQ, et permettant de ce fait la comparaison des données avec d'autres corpus similaires, le corpus Bélanger-Campeau compte 250 000 occurrences et 8355 vocables. Sa richesse, la synchronie de ses données et les critères de sa constitution en font un point de repère pertinent pour la description du français québécois. À partir de ce corpus, nous avons sélectionné les vocables de trois réseaux propres au questionnement constitutionnel et identitaire faisant l'objet de la Commission Bélanger-Campeau: le réseau des groupes humains (communauté, État, nation, pays, peuple, société), le réseau des options constitutionnelles (autonomie, fédéralisme, indépendance, souveraineté, statu quo) et le réseau identitaire (anglais, anglophone, autochtone, canadien, français, francophone, immigrant, québécois). Notre cadre théorique et méthodologique s'appuie sur des travaux antérieurs, mais l'analyse des trois réseaux du corpus Bélanger-Campeau s'est faite en vase clos. Puis nous avons comparé nos résultats aux définitions de dictionnaires français et québécois, de même qu'à des recherches antérieures touchant le vocabulaire sociopolitique. Nous concluons de cette démarche l'importance d'étudier les vocables en contexte, notamment en se penchant sur la cooccurrence, pour en cerner le plus objectivement possible les nuances sémantiques. De plus, l'analyse du corpus Bélanger-Campeau a permis la description de vocables et d'acceptions propres aux contextes québécois et canadien, et souvent absents des dictionnaires consultés, ou inadéquatement définis. Enfin, l'examen des cooccurrents nous a permis d'identifier nombre de collocations propres au français d'ici et caractéristiques de notre situation sociopolitique (peuple fondateur, projet de société, société distincte, fédéralisme renouvelé, souveraineté-association, Canada anglais, rêve canadien, canadien-anglais, canadien-français et fait français).

Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’immunopathogenèse de l’infection au VIH-1 est principalement causée par la déplétion des LT CD4 (lymphocytes T-CD4). Cette mort des LT CD4 dépend de plusieurs facteurs comme la lyse des LT CD4 infectés et la présence de vésicules extracellulaires et d’exosomes libérées par les cellules dendritiques et les LT CD4 infectés au VIH-1. L’analyse protéomique des exosomes issus des cellules dendritiques mises en culture avec le VIH-1 a révélé la présence de molécules pro-apoptotiques comme le Dap-3 (Death Associated Protein 3). Nous avons proposé comme hypothèse que le Dap-3 puisse être contenu dans d’autres types de vésicules extracellulaires et que le Dap-3 vésiculaire contribue à la déplétion des LT CD4. Après avoir optimisé l’immunobuvardage avec l’anti-Dap-3, nous avons déterminé la présence de Dap-3 dans les vésicules extracellulaires issues des cellules RAJI-CD4-DCIR infectées au VIH-1. L’utilisation de gradients de vélocité nous a permis d’observer la présence de Dap-3 dans les fractions du gradient contenant les exosomes issus des cellules RAJI-CD4-DCIR infectées, mais également dans d’autres fractions du gradient de vélocité encore non caractérisées. Chez les patients, nous avons montré une hétérogénéité des vésicules extracellulaires dans les fractions du gradient de vélocité issues des plasmas des patients VIH-1+. Ces résultats indiquent la présence de plusieurs populations de vésicules extracellulaires séparées par la méthode du gradient de vélocité. Enfin, la transfection des cellules RAJI-CD4-DCIR et des cellules dendritiques a été mise au point avec les ARN anti-sens de Dap-3 afin de produire éventuellement des vésicules Dap-3 négatives. Ce projet de recherche aura permis de valider les outils nécessaires à la poursuite de l’étude du rôle de Dap-3 dans la pathogenèse de l’infection au VIH-1.