889 resultados para corpus multilingue


Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’objectif de cet article est double :il s’agit, d’une part, de présenter un nouveau corpus permettant d’envisager le phénomène émergent de la communication transfrontalière en Europe et, d’autre part, de formuler trois questionnements utiles au cadrage de son analyse sémantique. À partir du corpus eurorégional – multilingue et multigenre - nous posons les questions de la dispersion des discours en ligne, de l’hétérogénéité des données et de la contextualisation de l’analyse. Notre démarche consiste à construire progressivement un modèle d’analyse adapté à l’appréhension, tantôt automatique et tantôt manuelle, de la diversité des textes. Enfin, nous proposons d’illustrer la démarche en l’appliquant à la mobilité, observable récurrent du corpus.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

À partir d’un corpus de sites web institutionnels publiés par les eurorégions, l’article explore les indices discursifs qui tendent à légitimer la notion d’espace eurorégional. L’analyse lexicométrique et qualitative des énoncés multilingues aboutit au double constat d’une conformité aux objectifs normatifs de la politique européenne et d’une uniformisation des représentations eurorégionales, en dépit des langues et des zones transfrontalières émettrices.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Dans cet article, nous cherchons des traces discursives de l’affirmation d’acteurs émergents en Europe et plutôt méconnus des citoyens :les eurorégions. Ces organisations européennes de coopération transfrontalière, dont la prolifération est remarquable depuis le début des années 2000, présentent la particularité d’être engagées dans un processus d’institutionnalisation inachevé et au dénouement incertain. À partir d’un corpus multilingue et multigenre, nous observons comment les eurorégions développent leurs capacités à formuler des problèmes, à s’insérer dans des processus décisionnels et à produire des solutions défendables. Les résultats textométriques combinés à l’analyse qualitative révèlent des consensus et des tensions qui accompagnent une création institutionnelle programmée par les institutions européennes et installent l’imaginaire d’un continuum territorial et temporel en Europe.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l’appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qualifions d’« agile » en raison de son caractère souple et itératif. La plateforme d’analyse élaborée permet de disposer de résultats utiles à l’analyse qualitative ultérieure du discours eurorégional. Elle articule un logiciel d'analyse morphosyntaxique éprouvé (TreeTagger) à des programmes (Perl) et à une base de données (SQLite) développés pour optimiser les requêtes multilingues simultanées et l’exportation automatique des résultats. Les fonctionnalités liées à la localisation contextualisée de mots- pivots, au recueil de dénominations et à la détection de segments répétés nous servent ici de guides pour exprimer les besoins de la recherche, les problèmes rencontrés et les solutions proposées. L'analyse d'observables récurrents, à savoir les notions de décision et de responsabilité, illustre le propos.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Com esta tese almejámos compreender se o corpus literário consignado aos alunos dos 11º e 12º anos do Ensino Secundário Geral – ESG, fomenta a interculturalidade, em função dos diferentes grupos étnicos moçambicanos. Cientistas sociais têm apontado como prioridade, na área de Educação Cultural, o estabelecimento de estratégias para promover a interculturalidade, uma vez que Moçambique é um país multilingue e multicultural. Verificámos que a literatura, nomeadamente, ainda não foi abordada como prática que, a partir de recursos pedagógicos específicos, pode alavancar este princípio. Assim, realizámos uma pesquisa com o objetivo de: a) analisar as formas de interpretação de interculturalidade, a partir das representações culturais constantes do corpus literário obrigatório, por parte de intervenientes do processo educativo; b) mapear as representações culturais do mosaico identitário moçambicano nesse corpus literário; c) discutir se essas representações culturais promovem a interculturalidade; d) verificar de que forma é que esse corpus literário é utilizado enquanto meio que, a partir das respectivas representações culturais, pode estimular a interculturalidade. Como metodologia de trabalho analisámos diferentes estudos que abordam a interculturalidade, o texto literário e a Educação Cultural, para apreendermos que valor acrescentar relativamente à implementação da mesma em Moçambique. Debruçámo-nos também sobre a Agenda Nacional 2025 que traça os objetivos que o país deseja alcançar em Moçambique. No tocante às diretrizes escolares, estudámos os documentos que preconizam o que é prioritário para efetivar o Sistema Nacional de Ensino; analisámos o corpus literário obrigatório para os 11º e 12º anos do ESG moçambicano; aplicámos três questionários a intervenientes do processo educativo: alunos da Escola Portuguesa de Moçambique (estudado como grupo de controle) e alunos do ESG; uma planificadora curricular e uma autora de manuais de ensino. Um quarto questionário foi aplicado a um conjunto de nativos de cada grupo étnico moçambicano. Os documentos mencionados e as perguntas abertas dos questionários tiveram uma abordagem qualitativa. As perguntas fechadas foram analisadas de acordo com o método quantitativo. Recorremos ainda a um quadro teórico assente nos Estudos Culturais e na Teoria Literária, especificamente na Estética da Receção e na Sociologia da Leitura, por colocarem o leitor no centro de hipóteses de descodificação textual. No tocante ao questionário aplicado aos alunos, medimos os resultados da formação, realizada a partir desse tipo de texto, com recurso à corrente do Interacionismo Sócio-discursivo. Os resultados dessa análise levaram-nos a constatar que, na ótica da receção ativa de textos, as práticas educativas devem estimular os alunos a interpretarem os diferentes sentidos para os quais a obra literária aponta, atendendo à literariedade do texto, no quadro de modalizações culturais, uma vez que algumas obras literárias moçambicanas assentam sobre uma escrita de base etnográfica. Este pode ser um recurso para despertar os alunos para uma consciência intercultural. A conclusão a que chegámos é a de que o atual corpus literário tem limitações na promoção da interculturalidade. Foi nesse sentido que apresentámos um cânone literário multicultural e um modelo de análise de representações culturais dos grupos étnicos moçambicanos susceptível de aplicação aos contextos educativos

Relevância:

30.00% 30.00%

Publicador:

Resumo:

réalisé en cotutelle à l'Université de Franche-Comté (France)

Relevância:

30.00% 30.00%

Publicador:

Resumo:

L’objectif de cette étude est d’examiner le discours des deux commissaires européens sur Twitter. L’étude se concentre à déterminer les langues principales du discours, la présence du dialogue multilingue et quelques caractéristiques des ressources utilisées par les participants. La recherche examine également les sujets du discours et le rôle des hashtags. Le corpus de l’étude consiste en 20 tweets par commissaire et ses réactions. La méthode de recherche est ethnographique. Le cadre théorique de l’étude se base sur la sociolinguistique de la globalisation (Blommaert, Heller) et les théories sur la communication médiée par l’ordinateur (Androutsopoulos). Les résultats de l’analyse montrent que les deux commissaires communiquent en plusieurs langues et les participants en introduisent encore plus dans leurs réactions. Il n’y a pas d’interaction entre les politiciens et les participants. La réflexivité métalinguistique est présente dans les réactions – les participants critiquent le choix de langue des commissaires. Ainsi, le choix de la langue des politiciens devient le sujet de la discussion. L’utilisation des pronoms je et nous dans le discours des politiciens fait également l’objet de la recherche. Les nous collectifs du corpus expriment surtout une collectivité professionnelle mais également une collectivité idéologique. Les sujets du discours des politiciens sont principalement liés à l’actualité de l’UE tandis que les participants introduisent surtout des sujets où les politiciens sont critiqués. En ce qui concerne les hashtags, deux catégories ont été identifiées : les hashtags qui ont comme objectif de faire le concept visible ou bien les hashtags qui ont comme but de guider les participants à interpréter le message d’une façon spécifique. L’étude montre également que le principe du multilinguisme n’est pas respecté par les politiciens sur Twitter. Pourtant, Twitter peut fournir une plate-forme égalitaire pour la discussion. Ainsi, il serait intéressant d’étudier Twitter du point de vue de l’égalité linguistique.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The QUT-NOISE-TIMIT corpus consists of 600 hours of noisy speech sequences designed to enable a thorough evaluation of voice activity detection (VAD) algorithms across a wide variety of common background noise scenarios. In order to construct the final mixed-speech database, a collection of over 10 hours of background noise was conducted across 10 unique locations covering 5 common noise scenarios, to create the QUT-NOISE corpus. This background noise corpus was then mixed with speech events chosen from the TIMIT clean speech corpus over a wide variety of noise lengths, signal-to-noise ratios (SNRs) and active speech proportions to form the mixed-speech QUT-NOISE-TIMIT corpus. The evaluation of five baseline VAD systems on the QUT-NOISE-TIMIT corpus is conducted to validate the data and show that the variety of noise available will allow for better evaluation of VAD systems than existing approaches in the literature.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Extracellular matrix regulates many cellular processes likely to be important for development and regression of corpora lutea. Therefore, we identified the types and components of the extracellular matrix of the human corpus luteum at different stages of the menstrual cycle. Two different types of extracellular matrix were identified by electron microscopy; subendothelial basal laminas and an interstitial matrix located as aggregates at irregular intervals between the non-vascular cells. No basal laminas were associated with luteal cells. At all stages, collagen type IV α1 and laminins α5, β2 and γ1 were localized by immunohistochemistry to subendothelial basal laminas, and collagen type IV α1 and laminins α2, α5, β1 and β2 localized in the interstitial matrix. Laminin α4 and β1 chains occurred in the subendothelial basal lamina from mid-luteal stage to regression; at earlier stages, a punctate pattern of staining was observed. Therefore, human luteal subendothelial basal laminas potentially contain laminin 11 during early luteal development and, additionally, laminins 8, 9 and 10 at the mid-luteal phase. Laminin α1 and α3 chains were not detected in corpora lutea. Versican localized to the connective tissue extremities of the corpus luteum. Thus, during the formation of the human corpus luteum, remodelling of extracellular matrix does not result in basal laminas as present in the adrenal cortex or ovarian follicle. Instead, novel aggregates of interstitial matrix of collagen and laminin are deposited within the luteal parenchyma, and it remains to be seen whether this matrix is important for maintaining the luteal cell phenotype.

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper, we describe a machine-translated parallel English corpus for the NTCIR Chinese, Japanese and Korean (CJK) Wikipedia collections. This document collection is named CJK2E Wikipedia XML corpus. The corpus could be used by the information retrieval research community and knowledge sharing in Wikipedia in many ways; for example, this corpus could be used for experimentations in cross-lingual information retrieval, cross-lingual link discovery, or omni-lingual information retrieval research. Furthermore, the translated CJK articles could be used to further expand the current coverage of the English Wikipedia.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Measures of semantic similarity between medical concepts are central to a number of techniques in medical informatics, including query expansion in medical information retrieval. Previous work has mainly considered thesaurus-based path measures of semantic similarity and has not compared different corpus-driven approaches in depth. We evaluate the effectiveness of eight common corpus-driven measures in capturing semantic relatedness and compare these against human judged concept pairs assessed by medical professionals. Our results show that certain corpus-driven measures correlate strongly (approx 0.8) with human judgements. An important finding is that performance was significantly affected by the choice of corpus used in priming the measure, i.e., used as evidence from which corpus-driven similarities are drawn. This paper provides guidelines for the implementation of semantic similarity measures for medical informatics and concludes with implications for medical information retrieval.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper evaluates the efficiency of a number of popular corpus-based distributional models in performing discovery on very large document sets, including online collections. Literature-based discovery is the process of identifying previously unknown connections from text, often published literature, that could lead to the development of new techniques or technologies. Literature-based discovery has attracted growing research interest ever since Swanson's serendipitous discovery of the therapeutic effects of fish oil on Raynaud's disease in 1986. The successful application of distributional models in automating the identification of indirect associations underpinning literature-based discovery has been heavily demonstrated in the medical domain. However, we wish to investigate the computational complexity of distributional models for literature-based discovery on much larger document collections, as they may provide computationally tractable solutions to tasks including, predicting future disruptive innovations. In this paper we perform a computational complexity analysis on four successful corpus-based distributional models to evaluate their fit for such tasks. Our results indicate that corpus-based distributional models that store their representations in fixed dimensions provide superior efficiency on literature-based discovery tasks.