995 resultados para Text Corpus


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Ce que nous proposons de faire dans ce mémoire est de s’attarder au phénomène spécifique de la lecture des scénarios dans le contexte institutionnel québécois. Nous analyserons un corpus de cent soixante douze rapports de lecture de scénarios de longs métrages de fiction rédigés entre 1972 et 2004. Il n’existe, à notre connaissance, aucune étude portant spécifiquement sur un corpus de rapports de lecture. Dans un premier temps, nous situerons le rôle et la place du scénario dans l’histoire de la production de films de fiction québécoise, entre acceptation et refus. Ensuite, nous nous intéresserons à la manière dont concrètement les scénarios sont lus : par qui, comment, dans quelles conditions, avec quels objectifs. Enfin, en utilisant une analyse par théorisation ancrée (grounded theory), nous identifierons, à partir des commentaires émis dans les rapports, cinq entités sur lesquelles le lecteur se fonde pour formuler son jugement. Il s’agit du scénariste, du scénario proposé, du lecteur lui-même, du film à faire et du spectateur présumé que nous nommerons fictif. Nous en conclurons que le lecteur de scénario occupe une fonction de médiateur entre un texte et son auteur d’une part et un futur film et son spectateur réel d’autre part. Cette médiation est le lieu de convergence de différentes attentes, celles des lecteurs, des auteurs, des producteurs et des institutions.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Refus global, le recueil, n’est pas « Refus global », le texte rédigé par Paul-Émile Borduas et cosigné par 15 membres du groupe automatiste. Partant de cette distinction entre le recueil automatiste et son texte éponyme et du constat selon lequel la partie éclipse le tout dans le discours critique, cette thèse a pour objectif d’expliquer l’occultation du recueil dans l’histoire sociale et artistique québécoise. À partir de l’étude de la réception de 1948 à 2008, j’interroge la constitution du récit commun entourant l’œuvre, duquel le recueil est exclu. Il s’agit donc de mettre au jour les obstacles qui se sont présentés dans le parcours de réception du recueil, nuisant à la formation d’un discours unifié et cohérent à son sujet et l’empêchant de s’inscrire dans l’histoire. Dégagés de l’étude du corpus composé de 639 objets sémiotiques secondaires (OSS, selon le concept proposé par Brigitte Louichon), les obstacles à la réception du recueil relèvent à la fois de facteurs pragmatiques, telles la composition hétérogène de l’œuvre ou sa disponibilité; de facteurs institutionnels ou historiographiques, comme la disciplinarisation du champ culturel ou l’impact du récit de la Révolution tranquille sur l’histoire littéraire; et de facteurs humains, reposant sur le rôle des auteurs et de certains critiques dans l’accueil réservé à l’œuvre. Les différentes étapes de la réception sont ainsi considérées : de l’horizon d’attente (Jauss) à la réception productive (Link), en passant par la publication, les premières critiques, les rééditions, les lectures savantes, l’historicisation et l’entrée de l’œuvre dans la mémoire à titre de symbole ou d’hypotexte. Or, plutôt qu’à ce parcours de réception exemplaire, c’est son envers qui est interrogé ici, c’est-à-dire les difficultés et les déviations de la réception du recueil Refus global. Cette thèse est divisée en trois parties. La première, théorique et méthodologique, situe mon propos dans les domaines de l’histoire culturelle et des études de réception, et présente diverses considérations concernant la constitution du corpus et le traitement des données. La deuxième aborde l’horizon d’attente et la première réception, moment crucial pour la survie de l’œuvre, comme l’ont montré Hans Robert Jauss et Daniel Chartier. On y observe notamment l’effet de verrou (Cambron) qu’a le renvoi de Borduas sur la constitution du récit de réception, de même que les critères éthiques et esthétiques en fonction desquels s’est opérée la hiérarchisation des composantes du recueil. La troisième partie couvre la réception subséquente (1950-2008). À l’étude des obstacles empêchant l’intégration du recueil dans l’histoire s’ajoute alors l’étude des réceptions parallèles, parcellaires et autonomes dont a bénéficié Refus global pour survivre – ponctuellement et partiellement – en dehors du récit commun formé autour de « Refus global ». Avec les différentes catégories d’OSS (directs, indirects, hypertextuels, métacritiques et parcellaires), ces trois types de réception font partie des outils heuristiques développés dans le but d’expliquer la réception partielle dont a fait l’objet le recueil. Selon l’approche quantitative et environnementaliste de l’histoire culturelle, Refus global est envisagé comme un microcosme de la culture, dans lequel certaines œuvres sont retenues et d’autres négligées. L’analyse d’un corpus critique large et varié permet ainsi de saisir non seulement les phénomènes conduisant à la consécration du texte éponyme ou à l’oubli relatif du recueil, mais aussi les tendances critiques, les parutions marginales, les critiques isolées, etc. qui, enfouies dans les angles morts de la réception, offrent au recueil et à ses composantes des voies de contournement du discours dominant. En somme, l’étude de la réception du recueil Refus global a permis à la fois de déplacer la focalisation critique depuis « Refus global » vers Refus global, de développer des outils pour envisager la réception d’œuvres marginalisées et de mettre en évidence des critères privilégiés dans la constitution de l’histoire et de la mémoire culturelles québécoises depuis 1948.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

RÉSUMÉ La ruse féminine, étudiée en regard de la littérature narrative médiévale, constitue une topique spontanément associée à une idéologie misogyne. Les itérations des motifs liés à cette topique foisonnent dans le Roman de Silence et dans les fabliaux également copiés dans le manuscrit de Nottingham. Étant donné la place prépondérante du travestissement dans le Roman de Silence, ce texte a été abondamment étudié sous l’angle des Gender Studies. Toutefois, le travestissement endossé ou orchestré par des figures féminines est compris dans un ensemble de motifs liés à la ruse féminine. Cette dernière fait l’objet de nombreux commentaires de la part des narrateurs et des personnages du corpus. Or il arrive parfois que ces commentaires, sous des dehors désapprobateurs, mettent en lumière la puissance de la ruse féminine. Qui plus est, d’un point de vue narratologique, la réussite ou l’échec de ces ruses ont été étudiés, dans un corpus où le ton se fait souvent didactique, pour établir si celles-ci tenaient lieu d’exemples ou de contre-exemples. Avant d’analyser l’énonciation, les motifs de la ruse féminine ont été étudiés en regard des hypotextes qu’ils évoquaient, et ce, tout en postulant l’interlisibilité des textes d’un même manuscrit. Il a donc été possible de déterminer dans quelle mesure le corpus désamorçait ces motifs, créant des situations souvent ironiques signalant au lecteur de ne pas s’aventurer trop crédulement dans les textes, et d’être attentif autant à l’ironie de situation qu’à celle qui s’ancre dans la situation d’énonciation.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

L'exécution des pièces jointes au corpus a été rendue possible grâce à la générosité des ensembles qui en font l'interprétation. Les partitions ont été réalisées avec le logiciel FINALE 2011.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Les moteurs de recherche font partie de notre vie quotidienne. Actuellement, plus d’un tiers de la population mondiale utilise l’Internet. Les moteurs de recherche leur permettent de trouver rapidement les informations ou les produits qu'ils veulent. La recherche d'information (IR) est le fondement de moteurs de recherche modernes. Les approches traditionnelles de recherche d'information supposent que les termes d'indexation sont indépendants. Pourtant, les termes qui apparaissent dans le même contexte sont souvent dépendants. L’absence de la prise en compte de ces dépendances est une des causes de l’introduction de bruit dans le résultat (résultat non pertinents). Certaines études ont proposé d’intégrer certains types de dépendance, tels que la proximité, la cooccurrence, la contiguïté et de la dépendance grammaticale. Dans la plupart des cas, les modèles de dépendance sont construits séparément et ensuite combinés avec le modèle traditionnel de mots avec une importance constante. Par conséquent, ils ne peuvent pas capturer correctement la dépendance variable et la force de dépendance. Par exemple, la dépendance entre les mots adjacents "Black Friday" est plus importante que celle entre les mots "road constructions". Dans cette thèse, nous étudions différentes approches pour capturer les relations des termes et de leurs forces de dépendance. Nous avons proposé des méthodes suivantes: ─ Nous réexaminons l'approche de combinaison en utilisant différentes unités d'indexation pour la RI monolingue en chinois et la RI translinguistique entre anglais et chinois. En plus d’utiliser des mots, nous étudions la possibilité d'utiliser bi-gramme et uni-gramme comme unité de traduction pour le chinois. Plusieurs modèles de traduction sont construits pour traduire des mots anglais en uni-grammes, bi-grammes et mots chinois avec un corpus parallèle. Une requête en anglais est ensuite traduite de plusieurs façons, et un score classement est produit avec chaque traduction. Le score final de classement combine tous ces types de traduction. Nous considérons la dépendance entre les termes en utilisant la théorie d’évidence de Dempster-Shafer. Une occurrence d'un fragment de texte (de plusieurs mots) dans un document est considérée comme représentant l'ensemble de tous les termes constituants. La probabilité est assignée à un tel ensemble de termes plutôt qu’a chaque terme individuel. Au moment d’évaluation de requête, cette probabilité est redistribuée aux termes de la requête si ces derniers sont différents. Cette approche nous permet d'intégrer les relations de dépendance entre les termes. Nous proposons un modèle discriminant pour intégrer les différentes types de dépendance selon leur force et leur utilité pour la RI. Notamment, nous considérons la dépendance de contiguïté et de cooccurrence à de différentes distances, c’est-à-dire les bi-grammes et les paires de termes dans une fenêtre de 2, 4, 8 et 16 mots. Le poids d’un bi-gramme ou d’une paire de termes dépendants est déterminé selon un ensemble des caractères, en utilisant la régression SVM. Toutes les méthodes proposées sont évaluées sur plusieurs collections en anglais et/ou chinois, et les résultats expérimentaux montrent que ces méthodes produisent des améliorations substantielles sur l'état de l'art.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dopamine D2 receptors are involved in ethanol self- administration behavior and also suggested to mediate the onset and offset of ethanol drinking. In the present study, we investigated dopamine (DA) content and Dopamine D2 (DA D2) receptors in the hypothalamus and corpus striatum of ethanol treated rats and aldehyde dehydrogenase (ALDH) activity in the liver and plasma of ethanol treated rats and in vitro hepatocyte cultures. Hypothalamic and corpus striatal DA content decreased significantly (P\0.05, P\0.001 respectively) and homovanillic acid/ dopamine (HVA/DA) ratio increased significantly (P\0.001) in ethanol treated rats when compared to control. Scatchard analysis of [3H] YM-09151-2 binding to DA D2 receptors in hypothalamus showed a significant increase (P\0.001) in Bmax without any change in Kd in ethanol treated rats compared to control. The Kd of DA D2 receptors significantly decreased (P\0.05) in the corpus striatum of ethanol treated rats when compared to control. DA D2 receptor affinity in the hypothalamus and corpus striatum of control and ethanol treated rats fitted to a single site model with unity as Hill slope value. The in vitro studies on hepatocyte cultures showed that 10-5 M and 10-7 M DA can reverse the increased ALDH activity in 10% ethanol treated cells to near control level. Sulpiride, an antagonist of DA D2, reversed the effect of dopamine on 10% ethanol induced ALDH activity in hepatocytes. Our results showed a decreased dopamine concentration with enhanced DA D2 receptors in the hypothalamus and corpus striatum of ethanol treated rats. Also, increased ALDH was observed in the plasma and liver of ethanol treated rats and in vitro hepatocyte cultures with 10% ethanol as a compensatory mechanism for increased aldehyde production due to increased dopamine metabolism. A decrease in dopamine concentration in major brain regions is coupled with an increase in ALDH activity in liver and plasma, which contributes to the tendency for alcoholism. Since the administration of 10-5 M and 10-7 M DA can reverse the increased ALDH activity in ethanol treated cells to near control level, this has therapeutic application to correct ethanol addicts from addiction due to allergic reaction observed in aldehyde accumulation.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper a method of copy detection in short Malayalam text passages is proposed. Given two passages one as the source text and another as the copied text it is determined whether the second passage is plagiarized version of the source text. An algorithm for plagiarism detection using the n-gram model for word retrieval is developed and found tri-grams as the best model for comparing the Malayalam text. Based on the probability and the resemblance measures calculated from the n-gram comparison , the text is categorized on a threshold. Texts are compared by variable length n-gram(n={2,3,4}) comparisons. The experiments show that trigram model gives the average acceptable performance with affordable cost in terms of complexity

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper underlines a methodology for translating text from English into the Dravidian language, Malayalam using statistical models. By using a monolingual Malayalam corpus and a bilingual English/Malayalam corpus in the training phase, the machine automatically generates Malayalam translations of English sentences. This paper also discusses a technique to improve the alignment model by incorporating the parts of speech information into the bilingual corpus. Removing the insignificant alignments from the sentence pairs by this approach has ensured better training results. Pre-processing techniques like suffix separation from the Malayalam corpus and stop word elimination from the bilingual corpus also proved to be effective in training. Various handcrafted rules designed for the suffix separation process which can be used as a guideline in implementing suffix separation in Malayalam language are also presented in this paper. The structural difference between the English Malayalam pair is resolved in the decoder by applying the order conversion rules. Experiments conducted on a sample corpus have generated reasonably good Malayalam translations and the results are verified with F measure, BLEU and WER evaluation metrics

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper discusses the implementation details of a child friendly, good quality, English text-to-speech (TTS) system that is phoneme-based, concatenative, easy to set up and use with little memory. Direct waveform concatenation and linear prediction coding (LPC) are used. Most existing TTS systems are unit-selection based, which use standard speech databases available in neutral adult voices.Here reduced memory is achieved by the concatenation of phonemes and by replacing phonetic wave files with their LPC coefficients. Linguistic analysis was used to reduce the algorithmic complexity instead of signal processing techniques. Sufficient degree of customization and generalization catering to the needs of the child user had been included through the provision for vocabulary and voice selection to suit the requisites of the child. Prosody had also been incorporated. This inexpensive TTS systemwas implemented inMATLAB, with the synthesis presented by means of a graphical user interface (GUI), thus making it child friendly. This can be used not only as an interesting language learning aid for the normal child but it also serves as a speech aid to the vocally disabled child. The quality of the synthesized speech was evaluated using the mean opinion score (MOS).

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper, we describe an interdisciplinary project in which visualization techniques were developed for and applied to scholarly work from literary studies. The aim was to bring Christof Schöch's electronic edition of Bérardier de Bataut's Essai sur le récit (1776) to the web. This edition is based on the Text Encoding Initiative's XML-based encoding scheme (TEI P5, subset TEI-Lite). This now de facto standard applies to machine-readable texts used chiefly in the humanities and social sciences. The intention of this edition is to make the edited text freely available on the web, to allow for alternative text views (here original and modern/corrected text), to ensure reader-friendly annotation and navigation, to permit on-line collaboration in encoding and annotation as well as user comments, all in an open source, generically usable, lightweight package. These aims were attained by relying on a GPL-based, public domain CMS (Drupal) and combining it with XSL-Stylesheets and Java Script.

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Resumo:

There are numerous text documents available in electronic form. More and more are becoming available every day. Such documents represent a massive amount of information that is easily accessible. Seeking value in this huge collection requires organization; much of the work of organizing documents can be automated through text classification. The accuracy and our understanding of such systems greatly influences their usefulness. In this paper, we seek 1) to advance the understanding of commonly used text classification techniques, and 2) through that understanding, improve the tools that are available for text classification. We begin by clarifying the assumptions made in the derivation of Naive Bayes, noting basic properties and proposing ways for its extension and improvement. Next, we investigate the quality of Naive Bayes parameter estimates and their impact on classification. Our analysis leads to a theorem which gives an explanation for the improvements that can be found in multiclass classification with Naive Bayes using Error-Correcting Output Codes. We use experimental evidence on two commonly-used data sets to exhibit an application of the theorem. Finally, we show fundamental flaws in a commonly-used feature selection algorithm and develop a statistics-based framework for text feature selection. Greater understanding of Naive Bayes and the properties of text allows us to make better use of it in text classification.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

We compare Naive Bayes and Support Vector Machines on the task of multiclass text classification. Using a variety of approaches to combine the underlying binary classifiers, we find that SVMs substantially outperform Naive Bayes. We present full multiclass results on two well-known text data sets, including the lowest error to date on both data sets. We develop a new indicator of binary performance to show that the SVM's lower multiclass error is a result of its improved binary performance. Furthermore, we demonstrate and explore the surprising result that one-vs-all classification performs favorably compared to other approaches even though it has no error-correcting properties.