1000 resultados para Génération automatique de texte
Resumo:
En apprentissage automatique, domaine qui consiste à utiliser des données pour apprendre une solution aux problèmes que nous voulons confier à la machine, le modèle des Réseaux de Neurones Artificiels (ANN) est un outil précieux. Il a été inventé voilà maintenant près de soixante ans, et pourtant, il est encore de nos jours le sujet d'une recherche active. Récemment, avec l'apprentissage profond, il a en effet permis d'améliorer l'état de l'art dans de nombreux champs d'applications comme la vision par ordinateur, le traitement de la parole et le traitement des langues naturelles. La quantité toujours grandissante de données disponibles et les améliorations du matériel informatique ont permis de faciliter l'apprentissage de modèles à haute capacité comme les ANNs profonds. Cependant, des difficultés inhérentes à l'entraînement de tels modèles, comme les minima locaux, ont encore un impact important. L'apprentissage profond vise donc à trouver des solutions, en régularisant ou en facilitant l'optimisation. Le pré-entraînnement non-supervisé, ou la technique du ``Dropout'', en sont des exemples. Les deux premiers travaux présentés dans cette thèse suivent cette ligne de recherche. Le premier étudie les problèmes de gradients diminuants/explosants dans les architectures profondes. Il montre que des choix simples, comme la fonction d'activation ou l'initialisation des poids du réseaux, ont une grande influence. Nous proposons l'initialisation normalisée pour faciliter l'apprentissage. Le second se focalise sur le choix de la fonction d'activation et présente le rectifieur, ou unité rectificatrice linéaire. Cette étude a été la première à mettre l'accent sur les fonctions d'activations linéaires par morceaux pour les réseaux de neurones profonds en apprentissage supervisé. Aujourd'hui, ce type de fonction d'activation est une composante essentielle des réseaux de neurones profonds. Les deux derniers travaux présentés se concentrent sur les applications des ANNs en traitement des langues naturelles. Le premier aborde le sujet de l'adaptation de domaine pour l'analyse de sentiment, en utilisant des Auto-Encodeurs Débruitants. Celui-ci est encore l'état de l'art de nos jours. Le second traite de l'apprentissage de données multi-relationnelles avec un modèle à base d'énergie, pouvant être utilisé pour la tâche de désambiguation de sens.
Resumo:
En la actualidad, el uso de las tecnologías ha sido primordial para el avance de las sociedades, estas han permitido que personas sin conocimientos informáticos o usuarios llamados “no expertos” se interesen en su uso, razón por la cual los investigadores científicos se han visto en la necesidad de producir estudios que permitan la adaptación de sistemas, a la problemática existente dentro del ámbito informático. Una necesidad recurrente de todo usuario de un sistema es la gestión de la información, la cual se puede administrar por medio de una base de datos y lenguaje específico, como lo es el SQL (Structured Query Language), pero esto obliga al usuario sin conocimientos a acudir a un especialista para su diseño y construcción, lo cual se ve reflejado en costos y métodos complejos, entonces se plantea una pregunta ¿qué hacer cuando los proyectos son pequeñas y los recursos y procesos son limitados? Teniendo como base la investigación realizada por la universidad de Washington[39], donde sintetizan sentencias SQL a partir de ejemplos de entrada y salida, se pretende con esta memoria automatizar el proceso y aplicar una técnica diferente de aprendizaje, para lo cual utiliza una aproximación evolucionista, donde la aplicación de un algoritmo genético adaptado origina sentencias SQL válidas que responden a las condiciones establecidas por los ejemplos de entrada y salida dados por el usuario. Se obtuvo como resultado de la aproximación, una herramienta denominada EvoSQL que fue validada en este estudio. Sobre los 28 ejercicios empleados por la investigación [39], 23 de los cuales se obtuvieron resultados perfectos y 5 ejercicios sin éxito, esto representa un 82.1% de efectividad. Esta efectividad es superior en un 10.7% al establecido por la herramienta desarrollada en [39] SQLSynthesizer y 75% más alto que la herramienta siguiente más próxima Query by Output QBO[31]. El promedio obtenido en la ejecución de cada ejercicio fue de 3 minutos y 11 segundos, este tiempo es superior al establecido por SQLSynthesizer; sin embargo, en la medida un algoritmo genético supone la existencia de fases que amplían los rangos de tiempos, por lo cual el tiempo obtenido es aceptable con relación a las aplicaciones de este tipo. En conclusión y según lo anteriormente expuesto, se obtuvo una herramienta automática con una aproximación evolucionista, con buenos resultados y un proceso simple para el usuario “no experto”.
Resumo:
Ce mémoire vise à comprendre l’expérience de vie des jeunes Québécoises de 2e génération portant le voile islamique, qui ont vécu le débat sur la charte de la laïcité au Québec en 2012. Un des articles de ce projet de loi visait à interdire le port des signes religieux «ostentatoires» par les employés de la fonction publique. Une vague de protestation a animé les membres des minorités religieuses visées et une apparition, quoique marginale, des Québécois de 2e génération a commencé à émerger. À travers le concept de lutte pour la reconnaissance tel que théorisé par Honneth et celui de stigmate amené par Goffman et élaboré par Göle, j’ai tenté de comprendre l’expérience de lutte pour la reconnaissance entamée par des Québécoises porteuses d’un signe religieux stigmatisé. Le concept d’hybridité m’a permis également de comprendre la richesse identitaire de ces jeunes qui se manifeste notamment dans l’articulation de leurs revendications. J’ai ainsi mené 13 entrevues semi dirigées sur le mode du récit de vie avec des jeunes femmes âgées entre 19 et 27 ans, nées au Québec et portant le voile islamique.
Resumo:
Les positions des évènements de recombinaison s’agrègent ensemble, formant des hotspots déterminés en partie par la protéine à évolution rapide PRDM9. En particulier, ces positions de hotspots sont déterminées par le domaine de doigts de zinc (ZnF) de PRDM9 qui reconnait certains motifs d’ADN. Les allèles de PRDM9 contenant le ZnF de type k ont été préalablement associés avec une cohorte de patients affectés par la leucémie aigüe lymphoblastique. Les allèles de PRDM9 sont difficiles à identifier à partir de données de séquençage de nouvelle génération (NGS), en raison de leur nature répétitive. Dans ce projet, nous proposons une méthode permettant la caractérisation d’allèles de PRDM9 à partir de données de NGS, qui identifie le nombre d’allèles contenant un type spécifique de ZnF. Cette méthode est basée sur la corrélation entre les profils représentant le nombre de séquences nucléotidiques uniques à chaque ZnF retrouvés chez les lectures de NGS simulées sans erreur d’une paire d’allèles et chez les lectures d’un échantillon. La validité des prédictions obtenues par notre méthode est confirmée grâce à analyse basée sur les simulations. Nous confirmons également que la méthode peut correctement identifier le génotype d’allèles de PRDM9 qui n’ont pas encore été identifiés. Nous conduisons une analyse préliminaire identifiant le génotype des allèles de PRDM9 contenant un certain type de ZnF dans une cohorte de patients atteints de glioblastomes multiforme pédiatrique, un cancer du cerveau caractérisé par les mutations récurrentes dans le gène codant pour l’histone H3, la cible de l’activité épigénétique de PRDM9. Cette méthode ouvre la possibilité d’identifier des associations entre certains allèles de PRDM9 et d’autres types de cancers pédiatriques, via l’utilisation de bases de données de NGS de cellules tumorales.
Resumo:
L’objectif général de ma recherche doctorale est d’analyser le contexte sociojuridique de la régulation du port de signes religieux dans les établissements publics en France et au Québec. À partir d’une comparaison entre la Loi française n°2004-228 du 15 mars 2004 encadrant, en application du principe de laïcité, le port de signes ou de tenues manifestant une appartenance religieuse dans les écoles, collèges et lycées publics et l’arrêt canadien Multani c. Commission scolaire Marguerite-Bourgeoys (2006), l’analyse s’intéresse d’abord au « sous-texte » de ces décisions (les fondements philosophico-politiques que sont la laïcité et le multiculturalisme) et à la « mise en oeuvre contextuelle » de celles-ci (la place des représentations sociales et le rôle social attribué au droit dans la production et la réception de ces décisions). Ces deux niveaux d’analyse sociojuridique, le sous-texte et la mise en oeuvre contextuelle du droit, permettent d’expliquer ces réponses opposées à une problématique similaire.
Resumo:
Dans ce mémoire de recherche-création, j’aborde la question du stéréotype en insistant sur le potentiel créatif des figures doxiques et en démontrant leur rapport avec la littérarité et le pouvoir (en terme foucaldien) au moyen d’une création et d’un essai : L’expérience du torse est un court roman (dont la fin est ici absente) qui relate les premiers jours liés à l’affaire Magnotta en jouant avec les conventions du romanesque traditionnel ; l’essai L’expérience du texte démontre pour sa part comment la reprise du stéréotype rassure et crée un univers stable dans le roman Je m’en vais de Jean Échenoz, alors que sa déformation déjoue les attentes du lecteur en dénonçant le préfabriqué et en proposant un dépassement poétique. Autant ma création que mon essai s’appliquent à démontrer que le langage est pouvoir et qu’il agit sur le pouvoir.
Resumo:
clRNG et clProbdist sont deux interfaces de programmation (APIs) que nous avons développées pour la génération de nombres aléatoires uniformes et non uniformes sur des dispositifs de calculs parallèles en utilisant l’environnement OpenCL. La première interface permet de créer au niveau d’un ordinateur central (hôte) des objets de type stream considérés comme des générateurs virtuels parallèles qui peuvent être utilisés aussi bien sur l’hôte que sur les dispositifs parallèles (unités de traitement graphique, CPU multinoyaux, etc.) pour la génération de séquences de nombres aléatoires. La seconde interface permet aussi de générer au niveau de ces unités des variables aléatoires selon différentes lois de probabilité continues et discrètes. Dans ce mémoire, nous allons rappeler des notions de base sur les générateurs de nombres aléatoires, décrire les systèmes hétérogènes ainsi que les techniques de génération parallèle de nombres aléatoires. Nous présenterons aussi les différents modèles composant l’architecture de l’environnement OpenCL et détaillerons les structures des APIs développées. Nous distinguons pour clRNG les fonctions qui permettent la création des streams, les fonctions qui génèrent les variables aléatoires uniformes ainsi que celles qui manipulent les états des streams. clProbDist contient les fonctions de génération de variables aléatoires non uniformes selon la technique d’inversion ainsi que les fonctions qui permettent de retourner différentes statistiques des lois de distribution implémentées. Nous évaluerons ces interfaces de programmation avec deux simulations qui implémentent un exemple simplifié d’un modèle d’inventaire et un exemple d’une option financière. Enfin, nous fournirons les résultats d’expérimentation sur les performances des générateurs implémentés.
Resumo:
Toutes les photographies présentes à l'intérieur de ce mémoire ont été prises par l'auteur de ce dernier.
Resumo:
Le déficit de mémoire de travail est une des caractéristiques centrales de la schizophrénie et est associé aux problèmes de fonctionnement quotidien des patients. Parmi les différents processus sous-tendus par la mémoire de travail, nous nous intéressons au binding. Le binding est un processus qui permet d’associer plusieurs informations (par exemple, associer le nom d’une personne avec son adresse). En mémoire de travail, les patients schizophrènes ne présentent pas de déficit de binding lorsque les informations sont associées involontairement. Ce type de binding est appelé binding automatique. Cependant, les informations peuvent aussi être associées sous le contrôle volontaire et attentionnel des participants, nous parlons alors de binding contrôlé. À l’heure actuelle, aucune étude n’a été effectuée sur le binding contrôlé en schizophrénie. Notre objectif est de déterminer s'il existe un déficit spécifique de binding contrôlé dans la schizophrénie, et de décrire les substrats neuronaux qui le sous-tendent. Dix-neuf patients schizophrènes et 18 sujets témoins ont effectué une tâche de binding en mémoire de travail dans un scanner IRM. Celle-ci consistait à mémoriser des mots et des positions spatiales dont l’association variait selon deux conditions. Dans la condition de binding contrôlé, les mots et les positions spatiales étaient présentés séparément et les participants devaient faire l’association entre les deux informations eux-mêmes. Dans la condition de binding automatique, les mots étaient d’emblée associés aux positions spatiales. Nos résultats suggèrent que les patients schizophrènes n’auraient pas de déficit de binding automatique alors qu’ils auraient un déficit de binding contrôlé par rapport aux sujets témoins. Le déficit de binding contrôlé serait sous-tendu par des niveaux d’activation plus faibles du cortex préfrontal dorsolatéral. Les processus contrôlés seraient altérés alors que les processus automatiques seraient préservés dans la schizophrénie.
Resumo:
La présente recherche porte sur la traduction de la bande dessinée. Ce sujet, auparavant négligé par les traductologes, commence à susciter l’intérêt des chercheurs à partir les années 80. Toutefois, la plupart des travaux se sont concentrés sur l’aspect linguistique des BD. Ce mémoire, par contre, aborde la bande dessinée comme un texte multimodal. Il s’inscrit ainsi à la croisée des domaines de la traduction et de la multimodalité telle que proposée dans les travaux de Gunther Kress et Theo Van Leeuwen (2001). L’objectif de cette recherche est d’implanter un outil d’analyse pour la bande dessinée qui permettrait de rendre compte des différents modes intervenant dans le texte. Cet outil, conçu pour la présente recherche, a été développé à partir des travaux de Hatim et Mason (1990, 1997) sur les trois dimensions de la situation de communication : transaction communicative, action pragmatique et interaction sémiotique. L’analyse menée ici porte sur la traduction vers le français de la bande dessinée argentine Mujeres alteradas de Maitena Burundarena, parue sous le titre de Les déjantées.
Resumo:
Écrire, décrire, inscrire : trois moments de réflexion qui me permettront, en guise d’introduction aux études de sept cas de figure, de circonscrire les contours du dossier « Polygraphies du corps dans le roman de femme contemporain ». À travers ces trois verbes à l’infinitif signalant le processus d’une pensée plutôt qu’un état de fait, il s’agira de répondre à un certain nombre de lieux communs en ce qui a trait à diverses formes d’imbrication du corps et de l’écriture des femmes, tout en insistant sur l’idée du corps — physique et textuel — comme espace perméable par lequel le sujet entre en résonance avec l’en-dehors. [Introduction]