73 resultados para insémination artificielle


Relevância:

10.00% 10.00%

Publicador:

Resumo:

Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Les documents publiés par des entreprises, tels les communiqués de presse, contiennent une foule d’informations sur diverses activités des entreprises. C’est une source précieuse pour des analyses en intelligence d’affaire. Cependant, il est nécessaire de développer des outils pour permettre d’exploiter cette source automatiquement, étant donné son grand volume. Ce mémoire décrit un travail qui s’inscrit dans un volet d’intelligence d’affaire, à savoir la détection de relations d’affaire entre les entreprises décrites dans des communiqués de presse. Dans ce mémoire, nous proposons une approche basée sur la classification. Les méthodes de classifications existantes ne nous permettent pas d’obtenir une performance satisfaisante. Ceci est notamment dû à deux problèmes : la représentation du texte par tous les mots, qui n’aide pas nécessairement à spécifier une relation d’affaire, et le déséquilibre entre les classes. Pour traiter le premier problème, nous proposons une approche de représentation basée sur des mots pivots c’est-à-dire les noms d’entreprises concernées, afin de mieux cerner des mots susceptibles de les décrire. Pour le deuxième problème, nous proposons une classification à deux étapes. Cette méthode s’avère plus appropriée que les méthodes traditionnelles de ré-échantillonnage. Nous avons testé nos approches sur une collection de communiqués de presse dans le domaine automobile. Nos expérimentations montrent que les approches proposées peuvent améliorer la performance de classification. Notamment, la représentation du document basée sur les mots pivots nous permet de mieux centrer sur les mots utiles pour la détection de relations d’affaire. La classification en deux étapes apporte une solution efficace au problème de déséquilibre entre les classes. Ce travail montre que la détection automatique des relations d’affaire est une tâche faisable. Le résultat de cette détection pourrait être utilisé dans une analyse d’intelligence d’affaire.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La nature a développé diverses stratégies afin d’assurer le commencement de la vie dans des conditions d’homoplasmie, c’est-à-dire des conditions telles que les cellules sont dotées du même ADN mitochondrial. Toutefois, des nouveaux haplotypes de l’acide désoxyribonucléique mitochondrial (ADNmt) peuvent apparaitre et croître de plusieurs façons tout au long de la durée d’une vie menant à l’hétéroplasmie. Par exemple, l’hétéroplasmie de l’ADNmt peut être créée artificiellement par des technologies reproductives assistées, ainsi que naturellement par le processus de vieillissement. De ce fait, la thèse de ce doctorat fut divisée en deux principaux objectifs. Le premier étant celui d’analyser les changements survenus dans l’hétéroplasmie de l’ADNmt produit par le transfert nucléaire des cellules somatiques (SCNT) lors du développement de l’embryon jusqu’au fœtus et aux tissus adultes de bovins clonés. En ce qui concerne le second objectif, il s’agit d’analyser les changements survenus dans l’hétéroplasmie de l’ADNmt causés par le vieillissement dans une cellule somatique adulte et dans des tissus germinaux durant l’ovogénèse, ainsi qu’au début de l’embryogenèse et dans la procédure de culture in vitro sur des souris. Dans la première série d’expériences sur des bovins, des fibroblastes fœtaux transportant une mutation d’ADNmt (insertion de 66 pb) furent fusionnés avec des ovocytes receveurs transportant l’ADNmt du type sauvage. La présence d’ADNmt venant de la cellule donneuse a été analysée à différents stades de développement, soit sur des embryons âgés de 17 jours (n=17), des fœtus âgés de 40 jours (n=3), des fœtus âgés de 60 jours (n=3), un fœtus âgé de 240 jours et 3 clones post-nataux âgés de 18 à 24 mois. Chaque individu s’est avéré être hétéroplasmique et 99 % (103/104) des échantillons de tissus analysés étaient également hétéroplasmiques. Cependant, l’ovaire venant du fœtus de 240 jours fut le seul à être homoplasmique pour l’ADNmt de l’ovocyte receveur. Dans la plupart des échantillons analysés (95,2 %, soit 99/104) la moyenne d’hétéroplasmie était de 1,46 %. Par contre, un fœtus âgé de 40 jours a présenté un niveau élevé d’hétéroplasmie (20,9 %), indiquant ainsi que des évènements rares d’augmentation de l’ADNmt des cellules donneuses peuvent survenir. Étant donné que la majorité des clones SCNT montrait de l’hétéroplasmie de l’ADNmt à des proportions comparables à celles des cellules donneuses au moment de la reconstruction de l’embryon, on a pu conclure que l’hétéroplasmie produite par des techniques de transfert nucléaire utilisant des cellules somatiques est due à une ségrégation neutre de l’ADNmt. Dans la seconde série d’expériences sur des souris, des femelles de différents âges, c.à.d. jeunes (0 – 8 mois), moyennes (8 – 16 mois) et vieilles (16 – 24 mois), ont été synchronisées (gonadotrophines) et sacrifiées dans le but d’obtenir des ovocytes au stade de vésicule germinal, et des ovocytes au stade métaphase-II produits in vivo et in vitro. De plus, des embryons in vivo et in vitro au stade de deux-cellules et des embryons au stade de blastocystes ont été obtenus de femelles jeunes. Différents tissus somatiques, venant de femelles des trois stades d’âge ont été obtenus : cerveau, foie, muscle et du cumulus ovocytaire. De plus, l’effet du vieillissement a été mesuré selon la fertilité de la femelle. En effet, les effets sur l’hétéroplasmie du vieillissement, du stade de développement et de la culture in vitro ont été mesurés dans des ovocytes et dans des embryons. Les effets du vieillissement sur les mitochondries ont été mesurés par rapport au nombre total de copies de l’ADNmt, au pourcentage des délétions communes et sur l’expression de trois gènes : Ndufs4, Mt-nd2 and Mt-nd4. Il a été possible d’observer que la fertilité des femelles dans la colonie de souris diminuait avec l’âge. En fait, le vieillissement affectait l’ADNmt dans les tissus somatiques, cependant il n’avait pas d’effet sur le cumulus, les ovocytes et les embryons. Le nombre de délétions de l’ADNmt augmentait pendant la reprise de la méiose et celui-ci diminuait au début du développement embryonnaire. La culture in vitro n’affectait pas la quantité d’ADNmt dans la plupart des tissus germinaux. Puisque nous n’avons pas trouvé d’effet de l’âge dans la majorité des paramètres mitochondriaux analysés dans les ovocytes et les embryons, il est suggéré que la délétion commune de l’ADNmt dans les tissus germinaux est davantage reliée au statut cellulaire de la production d’énergie qu’au processus de vieillissement. Deux sources différentes de mutations de l’ADNmt produites dans les ovocytes normaux ou reconstitués ont produit différents résultats d’hétéroplasmie au début de l’embryogénèse. Chez les bovins, l’hétéroplasmie artificielle impliquant une petite insertion (66 pb) dans la région non codante (D-loop) de l’ADNmt a été vraisemblablement non nocive pour l’embryon, tolérant la persistance de l’ADNmt étranger pendant les différents stades du développement des clones. Chez les souris, l’hétéroplasmie naturelle produite par une grande délétion (4974 pb délétion commune) dans la région codante de l’ADNmt a été vraisemblablement nocive pour l’embryon et par conséquent éliminée pour assurer l’homoplasmie au début du développement embryonnaire.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

L'apprentissage machine (AM) est un outil important dans le domaine de la recherche d'information musicale (Music Information Retrieval ou MIR). De nombreuses tâches de MIR peuvent être résolues en entraînant un classifieur sur un ensemble de caractéristiques. Pour les tâches de MIR se basant sur l'audio musical, il est possible d'extraire de l'audio les caractéristiques pertinentes à l'aide de méthodes traitement de signal. Toutefois, certains aspects musicaux sont difficiles à extraire à l'aide de simples heuristiques. Afin d'obtenir des caractéristiques plus riches, il est possible d'utiliser l'AM pour apprendre une représentation musicale à partir de l'audio. Ces caractéristiques apprises permettent souvent d'améliorer la performance sur une tâche de MIR donnée. Afin d'apprendre des représentations musicales intéressantes, il est important de considérer les aspects particuliers à l'audio musical dans la conception des modèles d'apprentissage. Vu la structure temporelle et spectrale de l'audio musical, les représentations profondes et multiéchelles sont particulièrement bien conçues pour représenter la musique. Cette thèse porte sur l'apprentissage de représentations de l'audio musical. Des modèles profonds et multiéchelles améliorant l'état de l'art pour des tâches telles que la reconnaissance d'instrument, la reconnaissance de genre et l'étiquetage automatique y sont présentés.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Après la Seconde Guerre Mondiale, on peut observer une inflexion de l’usage de la couleur dans le cinéma hollywoodien. Trop artificielle, la couleur a été reléguée à ses débuts à des genres « irréalistes » (comédie musicale, western). Mais après la guerre, la couleur est utilisée dans des films montrant le quotidien de l’Amérique, et devient une nouvelle façon d’appréhender certaines questions contemporaines. La couleur n’est plus un ornement ou un perfectionnement superflu, elle est porteuse de sens, au même titre que les autres éléments de la mise en scène. Les couleurs vives et l’exacerbation de l’artifice sont désormais utilisées par certains cinéastes dans un autre but que le seul plaisir de l’image colorée : parfois avec ironie, voire un pessimisme sous-jacent. L’enjeu esthétique de la couleur au cinéma doit en effet être situé dans le contexte historique de l’après guerre. La dévalorisation de la couleur dans l’histoire de l’art est ancienne, celle-ci ayant souvent été associée depuis l’Antiquité au maquillage féminin et à l’illusion. Le cinéma hollywoodien des années cinquante modifie justement l’image de la femme : on passe de la femme mythifiée à des femmes de chair et de sang, plus sexualisées, et aussi à l’évocation des rapports sociaux du quotidien. À travers l’actrice, et la façon dont celle-ci manipule la couleur ou bien existe à travers elle, la couleur se libère des préjugés, et trouve son indépendance, à travers une libération de l’expressivité, et un refus du seul mimétisme.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Malgré des progrès constants en termes de capacité de calcul, mémoire et quantité de données disponibles, les algorithmes d'apprentissage machine doivent se montrer efficaces dans l'utilisation de ces ressources. La minimisation des coûts est évidemment un facteur important, mais une autre motivation est la recherche de mécanismes d'apprentissage capables de reproduire le comportement d'êtres intelligents. Cette thèse aborde le problème de l'efficacité à travers plusieurs articles traitant d'algorithmes d'apprentissage variés : ce problème est vu non seulement du point de vue de l'efficacité computationnelle (temps de calcul et mémoire utilisés), mais aussi de celui de l'efficacité statistique (nombre d'exemples requis pour accomplir une tâche donnée). Une première contribution apportée par cette thèse est la mise en lumière d'inefficacités statistiques dans des algorithmes existants. Nous montrons ainsi que les arbres de décision généralisent mal pour certains types de tâches (chapitre 3), de même que les algorithmes classiques d'apprentissage semi-supervisé à base de graphe (chapitre 5), chacun étant affecté par une forme particulière de la malédiction de la dimensionalité. Pour une certaine classe de réseaux de neurones, appelés réseaux sommes-produits, nous montrons qu'il peut être exponentiellement moins efficace de représenter certaines fonctions par des réseaux à une seule couche cachée, comparé à des réseaux profonds (chapitre 4). Nos analyses permettent de mieux comprendre certains problèmes intrinsèques liés à ces algorithmes, et d'orienter la recherche dans des directions qui pourraient permettre de les résoudre. Nous identifions également des inefficacités computationnelles dans les algorithmes d'apprentissage semi-supervisé à base de graphe (chapitre 5), et dans l'apprentissage de mélanges de Gaussiennes en présence de valeurs manquantes (chapitre 6). Dans les deux cas, nous proposons de nouveaux algorithmes capables de traiter des ensembles de données significativement plus grands. Les deux derniers chapitres traitent de l'efficacité computationnelle sous un angle différent. Dans le chapitre 7, nous analysons de manière théorique un algorithme existant pour l'apprentissage efficace dans les machines de Boltzmann restreintes (la divergence contrastive), afin de mieux comprendre les raisons qui expliquent le succès de cet algorithme. Finalement, dans le chapitre 8 nous présentons une application de l'apprentissage machine dans le domaine des jeux vidéo, pour laquelle le problème de l'efficacité computationnelle est relié à des considérations d'ingénierie logicielle et matérielle, souvent ignorées en recherche mais ô combien importantes en pratique.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Dans un contexte où l’approvisionnement énergétique mondial du 21e siècle est un enjeu majeur, le développement de sources d’énergie renouvelables suscite l’attention croissante de la communauté scientifique et industrielle. L’énergie solaire est définitivement l’une des meilleures alternatives aux combustibles fossiles en tant que source d’énergie du monde de demain. Ce mémoire traite donc du développement de nouveaux matériaux organométalliques pour des applications de photorécoltage d’énergie en photovoltaïque et en production d’hydrogène. Le premier chapitre présente la synthèse assistée par microondes de quatre nouveaux complexes de Co(II), Ni(II), Cu(II) et Zn(II) basés sur le ligand tétra-p-méthoxyphényl-azadipyrrométhène (ADPM) avec des rendements variant de 89% à quantitatif. Ces complexes sont mis en relation avec d’autres complexes homoleptiques connus portant le tétraphényl-ADPM comme ligand ainsi qu’avec leurs chélates de BF2+ pour une meilleure compréhension des tendances engendrées par la substitution de l’agent coordonnant et/ou des substituants p-méthoxy. Pour ce faire, le comportement électrochimique et photophysique est présenté. De façon générale, la présence des quatre groupements p-méthoxy semble rendre les dérivés de cet ADPM plus susceptibles à la dégradation électrochimique en conditions d’oxydation et induire un déplacement bathochromique des propriétés optiques d’absorption et d’émission. Les structures rayons X du ligand tétra-p-méthoxyphényl-ADPM et de son complexe homoleptique de Co(II) sont aussi discutées. Cette étude a été effectuée dans l’espoir de fournir des informations utiles sur la stabilité des ADPM aux chercheurs du domaine photovoltaïque en quête de nouveaux chromophores dans le proche infrarouge (NIR). Le deuxième chapitre présente quant à lui les propriétés de senseur envers les anions F-, OAc- et H2PO4- de deux nouveaux complexes neutres de Re(I) de type mono- et dinucléaire basés sur une phénanthroline substituée en position 5 contenant un récepteur thio-urée. Ces composés ont été obtenus dans des rendements de 81% et 60%, respectivement. L’effet de la formation de ponts hydrogène lors de l’ajout d’anions versus la déprotonation du récepteur a été évalué par des titrations UV/Vis et RMN 1H et semble indiquer que la formation de la base conjuguée du récepteur est favorisée pour ce type de système. De plus, la structure rayons X d’un des précurseurs est présentée et permet une discussion sur la chiralité des complexes mono- et dinucléaire obtenus. L’obtention d’un complexe bimétallique par autoassemblage ouvre la voie à la préparation d’antennes moléculaires pour des systèmes de photosynthèse artificielle.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Les systèmes statistiques de traduction automatique ont pour tâche la traduction d’une langue source vers une langue cible. Dans la plupart des systèmes de traduction de référence, l'unité de base considérée dans l'analyse textuelle est la forme telle qu’observée dans un texte. Une telle conception permet d’obtenir une bonne performance quand il s'agit de traduire entre deux langues morphologiquement pauvres. Toutefois, ceci n'est plus vrai lorsqu’il s’agit de traduire vers une langue morphologiquement riche (ou complexe). Le but de notre travail est de développer un système statistique de traduction automatique comme solution pour relever les défis soulevés par la complexité morphologique. Dans ce mémoire, nous examinons, dans un premier temps, un certain nombre de méthodes considérées comme des extensions aux systèmes de traduction traditionnels et nous évaluons leurs performances. Cette évaluation est faite par rapport aux systèmes à l’état de l’art (système de référence) et ceci dans des tâches de traduction anglais-inuktitut et anglais-finnois. Nous développons ensuite un nouvel algorithme de segmentation qui prend en compte les informations provenant de la paire de langues objet de la traduction. Cet algorithme de segmentation est ensuite intégré dans le modèle de traduction à base d’unités lexicales « Phrase-Based Models » pour former notre système de traduction à base de séquences de segments. Enfin, nous combinons le système obtenu avec des algorithmes de post-traitement pour obtenir un système de traduction complet. Les résultats des expériences réalisées dans ce mémoire montrent que le système de traduction à base de séquences de segments proposé permet d’obtenir des améliorations significatives au niveau de la qualité de la traduction en terme de le métrique d’évaluation BLEU (Papineni et al., 2002) et qui sert à évaluer. Plus particulièrement, notre approche de segmentation réussie à améliorer légèrement la qualité de la traduction par rapport au système de référence et une amélioration significative de la qualité de la traduction est observée par rapport aux techniques de prétraitement de base (baseline).

Relevância:

10.00% 10.00%

Publicador:

Resumo:

L'ère numérique dans laquelle nous sommes entrés apporte une quantité importante de nouveaux défis à relever dans une multitude de domaines. Le traitement automatique de l'abondante information à notre disposition est l'un de ces défis, et nous allons ici nous pencher sur des méthodes et techniques adaptées au filtrage et à la recommandation à l'utilisateur d'articles adaptés à ses goûts, dans le contexte particulier et sans précédent notable du jeu vidéo multi-joueurs en ligne. Notre objectif est de prédire l'appréciation des niveaux par les joueurs. Au moyen d'algorithmes d'apprentissage machine modernes tels que les réseaux de neurones profonds avec pré-entrainement non-supervisé, que nous décrivons après une introduction aux concepts nécessaires à leur bonne compréhension, nous proposons deux architectures aux caractéristiques différentes bien que basées sur ce même concept d'apprentissage profond. La première est un réseau de neurones multi-couches pour lequel nous tentons d'expliquer les performances variables que nous rapportons sur les expériences menées pour diverses variations de profondeur, d'heuristique d'entraînement, et des méthodes de pré-entraînement non-supervisé simple, débruitant et contractant. Pour la seconde architecture, nous nous inspirons des modèles à énergie et proposons de même une explication des résultats obtenus, variables eux aussi. Enfin, nous décrivons une première tentative fructueuse d'amélioration de cette seconde architecture au moyen d'un fine-tuning supervisé succédant le pré-entrainement, puis une seconde tentative où ce fine-tuning est fait au moyen d'un critère d'entraînement semi-supervisé multi-tâches. Nos expériences montrent des performances prometteuses, notament avec l'architecture inspirée des modèles à énergie, justifiant du moins l'utilisation d'algorithmes d'apprentissage profonds pour résoudre le problème de la recommandation.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Réalisé en majeure partie sous la tutelle de feu le Professeur Paul Arminjon. Après sa disparition, le Docteur Aziz Madrane a pris la relève de la direction de mes travaux.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La motivation incite les apprenants à s’engager dans une activité et à persévérer dans son accomplissement afin d’atteindre un but. Dans les Systèmes Tutoriels Intelligents (STI), les études sur la motivation des apprenants possèdent trois manques importants : un manque de moyens objectifs et fiables pour évaluer cet état, un manque d’évaluation de rôles joués par les facteurs motivationnels conçus dans l’environnement d’apprentissage et un manque de stratégies d’interventions motivationnelles pour soutenir la motivation des apprenants. Dans cette thèse, nous nous intéressons à mieux comprendre l’état de la motivation des apprenant ainsi que les facteurs et stratégies motivationnels dans un environnement d’apprentissage captivant : les jeux sérieux. Dans une première étude, nous évaluons la motivation des apprenants par l’entremise d’un modèle théorique de la motivation (ARCS de Keller) et de données électro-physiologiques (la conductivité de la peau, le rythme cardiaque et l’activité cérébrale). Nous déterminons et évaluons aussi quelques situations ou stratégies favorisant la motivation dans l’environnement des jeux sérieux étudié. Dans une deuxième étude, nous développons un prototype de jeux sérieux intégrant – dans une première version – quelques éléments motivationnels issus de jeux vidéo et – dans une deuxième version – des stratégies motivationnelles d’un modèle théorique de la motivation. Nous espérons, avec une évaluation motivationnelle de notre prototype, soutenir les apprenants à atteindre des hauts niveaux de motivation, de persévérance et de performance.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La liste des domaines touchés par l’apprentissage machine s’allonge rapidement. Au fur et à mesure que la quantité de données disponibles augmente, le développement d’algorithmes d’apprentissage de plus en plus puissants est crucial. Ce mémoire est constitué de trois parties: d’abord un survol des concepts de bases de l’apprentissage automatique et les détails nécessaires pour l’entraînement de réseaux de neurones, modèles qui se livrent bien à des architectures profondes. Ensuite, le premier article présente une application de l’apprentissage machine aux jeux vidéos, puis une méthode de mesure performance pour ceux-ci en tant que politique de décision. Finalement, le deuxième article présente des résultats théoriques concernant l’entraînement d’architectures profondes nonsupervisées. Les jeux vidéos sont un domaine particulièrement fertile pour l’apprentissage automatique: il estf facile d’accumuler d’importantes quantités de données, et les applications ne manquent pas. La formation d’équipes selon un critère donné est une tˆache commune pour les jeux en lignes. Le premier article compare différents algorithmes d’apprentissage à des réseaux de neurones profonds appliqués à la prédiction de la balance d’un match. Ensuite nous présentons une méthode par simulation pour évaluer les modèles ainsi obtenus utilisés dans le cadre d’une politique de décision en ligne. Dans un deuxième temps nous présentons une nouvelleméthode pour entraîner des modèles génératifs. Des résultats théoriques nous indiquent qu’il est possible d’entraîner par rétropropagation des modèles non-supervisés pouvant générer des échantillons qui suivent la distribution des données. Ceci est un résultat pertinent dans le cadre de la récente littérature scientifique investiguant les propriétés des autoencodeurs comme modèles génératifs. Ces résultats sont supportés avec des expériences qualitatives préliminaires ainsi que quelques résultats quantitatifs.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Un système multi-agents est composé de plusieurs agents autonomes qui interagissent entre eux dans un environnement commun. Ce mémoire vise à démontrer l’utilisation d’un système multi-agents pour le développement d’un jeu vidéo. Tout d’abord, une justification du choix des concepts d’intelligence artificielle choisie est exposée. Par la suite, une approche pratique est utilisée en effectuant le développement d’un jeu vidéo. Pour ce faire, le jeu fut développé à partir d’un jeu vidéo mono-agent existant et mo- difié en système multi-agents afin de bien mettre en valeur les avantages d’un système multi-agents dans un jeu vidéo. Le développement de ce jeu a aussi démontré l’applica- tion d’autres concepts en intelligence artificielle comme la recherche de chemins et les arbres de décisions. Le jeu développé pour ce mémoire viens appuyer les conclusions des différentes recherches démontrant que l’utilisation d’un système multi-agents per- met de réaliser un comportement plus réaliste pour les joueurs non humains et bien plus compétitifs pour le joueur humain.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Cette thèse présente le résultat de plusieurs années de recherche dans le domaine de la génération automatique de résumés. Trois contributions majeures, présentées sous la forme d'articles publiés ou soumis pour publication, en forment le coeur. Elles retracent un cheminement qui part des méthodes par extraction en résumé jusqu'aux méthodes par abstraction. L'expérience HexTac, sujet du premier article, a d'abord été menée pour évaluer le niveau de performance des êtres humains dans la rédaction de résumés par extraction de phrases. Les résultats montrent un écart important entre la performance humaine sous la contrainte d'extraire des phrases du texte source par rapport à la rédaction de résumés sans contrainte. Cette limite à la rédaction de résumés par extraction de phrases, observée empiriquement, démontre l'intérêt de développer d'autres approches automatiques pour le résumé. Nous avons ensuite développé un premier système selon l'approche Fully Abstractive Summarization, qui se situe dans la catégorie des approches semi-extractives, comme la compression de phrases et la fusion de phrases. Le développement et l'évaluation du système, décrits dans le second article, ont permis de constater le grand défi de générer un résumé facile à lire sans faire de l'extraction de phrases. Dans cette approche, le niveau de compréhension du contenu du texte source demeure insuffisant pour guider le processus de sélection du contenu pour le résumé, comme dans les approches par extraction de phrases. Enfin, l'approche par abstraction basée sur des connaissances nommée K-BABS est proposée dans un troisième article. Un repérage des éléments d'information pertinents est effectué, menant directement à la génération de phrases pour le résumé. Cette approche a été implémentée dans le système ABSUM, qui produit des résumés très courts mais riches en contenu. Ils ont été évalués selon les standards d'aujourd'hui et cette évaluation montre que des résumés hybrides formés à la fois de la sortie d'ABSUM et de phrases extraites ont un contenu informatif significativement plus élevé qu'un système provenant de l'état de l'art en extraction de phrases.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La traduction statistique requiert des corpus parallèles en grande quantité. L’obtention de tels corpus passe par l’alignement automatique au niveau des phrases. L’alignement des corpus parallèles a reçu beaucoup d’attention dans les années quatre vingt et cette étape est considérée comme résolue par la communauté. Nous montrons dans notre mémoire que ce n’est pas le cas et proposons un nouvel aligneur que nous comparons à des algorithmes à l’état de l’art. Notre aligneur est simple, rapide et permet d’aligner une très grande quantité de données. Il produit des résultats souvent meilleurs que ceux produits par les aligneurs les plus élaborés. Nous analysons la robustesse de notre aligneur en fonction du genre des textes à aligner et du bruit qu’ils contiennent. Pour cela, nos expériences se décomposent en deux grandes parties. Dans la première partie, nous travaillons sur le corpus BAF où nous mesurons la qualité d’alignement produit en fonction du bruit qui atteint les 60%. Dans la deuxième partie, nous travaillons sur le corpus EuroParl où nous revisitons la procédure d’alignement avec laquelle le corpus Europarl a été préparé et montrons que de meilleures performances au niveau des systèmes de traduction statistique peuvent être obtenues en utilisant notre aligneur.