849 resultados para Artificial intelligence


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Dans ce travail, nous explorons la faisabilit de doter les machines de la capacit de prdire, dans un contexte d'interaction homme-machine (IHM), l'motion d'un utilisateur, ainsi que son intensit, de manire instantane pour une grande varit de situations. Plus spcifiquement, une application a t dveloppe, appele machine motionnelle, capable de comprendre la signification d'une situation en se basant sur le modle thorique d'valuation de l'motion Ortony, Clore et Collins (OCC). Cette machine est apte, galement, prdire les ractions motionnelles des utilisateurs, en combinant des versions amliores des k plus proches voisins et des rseaux de neurones. Une procdure empirique a t ralise pour l'acquisition des donnes. Ces dernires ont fourni une connaissance consistante aux algorithmes d'apprentissage choisis et ont permis de tester la performance de la machine. Les rsultats obtenus montrent que la machine motionnelle propose est capable de produire de bonnes prdictions. Une telle ralisation pourrait encourager son utilisation future dans des domaines exploitant la reconnaissance automatique de l'motion.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les fichiers sons qui accompagne mon document sont au format midi. Le programme que nous avons dvelopps pour ce travail est en language Python.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Lannotation en rles smantiques est une tche qui permet dattribuer des tiquettes de rles telles que Agent, Patient, Instrument, Lieu, Destination etc. aux diffrents participants actants ou circonstants (arguments ou adjoints) dune lexie prdicative. Cette tche ncessite des ressources lexicales riches ou des corpus importants contenant des phrases annotes manuellement par des linguistes sur lesquels peuvent sappuyer certaines approches dautomatisation (statistiques ou apprentissage machine). Les travaux antrieurs dans ce domaine ont port essentiellement sur la langue anglaise qui dispose de ressources riches, telles que PropBank, VerbNet et FrameNet, qui ont servi alimenter les systmes dannotation automatiss. Lannotation dans dautres langues, pour lesquelles on ne dispose pas dun corpus annot manuellement, repose souvent sur le FrameNet anglais. Une ressource telle que FrameNet de langlais est plus que ncessaire pour les systmes dannotation automatis et lannotation manuelle de milliers de phrases par des linguistes est une tche fastidieuse et exigeante en temps. Nous avons propos dans cette thse un systme automatique pour aider les linguistes dans cette tche qui pourraient alors se limiter la validation des annotations proposes par le systme. Dans notre travail, nous ne considrons que les verbes qui sont plus susceptibles que les noms dtre accompagns par des actants raliss dans les phrases. Ces verbes concernent les termes de spcialit dinformatique et dInternet (ex. accder, configurer, naviguer, tlcharger) dont la structure actancielle est enrichie manuellement par des rles smantiques. La structure actancielle des lexies verbales est dcrite selon les principes de la Lexicologie Explicative et Combinatoire, LEC de Meluk et fait appel partiellement (en ce qui concerne les rles smantiques) la notion de Frame Element tel que dcrit dans la thorie Frame Semantics (FS) de Fillmore. Ces deux thories ont ceci de commun quelles mnent toutes les deux la construction de dictionnaires diffrents de ceux issus des approches traditionnelles. Les lexies verbales dinformatique et dInternet qui ont t annotes manuellement dans plusieurs contextes constituent notre corpus spcialis. Notre systme qui attribue automatiquement des rles smantiques aux actants est bas sur des rgles ou classificateurs entrans sur plus de 2300 contextes. Nous sommes limits une liste de rles restreinte car certains rles dans notre corpus nont pas assez dexemples annots manuellement. Dans notre systme, nous navons trait que les rles Patient, Agent et Destination dont le nombre dexemple est suprieur 300. Nous avons cre une classe que nous avons nomm Autre o nous avons rassembl les autres rles dont le nombre dexemples annots est infrieur 100. Nous avons subdivis la tche dannotation en sous-tches : identifier les participants actants et circonstants et attribuer des rles smantiques uniquement aux actants qui contribuent au sens de la lexie verbale. Nous avons soumis les phrases de notre corpus lanalyseur syntaxique Syntex afin dextraire les informations syntaxiques qui dcrivent les diffrents participants dune lexie verbale dans une phrase. Ces informations ont servi de traits (features) dans notre modle dapprentissage. Nous avons propos deux techniques pour lidentification des participants : une technique base de rgles o nous avons extrait une trentaine de rgles et une autre technique base sur lapprentissage machine. Ces mmes techniques ont t utilises pour la tche de distinguer les actants des circonstants. Nous avons propos pour la tche dattribuer des rles smantiques aux actants, une mthode de partitionnement (clustering) semi supervis des instances que nous avons compare la mthode de classification de rles smantiques. Nous avons utilis CHAMLON, un algorithme hirarchique ascendant.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Dans le domaine des neurosciences computationnelles, l'hypothse a t mise que le systme visuel, depuis la rtine et jusqu'au cortex visuel primaire au moins, ajuste continuellement un modle probabiliste avec des variables latentes, son flux de perceptions. Ni le modle exact, ni la mthode exacte utilise pour l'ajustement ne sont connus, mais les algorithmes existants qui permettent l'ajustement de tels modles ont besoin de faire une estimation conditionnelle des variables latentes. Cela nous peut nous aider comprendre pourquoi le systme visuel pourrait ajuster un tel modle; si le modle est appropri, ces estim conditionnels peuvent aussi former une excellente reprsentation, qui permettent d'analyser le contenu smantique des images perues. Le travail prsent ici utilise la performance en classification d'images (discrimination entre des types d'objets communs) comme base pour comparer des modles du systme visuel, et des algorithmes pour ajuster ces modles (vus comme des densits de probabilit) des images. Cette thse (a) montre que des modles bass sur les cellules complexes de l'aire visuelle V1 gnralisent mieux partir d'exemples d'entranement tiquets que les rseaux de neurones conventionnels, dont les units caches sont plus semblables aux cellules simples de V1; (b) prsente une nouvelle interprtation des modles du systme visuels bass sur des cellules complexes, comme distributions de probabilits, ainsi que de nouveaux algorithmes pour les ajuster des donnes; et (c) montre que ces modles forment des reprsentations qui sont meilleures pour la classification d'images, aprs avoir t entrans comme des modles de probabilits. Deux innovations techniques additionnelles, qui ont rendu ce travail possible, sont galement dcrites : un algorithme de recherche alatoire pour slectionner des hyper-paramtres, et un compilateur pour des expressions mathmatiques matricielles, qui peut optimiser ces expressions pour processeur central (CPU) et graphique (GPU).

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Lapprentissage machine est un vaste domaine o lon cherche apprendre les paramtres de modles partir de donnes concrtes. Ce sera pour effectuer des tches demandant des aptitudes attribues lintelligence humaine, comme la capacit traiter des don- nes de haute dimensionnalit prsentant beaucoup de variations. Les rseaux de neu- rones artificiels sont un exemple de tels modles. Dans certains rseaux de neurones dits profonds, des concepts "abstraits" sont appris automatiquement. Les travaux prsents ici prennent leur inspiration de rseaux de neurones profonds, de rseaux rcurrents et de neuroscience du systme visuel. Nos tches de test sont la classification et le dbruitement dimages quasi binaires. On permettra une rtroac- tion o des reprsentations de haut niveau (plus "abstraites") influencent des reprsentations bas niveau. Cette influence seffectuera au cours de ce quon nomme relaxation, des itrations o les diffrents niveaux (ou couches) du modle sinterinfluencent. Nous prsentons deux familles darchitectures, lune, larchitecture compltement connecte, pouvant en principe traiter des donnes gnrales et une autre, larchitecture convolutionnelle, plus spcifiquement adapte aux images. Dans tous les cas, les donnes utilises sont des images, principalement des images de chiffres manuscrits. Dans un type dexprience, nous cherchons reconstruire des donnes qui ont t corrompues. On a pu y observer le phnomne dinfluence dcrit prcdemment en comparant le rsultat avec et sans la relaxation. On note aussi certains gains numriques et visuels en terme de performance de reconstruction en ajoutant linfluence des couches suprieures. Dans un autre type de tche, la classification, peu de gains ont t observs. On a tout de mme pu constater que dans certains cas la relaxation aiderait apprendre des reprsentations utiles pour classifier des images corrompues. Larchitecture convolutionnelle dveloppe, plus incertaine au dpart, permet malgr tout dobtenir des reconstructions numriquement et visuellement semblables celles obtenues avec lautre architecture, mme si sa connectivit est contrainte.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les documents publis par des entreprises, tels les communiqus de presse, contiennent une foule dinformations sur diverses activits des entreprises. Cest une source prcieuse pour des analyses en intelligence daffaire. Cependant, il est ncessaire de dvelopper des outils pour permettre dexploiter cette source automatiquement, tant donn son grand volume. Ce mmoire dcrit un travail qui sinscrit dans un volet dintelligence daffaire, savoir la dtection de relations daffaire entre les entreprises dcrites dans des communiqus de presse. Dans ce mmoire, nous proposons une approche base sur la classification. Les mthodes de classifications existantes ne nous permettent pas dobtenir une performance satisfaisante. Ceci est notamment d deux problmes: la reprsentation du texte par tous les mots, qui naide pas ncessairement spcifier une relation daffaire, et le dsquilibre entre les classes. Pour traiter le premier problme, nous proposons une approche de reprsentation base sur des mots pivots cest--dire les noms dentreprises concernes, afin de mieux cerner des mots susceptibles de les dcrire. Pour le deuxime problme, nous proposons une classification deux tapes. Cette mthode savre plus approprie que les mthodes traditionnelles de r-chantillonnage. Nous avons test nos approches sur une collection de communiqus de presse dans le domaine automobile. Nos exprimentations montrent que les approches proposes peuvent amliorer la performance de classification. Notamment, la reprsentation du document base sur les mots pivots nous permet de mieux centrer sur les mots utiles pour la dtection de relations daffaire. La classification en deux tapes apporte une solution efficace au problme de dsquilibre entre les classes. Ce travail montre que la dtection automatique des relations daffaire est une tche faisable. Le rsultat de cette dtection pourrait tre utilis dans une analyse dintelligence daffaire.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

L'apprentissage machine (AM) est un outil important dans le domaine de la recherche d'information musicale (Music Information Retrieval ou MIR). De nombreuses tches de MIR peuvent tre rsolues en entranant un classifieur sur un ensemble de caractristiques. Pour les tches de MIR se basant sur l'audio musical, il est possible d'extraire de l'audio les caractristiques pertinentes l'aide de mthodes traitement de signal. Toutefois, certains aspects musicaux sont difficiles extraire l'aide de simples heuristiques. Afin d'obtenir des caractristiques plus riches, il est possible d'utiliser l'AM pour apprendre une reprsentation musicale partir de l'audio. Ces caractristiques apprises permettent souvent d'amliorer la performance sur une tche de MIR donne. Afin d'apprendre des reprsentations musicales intressantes, il est important de considrer les aspects particuliers l'audio musical dans la conception des modles d'apprentissage. Vu la structure temporelle et spectrale de l'audio musical, les reprsentations profondes et multichelles sont particulirement bien conues pour reprsenter la musique. Cette thse porte sur l'apprentissage de reprsentations de l'audio musical. Des modles profonds et multichelles amliorant l'tat de l'art pour des tches telles que la reconnaissance d'instrument, la reconnaissance de genre et l'tiquetage automatique y sont prsents.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Malgr des progrs constants en termes de capacit de calcul, mmoire et quantit de donnes disponibles, les algorithmes d'apprentissage machine doivent se montrer efficaces dans l'utilisation de ces ressources. La minimisation des cots est videmment un facteur important, mais une autre motivation est la recherche de mcanismes d'apprentissage capables de reproduire le comportement d'tres intelligents. Cette thse aborde le problme de l'efficacit travers plusieurs articles traitant d'algorithmes d'apprentissage varis : ce problme est vu non seulement du point de vue de l'efficacit computationnelle (temps de calcul et mmoire utiliss), mais aussi de celui de l'efficacit statistique (nombre d'exemples requis pour accomplir une tche donne). Une premire contribution apporte par cette thse est la mise en lumire d'inefficacits statistiques dans des algorithmes existants. Nous montrons ainsi que les arbres de dcision gnralisent mal pour certains types de tches (chapitre 3), de mme que les algorithmes classiques d'apprentissage semi-supervis base de graphe (chapitre 5), chacun tant affect par une forme particulire de la maldiction de la dimensionalit. Pour une certaine classe de rseaux de neurones, appels rseaux sommes-produits, nous montrons qu'il peut tre exponentiellement moins efficace de reprsenter certaines fonctions par des rseaux une seule couche cache, compar des rseaux profonds (chapitre 4). Nos analyses permettent de mieux comprendre certains problmes intrinsques lis ces algorithmes, et d'orienter la recherche dans des directions qui pourraient permettre de les rsoudre. Nous identifions galement des inefficacits computationnelles dans les algorithmes d'apprentissage semi-supervis base de graphe (chapitre 5), et dans l'apprentissage de mlanges de Gaussiennes en prsence de valeurs manquantes (chapitre 6). Dans les deux cas, nous proposons de nouveaux algorithmes capables de traiter des ensembles de donnes significativement plus grands. Les deux derniers chapitres traitent de l'efficacit computationnelle sous un angle diffrent. Dans le chapitre 7, nous analysons de manire thorique un algorithme existant pour l'apprentissage efficace dans les machines de Boltzmann restreintes (la divergence contrastive), afin de mieux comprendre les raisons qui expliquent le succs de cet algorithme. Finalement, dans le chapitre 8 nous prsentons une application de l'apprentissage machine dans le domaine des jeux vido, pour laquelle le problme de l'efficacit computationnelle est reli des considrations d'ingnierie logicielle et matrielle, souvent ignores en recherche mais combien importantes en pratique.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les systmes statistiques de traduction automatique ont pour tche la traduction dune langue source vers une langue cible. Dans la plupart des systmes de traduction de rfrence, l'unit de base considre dans l'analyse textuelle est la forme telle quobserve dans un texte. Une telle conception permet dobtenir une bonne performance quand il s'agit de traduire entre deux langues morphologiquement pauvres. Toutefois, ceci n'est plus vrai lorsquil sagit de traduire vers une langue morphologiquement riche (ou complexe). Le but de notre travail est de dvelopper un systme statistique de traduction automatique comme solution pour relever les dfis soulevs par la complexit morphologique. Dans ce mmoire, nous examinons, dans un premier temps, un certain nombre de mthodes considres comme des extensions aux systmes de traduction traditionnels et nous valuons leurs performances. Cette valuation est faite par rapport aux systmes ltat de lart (systme de rfrence) et ceci dans des tches de traduction anglais-inuktitut et anglais-finnois. Nous dveloppons ensuite un nouvel algorithme de segmentation qui prend en compte les informations provenant de la paire de langues objet de la traduction. Cet algorithme de segmentation est ensuite intgr dans le modle de traduction base dunits lexicales Phrase-Based Models pour former notre systme de traduction base de squences de segments. Enfin, nous combinons le systme obtenu avec des algorithmes de post-traitement pour obtenir un systme de traduction complet. Les rsultats des expriences ralises dans ce mmoire montrent que le systme de traduction base de squences de segments propos permet dobtenir des amliorations significatives au niveau de la qualit de la traduction en terme de le mtrique dvaluation BLEU (Papineni et al., 2002) et qui sert valuer. Plus particulirement, notre approche de segmentation russie amliorer lgrement la qualit de la traduction par rapport au systme de rfrence et une amlioration significative de la qualit de la traduction est observe par rapport aux techniques de prtraitement de base (baseline).

Relevância:

60.00% 60.00%

Publicador:

Resumo:

L're numrique dans laquelle nous sommes entrs apporte une quantit importante de nouveaux dfis relever dans une multitude de domaines. Le traitement automatique de l'abondante information notre disposition est l'un de ces dfis, et nous allons ici nous pencher sur des mthodes et techniques adaptes au filtrage et la recommandation l'utilisateur d'articles adapts ses gots, dans le contexte particulier et sans prcdent notable du jeu vido multi-joueurs en ligne. Notre objectif est de prdire l'apprciation des niveaux par les joueurs. Au moyen d'algorithmes d'apprentissage machine modernes tels que les rseaux de neurones profonds avec pr-entrainement non-supervis, que nous dcrivons aprs une introduction aux concepts ncessaires leur bonne comprhension, nous proposons deux architectures aux caractristiques diffrentes bien que bases sur ce mme concept d'apprentissage profond. La premire est un rseau de neurones multi-couches pour lequel nous tentons d'expliquer les performances variables que nous rapportons sur les expriences menes pour diverses variations de profondeur, d'heuristique d'entranement, et des mthodes de pr-entranement non-supervis simple, dbruitant et contractant. Pour la seconde architecture, nous nous inspirons des modles nergie et proposons de mme une explication des rsultats obtenus, variables eux aussi. Enfin, nous dcrivons une premire tentative fructueuse d'amlioration de cette seconde architecture au moyen d'un fine-tuning supervis succdant le pr-entrainement, puis une seconde tentative o ce fine-tuning est fait au moyen d'un critre d'entranement semi-supervis multi-tches. Nos expriences montrent des performances prometteuses, notament avec l'architecture inspire des modles nergie, justifiant du moins l'utilisation d'algorithmes d'apprentissage profonds pour rsoudre le problme de la recommandation.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

La motivation incite les apprenants sengager dans une activit et persvrer dans son accomplissement afin datteindre un but. Dans les Systmes Tutoriels Intelligents (STI), les tudes sur la motivation des apprenants possdent trois manques importants : un manque de moyens objectifs et fiables pour valuer cet tat, un manque dvaluation de rles jous par les facteurs motivationnels conus dans lenvironnement dapprentissage et un manque de stratgies dinterventions motivationnelles pour soutenir la motivation des apprenants. Dans cette thse, nous nous intressons mieux comprendre ltat de la motivation des apprenant ainsi que les facteurs et stratgies motivationnels dans un environnement dapprentissage captivant : les jeux srieux. Dans une premire tude, nous valuons la motivation des apprenants par lentremise dun modle thorique de la motivation (ARCS de Keller) et de donnes lectro-physiologiques (la conductivit de la peau, le rythme cardiaque et lactivit crbrale). Nous dterminons et valuons aussi quelques situations ou stratgies favorisant la motivation dans lenvironnement des jeux srieux tudi. Dans une deuxime tude, nous dveloppons un prototype de jeux srieux intgrant dans une premire version quelques lments motivationnels issus de jeux vido et dans une deuxime version des stratgies motivationnelles dun modle thorique de la motivation. Nous esprons, avec une valuation motivationnelle de notre prototype, soutenir les apprenants atteindre des hauts niveaux de motivation, de persvrance et de performance.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

La liste des domaines touchs par lapprentissage machine sallonge rapidement. Au fur et mesure que la quantit de donnes disponibles augmente, le dveloppement dalgorithmes dapprentissage de plus en plus puissants est crucial. Ce mmoire est constitu de trois parties: dabord un survol des concepts de bases de lapprentissage automatique et les dtails ncessaires pour lentranement de rseaux de neurones, modles qui se livrent bien des architectures profondes. Ensuite, le premier article prsente une application de lapprentissage machine aux jeux vidos, puis une mthode de mesure performance pour ceux-ci en tant que politique de dcision. Finalement, le deuxime article prsente des rsultats thoriques concernant lentranement darchitectures profondes nonsupervises. Les jeux vidos sont un domaine particulirement fertile pour lapprentissage automatique: il estf facile daccumuler dimportantes quantits de donnes, et les applications ne manquent pas. La formation dquipes selon un critre donn est une tache commune pour les jeux en lignes. Le premier article compare diffrents algorithmes dapprentissage des rseaux de neurones profonds appliqus la prdiction de la balance dun match. Ensuite nous prsentons une mthode par simulation pour valuer les modles ainsi obtenus utiliss dans le cadre dune politique de dcision en ligne. Dans un deuxime temps nous prsentons une nouvellemthode pour entraner des modles gnratifs. Des rsultats thoriques nous indiquent quil est possible dentraner par rtropropagation des modles non-superviss pouvant gnrer des chantillons qui suivent la distribution des donnes. Ceci est un rsultat pertinent dans le cadre de la rcente littrature scientifique investiguant les proprits des autoencodeurs comme modles gnratifs. Ces rsultats sont supports avec des expriences qualitatives prliminaires ainsi que quelques rsultats quantitatifs.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Un systme multi-agents est compos de plusieurs agents autonomes qui interagissent entre eux dans un environnement commun. Ce mmoire vise dmontrer lutilisation dun systme multi-agents pour le dveloppement dun jeu vido. Tout dabord, une justification du choix des concepts dintelligence artificielle choisie est expose. Par la suite, une approche pratique est utilise en effectuant le dveloppement dun jeu vido. Pour ce faire, le jeu fut dvelopp partir dun jeu vido mono-agent existant et mo- difi en systme multi-agents afin de bien mettre en valeur les avantages dun systme multi-agents dans un jeu vido. Le dveloppement de ce jeu a aussi dmontr lapplica- tion dautres concepts en intelligence artificielle comme la recherche de chemins et les arbres de dcisions. Le jeu dvelopp pour ce mmoire viens appuyer les conclusions des diffrentes recherches dmontrant que lutilisation dun systme multi-agents per- met de raliser un comportement plus raliste pour les joueurs non humains et bien plus comptitifs pour le joueur humain.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Cette thse prsente le rsultat de plusieurs annes de recherche dans le domaine de la gnration automatique de rsums. Trois contributions majeures, prsentes sous la forme d'articles publis ou soumis pour publication, en forment le coeur. Elles retracent un cheminement qui part des mthodes par extraction en rsum jusqu'aux mthodes par abstraction. L'exprience HexTac, sujet du premier article, a d'abord t mene pour valuer le niveau de performance des tres humains dans la rdaction de rsums par extraction de phrases. Les rsultats montrent un cart important entre la performance humaine sous la contrainte d'extraire des phrases du texte source par rapport la rdaction de rsums sans contrainte. Cette limite la rdaction de rsums par extraction de phrases, observe empiriquement, dmontre l'intrt de dvelopper d'autres approches automatiques pour le rsum. Nous avons ensuite dvelopp un premier systme selon l'approche Fully Abstractive Summarization, qui se situe dans la catgorie des approches semi-extractives, comme la compression de phrases et la fusion de phrases. Le dveloppement et l'valuation du systme, dcrits dans le second article, ont permis de constater le grand dfi de gnrer un rsum facile lire sans faire de l'extraction de phrases. Dans cette approche, le niveau de comprhension du contenu du texte source demeure insuffisant pour guider le processus de slection du contenu pour le rsum, comme dans les approches par extraction de phrases. Enfin, l'approche par abstraction base sur des connaissances nomme K-BABS est propose dans un troisime article. Un reprage des lments d'information pertinents est effectu, menant directement la gnration de phrases pour le rsum. Cette approche a t implmente dans le systme ABSUM, qui produit des rsums trs courts mais riches en contenu. Ils ont t valus selon les standards d'aujourd'hui et cette valuation montre que des rsums hybrides forms la fois de la sortie d'ABSUM et de phrases extraites ont un contenu informatif significativement plus lev qu'un systme provenant de l'tat de l'art en extraction de phrases.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

La traduction statistique requiert des corpus parallles en grande quantit. Lobtention de tels corpus passe par lalignement automatique au niveau des phrases. Lalignement des corpus parallles a reu beaucoup dattention dans les annes quatre vingt et cette tape est considre comme rsolue par la communaut. Nous montrons dans notre mmoire que ce nest pas le cas et proposons un nouvel aligneur que nous comparons des algorithmes ltat de lart. Notre aligneur est simple, rapide et permet daligner une trs grande quantit de donnes. Il produit des rsultats souvent meilleurs que ceux produits par les aligneurs les plus labors. Nous analysons la robustesse de notre aligneur en fonction du genre des textes aligner et du bruit quils contiennent. Pour cela, nos expriences se dcomposent en deux grandes parties. Dans la premire partie, nous travaillons sur le corpus BAF o nous mesurons la qualit dalignement produit en fonction du bruit qui atteint les 60%. Dans la deuxime partie, nous travaillons sur le corpus EuroParl o nous revisitons la procdure dalignement avec laquelle le corpus Europarl a t prpar et montrons que de meilleures performances au niveau des systmes de traduction statistique peuvent tre obtenues en utilisant notre aligneur.