40 resultados para planning (artificial intelligence)
em Université de Montréal, Canada
Resumo:
La scoliose idiopathique de ladolescent (SIA) est une dformation tri-dimensionelle du rachis. Son traitement comprend lobservation, lutilisation de corsets pour limiter sa progression ou la chirurgie pour corriger la dformation squelettique et cesser sa progression. Le traitement chirurgical reste controvers au niveau des indications, mais aussi de la chirurgie entreprendre. Malgr la prsence de classifications pour guider le traitement de la SIA, une variabilit dans la stratgie opratoire intra et inter-observateur a t dcrite dans la littrature. Cette variabilit saccentue dautant plus avec lvolution des techniques chirurgicales et de linstrumentation disponible. Lavancement de la technologie et son intgration dans le milieu mdical a men lutilisation dalgorithmes dintelligence artificielle informatiques pour aider la classification et lvaluation tridimensionnelle de la scoliose. Certains algorithmes ont dmontr tre efficace pour diminuer la variabilit dans la classification de la scoliose et pour guider le traitement. Lobjectif gnral de cette thse est de dvelopper une application utilisant des outils dintelligence artificielle pour intgrer les donnes dun nouveau patient et les vidences disponibles dans la littrature pour guider le traitement chirurgical de la SIA. Pour cela une revue de la littrature sur les applications existantes dans lvaluation de la SIA fut entreprise pour rassembler les lments qui permettraient la mise en place dune application efficace et accepte dans le milieu clinique. Cette revue de la littrature nous a permis de raliser que lexistence de black box dans les applications dveloppes est une limitation pour lintgration clinique ou la justification base sur les vidence est essentielle. Dans une premire tude nous avons dvelopp un arbre dcisionnel de classification de la scoliose idiopathique bas sur la classification de Lenke qui est la plus communment utilise de nos jours mais a t critique pour sa complexit et la variabilit inter et intra-observateur. Cet arbre dcisionnel a dmontr quil permet daugmenter la prcision de classification proportionnellement au temps pass classifier et ce indpendamment du niveau de connaissance sur la SIA. Dans une deuxime tude, un algorithme de stratgies chirurgicales bas sur des rgles extraites de la littrature a t dvelopp pour guider les chirurgiens dans la slection de lapproche et les niveaux de fusion pour la SIA. Lorsque cet algorithme est appliqu une large base de donne de 1556 cas de SIA, il est capable de proposer une stratgie opratoire similaire celle dun chirurgien expert dans prt de 70% des cas. Cette tude a confirm la possibilit dextraire des stratgies opratoires valides laide dun arbre dcisionnel utilisant des rgles extraites de la littrature. Dans une troisime tude, la classification de 1776 patients avec la SIA laide dune carte de Kohonen, un type de rseaux de neurone a permis de dmontrer quil existe des scoliose typiques (scoliose courbes uniques ou double thoracique) pour lesquelles la variabilit dans le traitement chirurgical varie peu des recommandations par la classification de Lenke tandis que les scolioses a courbes multiples ou tangentielles deux groupes de courbes typiques taient celles avec le plus de variation dans la stratgie opratoire. Finalement, une plateforme logicielle a t dveloppe intgrant chacune des tudes ci-dessus. Cette interface logicielle permet lentre de donnes radiologiques pour un patient scoliotique, classifie la SIA laide de larbre dcisionnel de classification et suggre une approche chirurgicale base sur larbre dcisionnel de stratgies opratoires. Une analyse de la correction post-opratoire obtenue dmontre une tendance, bien que non-statistiquement significative, une meilleure balance chez les patients oprs suivant la stratgie recommande par la plateforme logicielle que ceux aillant un traitement diffrent. Les tudes exposes dans cette thse soulignent que lutilisation dalgorithmes dintelligence artificielle dans la classification et llaboration de stratgies opratoires de la SIA peuvent tre intgres dans une plateforme logicielle et pourraient assister les chirurgiens dans leur planification propratoire.
Resumo:
Les tudiants gradus et les professeurs (les chercheurs, en gnral), accdent, passent en revue et utilisent rgulirement un grand nombre darticles, cependant aucun des outils et solutions existants ne fournit la vaste gamme de fonctionnalits exiges pour grer correctement ces ressources. En effet, les systmes de gestion de bibliographie grent les rfrences et les citations, mais ne parviennent pas aider les chercheurs manipuler et localiser des ressources. D'autre part, les systmes de recommandation darticles de recherche et les moteurs de recherche spcialiss aident les chercheurs localiser de nouvelles ressources, mais l encore chouent dans laide les grer. Finalement, les systmes de gestion de contenu d'entreprise offrent les fonctionnalits de gestion de documents et des connaissances, mais ne sont pas conus pour les articles de recherche. Dans ce mmoire, nous prsentons une nouvelle classe de systmes de gestion : systme de gestion et de recommandation darticles de recherche. Papyres (Naak, Hage, & Ameur, 2008, 2009) est un prototype qui lillustre. Il combine des fonctionnalits de bibliographie avec des techniques de recommandation darticles et des outils de gestion de contenu, afin de fournir un ensemble de fonctionnalits pour localiser les articles de recherche, manipuler et maintenir les bibliographies. De plus, il permet de grer et partager les connaissances relatives la littrature. La technique de recommandation utilise dans Papyres est originale. Sa particularit rside dans l'aspect multicritre introduit dans le processus de filtrage collaboratif, permettant ainsi aux chercheurs d'indiquer leur intrt pour des parties spcifiques des articles. De plus, nous proposons de tester et de comparer plusieurs approches afin de dterminer le voisinage dans le processus de Filtrage Collaboratif Multicritre, de telle sorte accrotre la prcision de la recommandation. Enfin, nous ferons un rapport global sur la mise en uvre et la validation de Papyres.
Resumo:
Cette thse envisage un ensemble de mthodes permettant aux algorithmes d'apprentissage statistique de mieux traiter la nature squentielle des problmes de gestion de portefeuilles financiers. Nous dbutons par une considration du problme gnral de la composition d'algorithmes d'apprentissage devant grer des tches squentielles, en particulier celui de la mise--jour efficace des ensembles d'apprentissage dans un cadre de validation squentielle. Nous numrons les desiderata que des primitives de composition doivent satisfaire, et faisons ressortir la difficult de les atteindre de faon rigoureuse et efficace. Nous poursuivons en prsentant un ensemble d'algorithmes qui atteignent ces objectifs et prsentons une tude de cas d'un systme complexe de prise de dcision financire utilisant ces techniques. Nous dcrivons ensuite une mthode gnrale permettant de transformer un problme de dcision squentielle non-Markovien en un problme d'apprentissage supervis en employant un algorithme de recherche bas sur les K meilleurs chemins. Nous traitons d'une application en gestion de portefeuille o nous entranons un algorithme d'apprentissage optimiser directement un ratio de Sharpe (ou autre critre non-additif incorporant une aversion au risque). Nous illustrons l'approche par une tude exprimentale approfondie, proposant une architecture de rseaux de neurones spcialise la gestion de portefeuille et la comparant plusieurs alternatives. Finalement, nous introduisons une reprsentation fonctionnelle de sries chronologiques permettant des prvisions d'tre effectues sur un horizon variable, tout en utilisant un ensemble informationnel rvl de manire progressive. L'approche est base sur l'utilisation des processus Gaussiens, lesquels fournissent une matrice de covariance complte entre tous les points pour lesquels une prvision est demande. Cette information est utilise bon escient par un algorithme qui transige activement des carts de cours (price spreads) entre des contrats terme sur commodits. L'approche propose produit, hors chantillon, un rendement ajust pour le risque significatif, aprs frais de transactions, sur un portefeuille de 30 actifs.
Resumo:
Les tches de vision articielle telles que la reconnaissance dobjets demeurent irrsolues ce jour. Les algorithmes dapprentissage tels que les Rseaux de Neurones Articiels (RNA), reprsentent une approche prometteuse permettant dapprendre des caractristiques utiles pour ces tches. Ce processus doptimisation est nanmoins difcile. Les rseaux profonds base de Machine de Boltzmann Restreintes (RBM) ont rcemment t proposs an de guider lextraction de reprsentations intermdiaires, grce un algorithme dapprentissage non-supervis. Ce mmoire prsente, par lentremise de trois articles, des contributions ce domaine de recherche. Le premier article traite de la RBM convolutionelle. Lusage de champs rceptifs locaux ainsi que le regroupement dunits caches en couches partageant les mme paramtres, rduit considrablement le nombre de paramtres apprendre et engendre des dtecteurs de caractristiques locaux et quivariant aux translations. Ceci mne des modles ayant une meilleure vraisemblance, comparativement aux RBMs entranes sur des segments dimages. Le deuxime article est motiv par des dcouvertes rcentes en neurosciences. Il analyse limpact dunits quadratiques sur des tches de classication visuelles, ainsi que celui dune nouvelle fonction dactivation. Nous observons que les RNAs base dunits quadratiques utilisant la fonction softsign, donnent de meilleures performances de gnralisation. Le dernire article quand lui, offre une vision critique des algorithmes populaires dentranement de RBMs. Nous montrons que lalgorithme de Divergence Contrastive (CD) et la CD Persistente ne sont pas robustes : tous deux ncessitent une surface dnergie relativement plate an que leur chane ngative puisse mixer. La PCD "poids rapides" contourne ce problme en perturbant lgrement le modle, cependant, ceci gnre des chantillons bruits. Lusage de chanes tempres dans la phase ngative est une faon robuste dadresser ces problmes et mne de meilleurs modles gnratifs.
Resumo:
L'un des modles d'apprentissage non-supervis gnrant le plus de recherche active est la machine de Boltzmann --- en particulier la machine de Boltzmann restreinte, ou RBM. Un aspect important de l'entranement ainsi que l'exploitation d'un tel modle est la prise d'chantillons. Deux dveloppements rcents, la divergence contrastive persistante rapide (FPCD) et le herding, visent amliorer cet aspect, se concentrant principalement sur le processus d'apprentissage en tant que tel. Notamment, le herding renonce obtenir un estim prcis des paramtres de la RBM, dfinissant plutt une distribution par un systme dynamique guid par les exemples d'entranement. Nous gnralisons ces ides afin d'obtenir des algorithmes permettant d'exploiter la distribution de probabilits dfinie par une RBM pr-entrane, par tirage d'chantillons qui en sont reprsentatifs, et ce sans que l'ensemble d'entranement ne soit ncessaire. Nous prsentons trois mthodes: la pnalisation d'chantillon (base sur une intuition thorique) ainsi que la FPCD et le herding utilisant des statistiques constantes pour la phase positive. Ces mthodes dfinissent des systmes dynamiques produisant des chantillons ayant les statistiques voulues et nous les valuons l'aide d'une mthode d'estimation de densit non-paramtrique. Nous montrons que ces mthodes mixent substantiellement mieux que la mthode conventionnelle, l'chantillonnage de Gibbs.
Resumo:
On tudie lapplication des algorithmes de dcomposition matricielles tel que la Factorisation Matricielle Non-ngative (FMN), aux reprsentations frquentielles de signaux audio musicaux. Ces algorithmes, dirigs par une fonction derreur de reconstruction, apprennent un ensemble de fonctions de base et un ensemble de coef- ficients correspondants qui approximent le signal dentre. On compare lutilisation de trois fonctions derreur de reconstruction quand la FMN est applique des gammes monophoniques et harmonises: moindre carr, divergence Kullback-Leibler, et une mesure de divergence dpendente de la phase, introduite rcemment. Des nouvelles mthodes pour interprter les dcompositions rsultantes sont prsentes et sont compares aux mthodes utilises prcdemment qui ncessitent des connaissances du domaine acoustique. Finalement, on analyse la capacit de gnralisation des fonctions de bases apprises par rapport trois paramtres musicaux: lamplitude, la dure et le type dinstrument. Pour ce faire, on introduit deux algorithmes dtiquetage des fonctions de bases qui performent mieux que lapproche prcdente dans la majorit de nos tests, la tche dinstrument avec audio monophonique tant la seule exception importante.
Resumo:
Les avancs dans le domaine de lintelligence artificielle, permettent des systmes informatiques de rsoudre des tches de plus en plus complexes lies par exemple la vision, la comprhension de signaux sonores ou au traitement de la langue. Parmi les modles existants, on retrouve les Rseaux de Neurones Artificiels (RNA), dont la popularit a fait un grand bond en avant avec la dcouverte de Hinton et al. [22], soit lutilisation de Machines de Boltzmann Restreintes (RBM) pour un pr-entranement non-supervis couche aprs couche, facilitant grandement lentranement supervis du rseau plusieurs couches caches (DBN), entranement qui savrait jusqualors trs difficile russir. Depuis cette dcouverte, des chercheurs ont tudi lefficacit de nouvelles stratgies de pr-entranement, telles que lempilement dauto-encodeurs traditionnels(SAE) [5, 38], et lempilement dauto-encodeur dbruiteur (SDAE) [44]. Cest dans ce contexte qua dbut la prsente tude. Aprs un bref passage en revue des notions de base du domaine de lapprentissage machine et des mthodes de pr-entranement employes jusqu prsent avec les modules RBM, AE et DAE, nous avons approfondi notre comprhension du pr-entranement de type SDAE, explor ses diffrentes proprits et tudi des variantes de SDAE comme stratgie dinitialisation darchitecture profonde. Nous avons ainsi pu, entre autres choses, mettre en lumire linfluence du niveau de bruit, du nombre de couches et du nombre dunits caches sur lerreur de gnralisation du SDAE. Nous avons constat une amlioration de la performance sur la tche supervise avec lutilisation des bruits poivre et sel (PS) et gaussien (GS), bruits savrant mieux justifis que celui utilis jusqu prsent, soit le masque zro (MN). De plus, nous avons dmontr que la performance profitait dune emphase impose sur la reconstruction des donnes corrompues durant lentranement des diffrents DAE. Nos travaux ont aussi permis de rvler que le DAE tait en mesure dapprendre, sur des images naturelles, des filtres semblables ceux retrouvs dans les cellules V1 du cortex visuel, soit des filtres dtecteurs de bordures. Nous aurons par ailleurs pu montrer que les reprsentations apprises du SDAE, composes des caractristiques ainsi extraites, savraient fort utiles lapprentissage dune machine vecteurs de support (SVM) linaire ou noyau gaussien, amliorant grandement sa performance de gnralisation. Aussi, nous aurons observ que similairement au DBN, et contrairement au SAE, le SDAE possdait une bonne capacit en tant que modle gnrateur. Nous avons galement ouvert la porte de nouvelles stratgies de pr-entranement et dcouvert le potentiel de lune dentre elles, soit lempilement dauto-encodeurs rebruiteurs (SRAE).
Resumo:
Tout au long de la vie, le cerveau dveloppe des reprsentations de son environnement permettant lindividu den tirer meilleur profit. Comment ces reprsentations se dveloppent-elles pendant la qute de rcompenses demeure un mystre. Il est raisonnable de penser que le cortex est le sige de ces reprsentations et que les ganglions de la base jouent un rle important dans la maximisation des rcompenses. En particulier, les neurones dopaminergiques semblent coder un signal derreur de prdiction de rcompense. Cette thse tudie le problme en construisant, laide de lapprentissage machine, un modle informatique intgrant de nombreuses vidences neurologiques. Aprs une introduction au cadre mathmatique et quelques algorithmes de lapprentissage machine, un survol de lapprentissage en psychologie et en neuroscience et une revue des modles de lapprentissage dans les ganglions de la base, la thse comporte trois articles. Le premier montre quil est possible dapprendre maximiser ses rcompenses tout en dveloppant de meilleures reprsentations des entres. Le second article porte sur l'important problme toujours non rsolu de la reprsentation du temps. Il dmontre quune reprsentation du temps peut tre acquise automatiquement dans un rseau de neurones artificiels faisant office de mmoire de travail. La reprsentation dveloppe par le modle ressemble beaucoup lactivit de neurones corticaux dans des tches similaires. De plus, le modle montre que lutilisation du signal derreur de rcompense peut acclrer la construction de ces reprsentations temporelles. Finalement, il montre quune telle reprsentation acquise automatiquement dans le cortex peut fournir linformation ncessaire aux ganglions de la base pour expliquer le signal dopaminergique. Enfin, le troisime article value le pouvoir explicatif et prdictif du modle sur diffrentes situations comme la prsence ou labsence dun stimulus (conditionnement classique ou de trace) pendant lattente de la rcompense. En plus de faire des prdictions trs intressantes en lien avec la littrature sur les intervalles de temps, larticle rvle certaines lacunes du modle qui devront tre amliores. Bref, cette thse tend les modles actuels de lapprentissage des ganglions de la base et du systme dopaminergique au dveloppement concurrent de reprsentations temporelles dans le cortex et aux interactions de ces deux structures.
Resumo:
L'application de classifieurs linaires l'analyse des donnes d'imagerie crbrale (fMRI) a men plusieurs perces intressantes au cours des dernires annes. Ces classifieurs combinent linairement les rponses des voxels pour dtecter et catgoriser diffrents tats du cerveau. Ils sont plus agnostics que les mthodes d'analyses conventionnelles qui traitent systmatiquement les patterns faibles et distribus comme du bruit. Dans le prsent projet, nous utilisons ces classifieurs pour valider une hypothse portant sur l'encodage des sons dans le cerveau humain. Plus prcisment, nous cherchons localiser des neurones, dans le cortex auditif primaire, qui dtecteraient les modulations spectrales et temporelles prsentes dans les sons. Nous utilisons les enregistrements fMRI de sujets soumis 49 modulations spectro-temporelles diffrentes. L'analyse fMRI au moyen de classifieurs linaires n'est pas standard, jusqu' maintenant, dans ce domaine. De plus, long terme, nous avons aussi pour objectif le dveloppement de nouveaux algorithmes d'apprentissage automatique spcialiss pour les donnes fMRI. Pour ces raisons, une bonne partie des expriences vise surtout tudier le comportement des classifieurs. Nous nous intressons principalement 3 classifieurs linaires standards, soient l'algorithme machine vecteurs de support (linaire), l'algorithme rgression logistique (rgularise) et le modle baysien gaussien naf (variances partages).
Resumo:
Cette recherche part du constat de lutilisation des nouvelles technologies qui se gnralise dans lenseignement universitaire (tant sur campus quen enseignement distance), et traite cette question sous trois aspects institutionnel, pdagogique et technologique. La recherche a t mene travers quinze universits canadiennes o nous avons interrog vingt-quatre universitaires, nommment des responsables de centres de pdagogie universitaire et des experts sur la question de lintgration des technologies lenseignement universitaire. Pour le volet institutionnel, nous avons eu recours un cadre thorique qui met en relief le changement de structure et de fonctionnement des universits lre dInternet, suivant le modle thorique de lOpen System Communications Net de Kershaw et Safford (1998, 2001). Les rsultats, laune de ce modle, confirment que les universits conventionnelles sont dans une phase de transformation due lutilisation des technologies de l'information et de la communication (TIC). De plus, les cours hybrides, la bimodalit, des universits entirement distance visant une clientle estudiantine au-del des frontires rgionales et nationales, des universits associant plusieurs modles, des universits fonctionnant base dintelligence artificielle, sont les modles principaux qui ont la forte possibilit de simposer dans le paysage universitaire nord-amricain au cours des prochaines dcennies. Enfin, la lumire du modle thorique, nous avons explor le rle de luniversit, ainsi en transformation, au sein de la socit tout comme les rapports ventuels entre les institutions universitaires. Sagissant de laspect pdagogique, nous avons utilis une perspective thorique fonde sur le modle du Community of Inquiry (CoI) de Garrison, Anderson et Archer (2000), revu par Vaughan et Garrison (2005) et Garrison et Arbaugh (2007) qui prne notamment une nouvelle culture de travail luniversit fonde sur trois niveaux de prsence. Les rsultats indiquent limportance dlments relatifs la prsence denseignement, la prsence cognitive et la prsence sociale, comme le suggre le modle. Cependant, la rcurrence -dans les trois niveaux de prsence- de certains indicateurs, suggrs par les rpondants, tels que lchange dinformation, la discussion et la collaboration, nous ont amens conclure la non-tanchit du modle du CoI. De plus, certaines catgories, de par leur frquence dapparition dans les propos des interviews, mriteraient davoir une considration plus grande dans les exigences pdagogiques que requiert le nouveau contexte prvalant dans les universits conventionnelles. Cest le cas par exemple de la catgorie cohsion de groupe . Enfin, dans le troisime volet de la recherche relatif la dimension technologique, nous nous sommes inspirs du modle thorique dOlapiriyakul et Scher (2006) qui postule que linfrastructure dans lenseignement doit tre la fois une technologie pdagogique et une technologie dapprentissage pour les tudiants (instructional technology and student learning technology). Partant de cette approche, le volet technologique de notre recherche a consist identifier les fonctionnalits exiges de la technologie pour induire une volution institutionnelle et pdagogique. Les rsultats cet gard ont indiqu que les raisons pour lesquelles les universits choisissent dintgrer les TIC lenseignement ne sont pas toujours dordre pdagogique, ce qui explique que la technologie elle-mme ne revte pas forcment les qualits a priori requises pour une volution pdagogique et institutionnelle. De ce constat, les technologies appropries pour une relle volution pdagogique et institutionnelle des universits ont t identifies.
Resumo:
Ce mmoire traite d'abord du problme de la modlisation de l'interprtation des pianistes l'aide de l'apprentissage machine. Il s'occupe ensuite de prsenter de nouveaux modles temporels qui utilisent des auto-encodeurs pour amliorer l'apprentissage de squences. Dans un premier temps, nous prsentons le travail pralablement fait dans le domaine de la modlisation de l'expressivit musicale, notamment les modles statistiques du professeur Widmer. Nous parlons ensuite de notre ensemble de donnes, unique au monde, qu'il a t ncessaire de crer pour accomplir notre tche. Cet ensemble est compos de 13 pianistes diffrents enregistrs sur le fameux piano Bsendorfer 290SE. Enfin, nous expliquons en dtail les rsultats de l'apprentissage de rseaux de neurones et de rseaux de neurones rcurrents. Ceux-ci sont appliqus sur les donnes mentionnes pour apprendre les variations expressives propres un style de musique. Dans un deuxime temps, ce mmoire aborde la dcouverte de modles statistiques exprimentaux qui impliquent l'utilisation d'auto-encodeurs sur des rseaux de neurones rcurrents. Pour pouvoir tester la limite de leur capacit d'apprentissage, nous utilisons deux ensembles de donnes artificielles dveloppes l'Universit de Toronto.
Resumo:
La traduction statistique vise lautomatisation de la traduction par le biais de modles statistiques. Dans ce travail, nous relevons un des grands dfis du domaine : la recherche (Brown et al., 1993). Les systmes de traduction statistique de rfrence, tel Moses (Koehn et al., 2007), effectuent gnralement la recherche en explorant lespace des prfixes par programmation dynamique, une solution coteuse sur le plan computationnel pour ce problme potentiellement NP-complet (Knight, 1999). Nous postulons quune approche par recherche locale (Langlais et al., 2007) peut mener des solutions tout aussi intressantes en un temps et un espace mmoire beaucoup moins importants (Russell et Norvig, 2010). De plus, ce type de recherche facilite lincorporation de modles globaux qui ncessitent des traductions compltes et permet deffectuer des modifications sur ces dernires de manire non-continue, deux tches ardues lors de lexploration de lespace des prfixes. Nos expriences nous rvlent que la recherche locale en traduction statistique est une approche viable, sinscrivant dans ltat de lart.
Resumo:
Rcemment, nous avons pu observer un intrt grandissant pour l'application de l'analogie formelle l'analyse morphologique. L'intrt premier de ce concept repose sur ses parallles avec le processus mental impliqu dans la cration de nouveaux termes base sur les relations morphologiques prexistantes de la langue. Toutefois, l'utilisation de ce concept reste tout de mme marginale due notamment son cot de calcul lev.Dans ce document, nous prsenterons le systme base de graphe Moranapho fond sur l'analogie formelle. Nous dmontrerons par notre participation au Morpho Challenge 2009 (Kurimo:10) et nos expriences subsquentes, que la qualit des analyses obtenues par ce systme rivalise avec l'tat de l'art. Nous analyserons aussi l'influence de certaines de ses composantes sur la qualit des analyses morphologiques produites. Nous appuierons les conclusions tires de nos analyses sur des thories bien tablies dans le domaine de la linguistique. Ceci nous permet donc de fournir certaines prdictions sur les succs et les checs de notre systme, lorsqu'appliqu d'autres langues que celles testes au cours de nos expriences.
Resumo:
Cette thse porte sur une classe d'algorithmes d'apprentissage appels architectures profondes. Il existe des rsultats qui indiquent que les reprsentations peu profondes et locales ne sont pas suffisantes pour la modlisation des fonctions comportant plusieurs facteurs de variation. Nous sommes particulirement intresss par ce genre de donnes car nous esprons qu'un agent intelligent sera en mesure d'apprendre les modliser automatiquement; l'hypothse est que les architectures profondes sont mieux adaptes pour les modliser. Les travaux de Hinton (2006) furent une vritable perce, car l'ide d'utiliser un algorithme d'apprentissage non-supervis, les machines de Boltzmann restreintes, pour l'initialisation des poids d'un rseau de neurones supervis a t cruciale pour entraner l'architecture profonde la plus populaire, soit les rseaux de neurones artificiels avec des poids totalement connects. Cette ide a t reprise et reproduite avec succs dans plusieurs contextes et avec une varit de modles. Dans le cadre de cette thse, nous considrons les architectures profondes comme des biais inductifs. Ces biais sont reprsents non seulement par les modles eux-mmes, mais aussi par les mthodes d'entranement qui sont souvent utiliss en conjonction avec ceux-ci. Nous dsirons dfinir les raisons pour lesquelles cette classe de fonctions gnralise bien, les situations auxquelles ces fonctions pourront tre appliques, ainsi que les descriptions qualitatives de telles fonctions. L'objectif de cette thse est d'obtenir une meilleure comprhension du succs des architectures profondes. Dans le premier article, nous testons la concordance entre nos intuitions---que les rseaux profonds sont ncessaires pour mieux apprendre avec des donnes comportant plusieurs facteurs de variation---et les rsultats empiriques. Le second article est une tude approfondie de la question: pourquoi l'apprentissage non-supervis aide mieux gnraliser dans un rseau profond? Nous explorons et valuons plusieurs hypothses tentant d'lucider le fonctionnement de ces modles. Finalement, le troisime article cherche dfinir de faon qualitative les fonctions modlises par un rseau profond. Ces visualisations facilitent l'interprtation des reprsentations et invariances modlises par une architecture profonde.
Resumo:
Dans ce travail, nous explorons la faisabilit de doter les machines de la capacit de prdire, dans un contexte d'interaction homme-machine (IHM), l'motion d'un utilisateur, ainsi que son intensit, de manire instantane pour une grande varit de situations. Plus spcifiquement, une application a t dveloppe, appele machine motionnelle, capable de comprendre la signification d'une situation en se basant sur le modle thorique d'valuation de l'motion Ortony, Clore et Collins (OCC). Cette machine est apte, galement, prdire les ractions motionnelles des utilisateurs, en combinant des versions amliores des k plus proches voisins et des rseaux de neurones. Une procdure empirique a t ralise pour l'acquisition des donnes. Ces dernires ont fourni une connaissance consistante aux algorithmes d'apprentissage choisis et ont permis de tester la performance de la machine. Les rsultats obtenus montrent que la machine motionnelle propose est capable de produire de bonnes prdictions. Une telle ralisation pourrait encourager son utilisation future dans des domaines exploitant la reconnaissance automatique de l'motion.