3 resultados para Saut de curseur
em Université Laval Mémoires et thèses électroniques
Resumo:
L’un des problèmes importants en apprentissage automatique est de déterminer la complexité du modèle à apprendre. Une trop grande complexité mène au surapprentissage, ce qui correspond à trouver des structures qui n’existent pas réellement dans les données, tandis qu’une trop faible complexité mène au sous-apprentissage, c’est-à-dire que l’expressivité du modèle est insuffisante pour capturer l’ensemble des structures présentes dans les données. Pour certains modèles probabilistes, la complexité du modèle se traduit par l’introduction d’une ou plusieurs variables cachées dont le rôle est d’expliquer le processus génératif des données. Il existe diverses approches permettant d’identifier le nombre approprié de variables cachées d’un modèle. Cette thèse s’intéresse aux méthodes Bayésiennes nonparamétriques permettant de déterminer le nombre de variables cachées à utiliser ainsi que leur dimensionnalité. La popularisation des statistiques Bayésiennes nonparamétriques au sein de la communauté de l’apprentissage automatique est assez récente. Leur principal attrait vient du fait qu’elles offrent des modèles hautement flexibles et dont la complexité s’ajuste proportionnellement à la quantité de données disponibles. Au cours des dernières années, la recherche sur les méthodes d’apprentissage Bayésiennes nonparamétriques a porté sur trois aspects principaux : la construction de nouveaux modèles, le développement d’algorithmes d’inférence et les applications. Cette thèse présente nos contributions à ces trois sujets de recherches dans le contexte d’apprentissage de modèles à variables cachées. Dans un premier temps, nous introduisons le Pitman-Yor process mixture of Gaussians, un modèle permettant l’apprentissage de mélanges infinis de Gaussiennes. Nous présentons aussi un algorithme d’inférence permettant de découvrir les composantes cachées du modèle que nous évaluons sur deux applications concrètes de robotique. Nos résultats démontrent que l’approche proposée surpasse en performance et en flexibilité les approches classiques d’apprentissage. Dans un deuxième temps, nous proposons l’extended cascading Indian buffet process, un modèle servant de distribution de probabilité a priori sur l’espace des graphes dirigés acycliques. Dans le contexte de réseaux Bayésien, ce prior permet d’identifier à la fois la présence de variables cachées et la structure du réseau parmi celles-ci. Un algorithme d’inférence Monte Carlo par chaîne de Markov est utilisé pour l’évaluation sur des problèmes d’identification de structures et d’estimation de densités. Dans un dernier temps, nous proposons le Indian chefs process, un modèle plus général que l’extended cascading Indian buffet process servant à l’apprentissage de graphes et d’ordres. L’avantage du nouveau modèle est qu’il admet les connections entres les variables observables et qu’il prend en compte l’ordre des variables. Nous présentons un algorithme d’inférence Monte Carlo par chaîne de Markov avec saut réversible permettant l’apprentissage conjoint de graphes et d’ordres. L’évaluation est faite sur des problèmes d’estimations de densité et de test d’indépendance. Ce modèle est le premier modèle Bayésien nonparamétrique permettant d’apprendre des réseaux Bayésiens disposant d’une structure complètement arbitraire.
Resumo:
Les sources laser à large bande possédant les caractéristiques requises pour émettre sur la plage spectrale correspondant à la seconde fenêtre de transmission atmosphérique (3 à 5 μm) exercent un attrait considérable pour divers domaines tels que la télédétection de polluants atmosphériques et les contremesures infrarouges. Les supercontinua générés à l’intérieur de fibres optiques représentent une option intéressante pour réaliser ce type de sources laser. En effet, ils possèdent une intensité élevée, un large contenu spectral, une excellente directionnalité de faisceau, ainsi qu’un bon potentiel pour constituer des sources lumineuses compactes et robustes. Toutefois, la génération d’un tel supercontinuum implique certains défis à relever sur le plan de la conception des fibres optiques employées. En fait, ces fibres optiques doivent présenter de faibles pertes de propagation sur la plage spectrale de 3 à 5 μm, posséder un paramètre de non-linéarité élevé et permettre le pompage en régime anomal de dispersion à des longueurs d’onde pour lesquelles des sources laser compactes sont offertes commercialement. En matière de robustesse, ces fibres doivent également démontrer de bonnes propriétés mécaniques ainsi qu’une stabilité chimique appropriée vis-à-vis de la corrosion causée par l’humidité. Dans le cadre de cette thèse, un nouveau type de fibres composites à saut d’indice fortement contrasté a été développé pour atteindre ces objectifs de génération de supercontinuum. Ce type de fibres combine respectivement un verre de tellurite et un verre de germanate pour son coeur et sa gaine permettant ainsi d’atteindre une différence d’indice de réfraction d’environ 0.3 entre ces deux dernières structures. Grâce à cet important saut d’indice, ces fibres peuvent fortement confiner les modes optiques à l’intérieur de leur coeur, ce qui leur donne la possibilité d’atteindre un niveau élevé de non-linéarité et d’optimiser leurs caractéristiques de dispersion chromatique pour la génération du supercontinuum. D’autre part, leur section transversale toute solide leur confère aussi une meilleure stabilité environnementale comparativement à celle démontrée par les fibres optiques microstructurées à base de verres d’oxydes de métaux lourds, de verres de chalcogénure et de verres fluorés. Toutefois, leur fabrication nécessite l’appariement de verres dont les propriétés thermomécaniques concordent suffisamment ensemble pour permettre leur fibrage. Les travaux effectués ici démontrent la production de fibres optiques composites et leur potentiel pour la génération du supercontinuum dans l’infrarouge moyen.
Resumo:
La modélisation de la cryolite, utilisée dans la fabrication de l’aluminium, implique plusieurs défis, notament la présence de discontinuités dans la solution et l’inclusion de la difference de densité entre les phases solide et liquide. Pour surmonter ces défis, plusieurs éléments novateurs ont été développés dans cette thèse. En premier lieu, le problème du changement de phase, communément appelé problème de Stefan, a été résolu en deux dimensions en utilisant la méthode des éléments finis étendue. Une formulation utilisant un multiplicateur de Lagrange stable spécialement développée et une interpolation enrichie a été utilisée pour imposer la température de fusion à l’interface. La vitesse de l’interface est déterminée par le saut dans le flux de chaleur à travers l’interface et a été calculée en utilisant la solution du multiplicateur de Lagrange. En second lieu, les effets convectifs ont été inclus par la résolution des équations de Stokes dans la phase liquide en utilisant la méthode des éléments finis étendue aussi. Troisièmement, le changement de densité entre les phases solide et liquide, généralement négligé dans la littérature, a été pris en compte par l’ajout d’une condition aux limites de vitesse non nulle à l’interface solide-liquide pour respecter la conservation de la masse dans le système. Des problèmes analytiques et numériques ont été résolus pour valider les divers composants du modèle et le système d’équations couplés. Les solutions aux problèmes numériques ont été comparées aux solutions obtenues avec l’algorithme de déplacement de maillage de Comsol. Ces comparaisons démontrent que le modèle par éléments finis étendue reproduit correctement le problème de changement phase avec densités variables.