Biblioteca Digital

33 resultados para Classification, Markov chain Monte Carlo, k-nearest neighbours

em Université de Montréal, Canada

Improving sampling, optimization and feature extraction in Boltzmann machines

Relevância:

100.00% 100.00%

Publicador:

Resumo:

L��apprentissage supervis�� de r��seaux hi��rarchiques �� grande ��chelle conna��t pr��sentement un succ��s fulgurant. Malgr�� cette effervescence, l��apprentissage non-supervis�� repr��sente toujours, selon plusieurs chercheurs, un ��l��ment cl�� de l��Intelligence Artificielle, o�� les agents doivent apprendre �� partir d��un nombre potentiellement limit�� de donn��es. Cette th��se s��inscrit dans cette pens��e et aborde divers sujets de recherche li��s au probl��me d��estimation de densit�� par l��entremise des machines de Boltzmann (BM), mod��les graphiques probabilistes au coeur de l��apprentissage profond. Nos contributions touchent les domaines de l��chantillonnage, l��estimation de fonctions de partition, l��optimisation ainsi que l��apprentissage de repr��sentations invariantes. Cette th��se d��bute par l��exposition d��un nouvel algorithme d'��chantillonnage adaptatif, qui ajuste (de fa ��con automatique) la temp��rature des cha��nes de Markov sous simulation, afin de maintenir une vitesse de convergence ��lev��e tout au long de l��apprentissage. Lorsqu��utilis�� dans le contexte de l��apprentissage par maximum de vraisemblance stochastique (SML), notre algorithme engendre une robustesse accrue face �� la s��lection du taux d��apprentissage, ainsi qu��une meilleure vitesse de convergence. Nos r��sultats sont pr��sent ��es dans le domaine des BMs, mais la m��thode est g��n��rale et applicable �� l��apprentissage de tout mod��le probabiliste exploitant l��chantillonnage par cha��nes de Markov. Tandis que le gradient du maximum de vraisemblance peut-��tre approxim�� par ��chantillonnage, l��valuation de la log-vraisemblance n��cessite un estim�� de la fonction de partition. Contrairement aux approches traditionnelles qui consid��rent un mod��le donn�� comme une bo��te noire, nous proposons plut��t d��exploiter la dynamique de l��apprentissage en estimant les changements successifs de log-partition encourus �� chaque mise �� jour des param��tres. Le probl��me d��estimation est reformul�� comme un probl��me d��inf��rence similaire au filtre de Kalman, mais sur un graphe bi-dimensionnel, o�� les dimensions correspondent aux axes du temps et au param��tre de temp��rature. Sur le th��me de l��optimisation, nous pr��sentons ��galement un algorithme permettant d��appliquer, de mani��re efficace, le gradient naturel �� des machines de Boltzmann comportant des milliers d��unit��s. Jusqu�� pr��sent, son adoption ��tait limit��e par son haut co��t computationel ainsi que sa demande en m��moire. Notre algorithme, Metric-Free Natural Gradient (MFNG), permet d��viter le calcul explicite de la matrice d��information de Fisher (et son inverse) en exploitant un solveur lin��aire combin�� un produit matrice-vecteur efficace. L��algorithme est prometteur: en terme du nombre d��valuations de fonctions, MFNG converge plus rapidement que SML. Son impl��mentation demeure malheureusement inefficace en temps de calcul. Ces travaux explorent ��galement les m��canismes sous-jacents �� l��apprentissage de repr��sentations invariantes. �� cette fin, nous utilisons la famille de machines de Boltzmann restreintes ��spike & slab�� (ssRBM), que nous modifions afin de pouvoir mod��liser des distributions binaires et parcimonieuses. Les variables latentes binaires de la ssRBM peuvent ��tre rendues invariantes �� un sous-espace vectoriel, en associant �� chacune d��elles, un vecteur de variables latentes continues (d��nomm��es ��slabs��). Ceci se traduit par une invariance accrue au niveau de la repr��sentation et un meilleur taux de classification lorsque peu de donn��es ��tiquet��es sont disponibles. Nous terminons cette th��se sur un sujet ambitieux: l��apprentissage de repr��sentations pouvant s��parer les facteurs de variations pr��sents dans le signal d��entr��e. Nous proposons une solution �� base de ssRBM bilin��aire (avec deux groupes de facteurs latents) et formulons le probl��me comme l��un de ��pooling�� dans des sous-espaces vectoriels compl��mentaires.

33 resultados para Classification, Markov chain Monte Carlo, k-nearest neighbours

em Université de Montréal, Canada

Filtro por publicador