Biblioteca Digital

18 resultados para COMPUTER SCIENCE, THEORY

Advances in scaling deep learning algorithms

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Les algorithmes d'apprentissage profond forment un nouvel ensemble de m��thodes puissantes pour l'apprentissage automatique. L'id��e est de combiner des couches de facteurs latents en hierarchies. Cela requiert souvent un co��t computationel plus elev�� et augmente aussi le nombre de param��tres du mod��le. Ainsi, l'utilisation de ces m��thodes sur des probl��mes �� plus grande ��chelle demande de r��duire leur co��t et aussi d'am��liorer leur r��gularisation et leur optimization. Cette th��se adresse cette question sur ces trois perspectives. Nous ��tudions tout d'abord le probl��me de r��duire le co��t de certains algorithmes profonds. Nous proposons deux m��thodes pour entrainer des machines de Boltzmann restreintes et des auto-encodeurs d��bruitants sur des distributions sparses �� haute dimension. Ceci est important pour l'application de ces algorithmes pour le traitement de langues naturelles. Ces deux m��thodes (Dauphin et al., 2011; Dauphin and Bengio, 2013) utilisent l'��chantillonage par importance pour ��chantilloner l'objectif de ces mod��les. Nous observons que cela r��duit significativement le temps d'entrainement. L'acc��leration atteint 2 ordres de magnitude sur plusieurs bancs d'essai. Deuxi��mement, nous introduisont un puissant r��gularisateur pour les m��thodes profondes. Les r��sultats exp��rimentaux d��montrent qu'un bon r��gularisateur est crucial pour obtenir de bonnes performances avec des gros r��seaux (Hinton et al., 2012). Dans Rifai et al. (2011), nous proposons un nouveau r��gularisateur qui combine l'apprentissage non-supervis�� et la propagation de tangente (Simard et al., 1992). Cette m��thode exploite des principes g��ometriques et permit au moment de la publication d'atteindre des r��sultats �� l'��tat de l'art. Finalement, nous consid��rons le probl��me d'optimiser des surfaces non-convexes �� haute dimensionalit�� comme celle des r��seaux de neurones. Tradionellement, l'abondance de minimum locaux ��tait consid��r�� comme la principale difficult�� dans ces probl��mes. Dans Dauphin et al. (2014a) nous argumentons �� partir de r��sultats en statistique physique, de la th��orie des matrices al��atoires, de la th��orie des r��seaux de neurones et �� partir de r��sultats exp��rimentaux qu'une difficult�� plus profonde provient de la prolif��ration de points-selle. Dans ce papier nous proposons aussi une nouvelle m��thode pour l'optimisation non-convexe.

Veja mais

��chantillonnage des distributions continues non uniformes en pr��cision arbitraire et protocole pour l'��chantillonnage exact distribu�� des distributions discr��tes quantiques

Relevância:

90.00% 90.00%

Publicador:

Resumo:

La th��se est divis��e principalement en deux parties. La premi��re partie regroupe les chapitres 2 et 3. La deuxi��me partie regroupe les chapitres 4 et 5. La premi��re partie concerne l'��chantillonnage de distributions continues non uniformes garantissant un niveau fixe de pr��cision. Knuth et Yao d��montr��rent en 1976 comment ��chantillonner exactement n'importe quelle distribution discr��te en n'ayant recours qu'�� une source de bits non biais��s ind��pendants et identiquement distribu��s. La premi��re partie de cette th��se g��n��ralise en quelque sorte la th��orie de Knuth et Yao aux distributions continues non uniformes, une fois la pr��cision fix��e. Une borne inf��rieure ainsi que des bornes sup��rieures pour des algorithmes g��n��riques comme l'inversion et la discr��tisation figurent parmi les r��sultats de cette premi��re partie. De plus, une nouvelle preuve simple du r��sultat principal de l'article original de Knuth et Yao figure parmi les r��sultats de cette th��se. La deuxi��me partie concerne la r��solution d'un probl��me en th��orie de la complexit�� de la communication, un probl��me qui naquit avec l'av��nement de l'informatique quantique. ��tant donn�� une distribution discr��te param��tr��e par un vecteur r��el de dimension N et un r��seau de N ordinateurs ayant acc��s �� une source de bits non biais��s ind��pendants et identiquement distribu��s o�� chaque ordinateur poss��de un et un seul des N param��tres, un protocole distribu�� est ��tabli afin d'��chantillonner exactement ladite distribution.

Veja mais

Relating Dependent Terms in Information Retrieval

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Les moteurs de recherche font partie de notre vie quotidienne. Actuellement, plus d��un tiers de la population mondiale utilise l��Internet. Les moteurs de recherche leur permettent de trouver rapidement les informations ou les produits qu'ils veulent. La recherche d'information (IR) est le fondement de moteurs de recherche modernes. Les approches traditionnelles de recherche d'information supposent que les termes d'indexation sont ind��pendants. Pourtant, les termes qui apparaissent dans le m��me contexte sont souvent d��pendants. L��absence de la prise en compte de ces d��pendances est une des causes de l��introduction de bruit dans le r��sultat (r��sultat non pertinents). Certaines ��tudes ont propos�� d��int��grer certains types de d��pendance, tels que la proximit��, la cooccurrence, la contigu��t�� et de la d��pendance grammaticale. Dans la plupart des cas, les mod��les de d��pendance sont construits s��par��ment et ensuite combin��s avec le mod��le traditionnel de mots avec une importance constante. Par cons��quent, ils ne peuvent pas capturer correctement la d��pendance variable et la force de d��pendance. Par exemple, la d��pendance entre les mots adjacents "Black Friday" est plus importante que celle entre les mots "road constructions". Dans cette th��se, nous ��tudions diff��rentes approches pour capturer les relations des termes et de leurs forces de d��pendance. Nous avons propos�� des m��thodes suivantes: �� Nous r��examinons l'approche de combinaison en utilisant diff��rentes unit��s d'indexation pour la RI monolingue en chinois et la RI translinguistique entre anglais et chinois. En plus d��utiliser des mots, nous ��tudions la possibilit�� d'utiliser bi-gramme et uni-gramme comme unit�� de traduction pour le chinois. Plusieurs mod��les de traduction sont construits pour traduire des mots anglais en uni-grammes, bi-grammes et mots chinois avec un corpus parall��le. Une requ��te en anglais est ensuite traduite de plusieurs fa��ons, et un score classement est produit avec chaque traduction. Le score final de classement combine tous ces types de traduction. Nous consid��rons la d��pendance entre les termes en utilisant la th��orie d��vidence de Dempster-Shafer. Une occurrence d'un fragment de texte (de plusieurs mots) dans un document est consid��r��e comme repr��sentant l'ensemble de tous les termes constituants. La probabilit�� est assign��e �� un tel ensemble de termes plut��t qu��a chaque terme individuel. Au moment d��valuation de requ��te, cette probabilit�� est redistribu��e aux termes de la requ��te si ces derniers sont diff��rents. Cette approche nous permet d'int��grer les relations de d��pendance entre les termes. Nous proposons un mod��le discriminant pour int��grer les diff��rentes types de d��pendance selon leur force et leur utilit�� pour la RI. Notamment, nous consid��rons la d��pendance de contigu��t�� et de cooccurrence �� de diff��rentes distances, c��est-��-dire les bi-grammes et les paires de termes dans une fen��tre de 2, 4, 8 et 16 mots. Le poids d��un bi-gramme ou d��une paire de termes d��pendants est d��termin�� selon un ensemble des caract��res, en utilisant la r��gression SVM. Toutes les m��thodes propos��es sont ��valu��es sur plusieurs collections en anglais et/ou chinois, et les r��sultats exp��rimentaux montrent que ces m��thodes produisent des am��liorations substantielles sur l'��tat de l'art.

Veja mais

18 resultados para COMPUTER SCIENCE, THEORY

Filtro por publicador

Advances in scaling deep learning algorithms

��chantillonnage des distributions continues non uniformes en pr��cision arbitraire et protocole pour l'��chantillonnage exact distribu�� des distributions discr��tes quantiques

Relating Dependent Terms in Information Retrieval