6 resultados para self organising feature maps (SOFM or SOM)

em Université de Lausanne, Switzerland


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Résumé Cette thèse est consacrée à l'analyse, la modélisation et la visualisation de données environnementales à référence spatiale à l'aide d'algorithmes d'apprentissage automatique (Machine Learning). L'apprentissage automatique peut être considéré au sens large comme une sous-catégorie de l'intelligence artificielle qui concerne particulièrement le développement de techniques et d'algorithmes permettant à une machine d'apprendre à partir de données. Dans cette thèse, les algorithmes d'apprentissage automatique sont adaptés pour être appliqués à des données environnementales et à la prédiction spatiale. Pourquoi l'apprentissage automatique ? Parce que la majorité des algorithmes d'apprentissage automatiques sont universels, adaptatifs, non-linéaires, robustes et efficaces pour la modélisation. Ils peuvent résoudre des problèmes de classification, de régression et de modélisation de densité de probabilités dans des espaces à haute dimension, composés de variables informatives spatialisées (« géo-features ») en plus des coordonnées géographiques. De plus, ils sont idéaux pour être implémentés en tant qu'outils d'aide à la décision pour des questions environnementales allant de la reconnaissance de pattern à la modélisation et la prédiction en passant par la cartographie automatique. Leur efficacité est comparable au modèles géostatistiques dans l'espace des coordonnées géographiques, mais ils sont indispensables pour des données à hautes dimensions incluant des géo-features. Les algorithmes d'apprentissage automatique les plus importants et les plus populaires sont présentés théoriquement et implémentés sous forme de logiciels pour les sciences environnementales. Les principaux algorithmes décrits sont le Perceptron multicouches (MultiLayer Perceptron, MLP) - l'algorithme le plus connu dans l'intelligence artificielle, le réseau de neurones de régression généralisée (General Regression Neural Networks, GRNN), le réseau de neurones probabiliste (Probabilistic Neural Networks, PNN), les cartes auto-organisées (SelfOrganized Maps, SOM), les modèles à mixture Gaussiennes (Gaussian Mixture Models, GMM), les réseaux à fonctions de base radiales (Radial Basis Functions Networks, RBF) et les réseaux à mixture de densité (Mixture Density Networks, MDN). Cette gamme d'algorithmes permet de couvrir des tâches variées telle que la classification, la régression ou l'estimation de densité de probabilité. L'analyse exploratoire des données (Exploratory Data Analysis, EDA) est le premier pas de toute analyse de données. Dans cette thèse les concepts d'analyse exploratoire de données spatiales (Exploratory Spatial Data Analysis, ESDA) sont traités selon l'approche traditionnelle de la géostatistique avec la variographie expérimentale et selon les principes de l'apprentissage automatique. La variographie expérimentale, qui étudie les relations entre pairs de points, est un outil de base pour l'analyse géostatistique de corrélations spatiales anisotropiques qui permet de détecter la présence de patterns spatiaux descriptible par une statistique. L'approche de l'apprentissage automatique pour l'ESDA est présentée à travers l'application de la méthode des k plus proches voisins qui est très simple et possède d'excellentes qualités d'interprétation et de visualisation. Une part importante de la thèse traite de sujets d'actualité comme la cartographie automatique de données spatiales. Le réseau de neurones de régression généralisée est proposé pour résoudre cette tâche efficacement. Les performances du GRNN sont démontrées par des données de Comparaison d'Interpolation Spatiale (SIC) de 2004 pour lesquelles le GRNN bat significativement toutes les autres méthodes, particulièrement lors de situations d'urgence. La thèse est composée de quatre chapitres : théorie, applications, outils logiciels et des exemples guidés. Une partie importante du travail consiste en une collection de logiciels : Machine Learning Office. Cette collection de logiciels a été développée durant les 15 dernières années et a été utilisée pour l'enseignement de nombreux cours, dont des workshops internationaux en Chine, France, Italie, Irlande et Suisse ainsi que dans des projets de recherche fondamentaux et appliqués. Les cas d'études considérés couvrent un vaste spectre de problèmes géoenvironnementaux réels à basse et haute dimensionnalité, tels que la pollution de l'air, du sol et de l'eau par des produits radioactifs et des métaux lourds, la classification de types de sols et d'unités hydrogéologiques, la cartographie des incertitudes pour l'aide à la décision et l'estimation de risques naturels (glissements de terrain, avalanches). Des outils complémentaires pour l'analyse exploratoire des données et la visualisation ont également été développés en prenant soin de créer une interface conviviale et facile à l'utilisation. Machine Learning for geospatial data: algorithms, software tools and case studies Abstract The thesis is devoted to the analysis, modeling and visualisation of spatial environmental data using machine learning algorithms. In a broad sense machine learning can be considered as a subfield of artificial intelligence. It mainly concerns with the development of techniques and algorithms that allow computers to learn from data. In this thesis machine learning algorithms are adapted to learn from spatial environmental data and to make spatial predictions. Why machine learning? In few words most of machine learning algorithms are universal, adaptive, nonlinear, robust and efficient modeling tools. They can find solutions for the classification, regression, and probability density modeling problems in high-dimensional geo-feature spaces, composed of geographical space and additional relevant spatially referenced features. They are well-suited to be implemented as predictive engines in decision support systems, for the purposes of environmental data mining including pattern recognition, modeling and predictions as well as automatic data mapping. They have competitive efficiency to the geostatistical models in low dimensional geographical spaces but are indispensable in high-dimensional geo-feature spaces. The most important and popular machine learning algorithms and models interesting for geo- and environmental sciences are presented in details: from theoretical description of the concepts to the software implementation. The main algorithms and models considered are the following: multi-layer perceptron (a workhorse of machine learning), general regression neural networks, probabilistic neural networks, self-organising (Kohonen) maps, Gaussian mixture models, radial basis functions networks, mixture density networks. This set of models covers machine learning tasks such as classification, regression, and density estimation. Exploratory data analysis (EDA) is initial and very important part of data analysis. In this thesis the concepts of exploratory spatial data analysis (ESDA) is considered using both traditional geostatistical approach such as_experimental variography and machine learning. Experimental variography is a basic tool for geostatistical analysis of anisotropic spatial correlations which helps to understand the presence of spatial patterns, at least described by two-point statistics. A machine learning approach for ESDA is presented by applying the k-nearest neighbors (k-NN) method which is simple and has very good interpretation and visualization properties. Important part of the thesis deals with a hot topic of nowadays, namely, an automatic mapping of geospatial data. General regression neural networks (GRNN) is proposed as efficient model to solve this task. Performance of the GRNN model is demonstrated on Spatial Interpolation Comparison (SIC) 2004 data where GRNN model significantly outperformed all other approaches, especially in case of emergency conditions. The thesis consists of four chapters and has the following structure: theory, applications, software tools, and how-to-do-it examples. An important part of the work is a collection of software tools - Machine Learning Office. Machine Learning Office tools were developed during last 15 years and was used both for many teaching courses, including international workshops in China, France, Italy, Ireland, Switzerland and for realizing fundamental and applied research projects. Case studies considered cover wide spectrum of the real-life low and high-dimensional geo- and environmental problems, such as air, soil and water pollution by radionuclides and heavy metals, soil types and hydro-geological units classification, decision-oriented mapping with uncertainties, natural hazards (landslides, avalanches) assessments and susceptibility mapping. Complementary tools useful for the exploratory data analysis and visualisation were developed as well. The software is user friendly and easy to use.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The proportion of population living in or around cites is more important than ever. Urban sprawl and car dependence have taken over the pedestrian-friendly compact city. Environmental problems like air pollution, land waste or noise, and health problems are the result of this still continuing process. The urban planners have to find solutions to these complex problems, and at the same time insure the economic performance of the city and its surroundings. At the same time, an increasing quantity of socio-economic and environmental data is acquired. In order to get a better understanding of the processes and phenomena taking place in the complex urban environment, these data should be analysed. Numerous methods for modelling and simulating such a system exist and are still under development and can be exploited by the urban geographers for improving our understanding of the urban metabolism. Modern and innovative visualisation techniques help in communicating the results of such models and simulations. This thesis covers several methods for analysis, modelling, simulation and visualisation of problems related to urban geography. The analysis of high dimensional socio-economic data using artificial neural network techniques, especially self-organising maps, is showed using two examples at different scales. The problem of spatiotemporal modelling and data representation is treated and some possible solutions are shown. The simulation of urban dynamics and more specifically the traffic due to commuting to work is illustrated using multi-agent micro-simulation techniques. A section on visualisation methods presents cartograms for transforming the geographic space into a feature space, and the distance circle map, a centre-based map representation particularly useful for urban agglomerations. Some issues on the importance of scale in urban analysis and clustering of urban phenomena are exposed. A new approach on how to define urban areas at different scales is developed, and the link with percolation theory established. Fractal statistics, especially the lacunarity measure, and scale laws are used for characterising urban clusters. In a last section, the population evolution is modelled using a model close to the well-established gravity model. The work covers quite a wide range of methods useful in urban geography. Methods should still be developed further and at the same time find their way into the daily work and decision process of urban planners. La part de personnes vivant dans une région urbaine est plus élevé que jamais et continue à croître. L'étalement urbain et la dépendance automobile ont supplanté la ville compacte adaptée aux piétons. La pollution de l'air, le gaspillage du sol, le bruit, et des problèmes de santé pour les habitants en sont la conséquence. Les urbanistes doivent trouver, ensemble avec toute la société, des solutions à ces problèmes complexes. En même temps, il faut assurer la performance économique de la ville et de sa région. Actuellement, une quantité grandissante de données socio-économiques et environnementales est récoltée. Pour mieux comprendre les processus et phénomènes du système complexe "ville", ces données doivent être traitées et analysées. Des nombreuses méthodes pour modéliser et simuler un tel système existent et sont continuellement en développement. Elles peuvent être exploitées par le géographe urbain pour améliorer sa connaissance du métabolisme urbain. Des techniques modernes et innovatrices de visualisation aident dans la communication des résultats de tels modèles et simulations. Cette thèse décrit plusieurs méthodes permettant d'analyser, de modéliser, de simuler et de visualiser des phénomènes urbains. L'analyse de données socio-économiques à très haute dimension à l'aide de réseaux de neurones artificiels, notamment des cartes auto-organisatrices, est montré à travers deux exemples aux échelles différentes. Le problème de modélisation spatio-temporelle et de représentation des données est discuté et quelques ébauches de solutions esquissées. La simulation de la dynamique urbaine, et plus spécifiquement du trafic automobile engendré par les pendulaires est illustrée à l'aide d'une simulation multi-agents. Une section sur les méthodes de visualisation montre des cartes en anamorphoses permettant de transformer l'espace géographique en espace fonctionnel. Un autre type de carte, les cartes circulaires, est présenté. Ce type de carte est particulièrement utile pour les agglomérations urbaines. Quelques questions liées à l'importance de l'échelle dans l'analyse urbaine sont également discutées. Une nouvelle approche pour définir des clusters urbains à des échelles différentes est développée, et le lien avec la théorie de la percolation est établi. Des statistiques fractales, notamment la lacunarité, sont utilisées pour caractériser ces clusters urbains. L'évolution de la population est modélisée à l'aide d'un modèle proche du modèle gravitaire bien connu. Le travail couvre une large panoplie de méthodes utiles en géographie urbaine. Toutefois, il est toujours nécessaire de développer plus loin ces méthodes et en même temps, elles doivent trouver leur chemin dans la vie quotidienne des urbanistes et planificateurs.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The activation of CD40 on B cells, macrophages, and dendritic cells by its ligand CD154 (CD40L) is essential for the development of humoral and cellular immune responses. CD40L and other TNF superfamily ligands are noncovalent homotrimers, but the form under which CD40 exists in the absence of ligand remains to be elucidated. Here, we show that both cell surface-expressed and soluble CD40 self-assemble, most probably as noncovalent dimers. The cysteine-rich domain 1 (CRD1) of CD40 participated to dimerization and was also required for efficient receptor expression. Modelization of a CD40 dimer allowed the identification of lysine 29 in CRD1, whose mutation decreased CD40 self-interaction without affecting expression or response to ligand. When expressed alone, recombinant CD40-CRD1 bound CD40 with a KD of 0.6 μm. This molecule triggered expression of maturation markers on human dendritic cells and potentiated CD40L activity. These results suggest that CD40 self-assembly modulates signaling, possibly by maintaining the receptor in a quiescent state.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

BACKGROUND: The escalating prevalence of obesity might prompt obese subjects to consider themselves as normal, as this condition is gradually becoming as frequent as normal weight. In this study, we aimed to assess the trends in the associations between obesity and self-rated health in two countries. METHODS: Data from the Portuguese (years 1995-6, 1998-6 and 2005-6) and Swiss (1992-3, 1997, 2002 and 2007) National Health Surveys were used, corresponding to more than 130,000 adults (64,793 for Portugal and 65,829 for Switzerland). Body mass index and self-rated health were derived from self-reported data. RESULTS: Obesity levels were higher in Portugal (17.5% in 2005-6 vs. 8.9% in 2007 in Switzerland, p < 0.001) and increased in both countries. The prevalence of participants rating their health as "bad" or "very bad" was higher in Portugal than in Switzerland (21.8% in 2005-6 vs 3.9% in 2007, p < 0.001). In both countries, obese participants rated more frequently their health as "bad" or "very bad" than participants with regular weight. In Switzerland, the prevalence of "bad" or "very bad" rates among obese participants, increased from 6.5% in 1992-3 to 9.8% in 2007, while in Portugal it decreased from 41.3% to 32.3%. After multivariate adjustment, the odds ratio (OR) of stating one self's health as "bad" or "very bad" among obese relative to normal weight participants, almost doubled in Switzerland: from 1.38 (95% confidence interval, CI: 1.01-1.87) in 1992-3 to 2.64 (95% CI: 2.14-3.26) in 2007, and similar findings were obtained after sample weighting. Conversely, no such trend was found in Portugal: 1.35 (95% CI: 1.23-1.48) in 1995-6 and 1.52 (95% CI: 1.37-1.70) in 2005-6. CONCLUSION: Obesity is increasing in Switzerland and Portugal. Obesity is increasingly associated with poorer self-health ratings in Switzerland but not in Portugal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ryanodine receptor 1 (RYR1) mutations are a common cause of congenital myopathies associated with both dominant and recessive inheritance. Histopathological findings frequently feature central cores or multi-minicores, more rarely, type 1 predominance/uniformity, fiber-type disproportion, increased internal nucleation, and fatty and connective tissue. We describe 71 families, 35 associated with dominant RYR1 mutations and 36 with recessive inheritance. Five of the dominant mutations and 35 of the 55 recessive mutations have not been previously reported. Dominant mutations, typically missense, were frequently located in recognized mutational hotspot regions, while recessive mutations were distributed throughout the entire coding sequence. Recessive mutations included nonsense and splice mutations expected to result in reduced RyR1 protein. There was wide clinical variability. As a group, dominant mutations were associated with milder phenotypes; patients with recessive inheritance had earlier onset, more weakness, and functional limitations. Extraocular and bulbar muscle involvement was almost exclusively observed in the recessive group. In conclusion, our study reports a large number of novel RYR1 mutations and indicates that recessive variants are at least as frequent as the dominant ones. Assigning pathogenicity to novel mutations is often difficult, and interpretation of genetic results in the context of clinical, histological, and muscle magnetic resonance imaging findings is essential.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The Family Attitude Scale (FAS) is a self-report measure of critical or hostile attitudes and behaviors towards another family member, and demonstrates an ability to predict relapse in psychoses. Data are not currently available on a French version of the scale. The present study developed a French version of the FAS, using a large general population sample to test its internal structure, criterion validity and relationships with the respondents' symptoms and psychiatric diagnoses, and examined the reciprocity of FAS ratings by respondents and their partners. A total of 2072 adults from an urban population undertook a diagnostic interview and completed self-report measures, including an FAS about their partner. A subset of participants had partners who also completed the FAS. Confirmatory factor analyses revealed an excellent fit by a single-factor model, and the FAS demonstrated a strong association with dyadic adjustment. FAS scores of respondents were affected by their anxiety levels and mood, alcohol and anxiety diagnoses, and moderate reciprocity of attitudes and behaviors between the partners was seen. The French version of the FAS has similarly strong psychometric properties to the original English version. Future research should assess the ability of the French FAS to predict relapse of psychiatric disorders.