5 resultados para inversor MLP
em Université de Lausanne, Switzerland
Resumo:
Résumé Une caractéristique des cellules eucaryotes est le confinement du matériel génétique (ADN/DNA) dans le noyau. Pour décoder cette information, un ARN messager (mRNA) est d'abord transcrit sous forme d'un ARN prémessager (pré-mRNA). Ce-dernier doit subir plusieurs étapes de maturation pour aboutir à une particule ribonucléoprotéique (mRNP) qui sera exportée vers le cytoplasme et traduite en protéine. La protéine de levure Mex67p et son homologue humain TAP sont des récepteurs d'export médiant la translocation du mRNP au travers des complexes du pore nucléaire (NPC). Mex67p/TAP ne se lient pas directement au mRNA, mais nécessitent la présence de protéines adaptatrices, telles que Yra1p et son homologue humain REF1. Afin d'identifier de nouveaux facteurs impliqués dans l'export des mRNPs ou de nouvelles fonctions pour Yra1p, nous avons effectué un crible génétique avec un mutant thermosensible de Yra1p, GFP-yra 1 -8. Ce mutant présente un défaut d'export des mRNAs et une diminution des niveaux de transcrits du gène rapporteur LacZ ainsi que de certains transcrits endogènes. Nous avons trouvé que la perte de Mlp2p, ou d'une protéine hautement similaire, Mlp1p, restaure la croissance du mutant GFP-yra1-8 à température restrictive. Mlp1p et Mlp2p sont des protéines nucléaires, dont l'homologue humain est TPR. Les Mlp (myosin¬like proteins) ainsi que TPR forment des structures filamenteuses ancrées aux NPC. Bien que la fonction des Mlp ne soit pas clairement définie, un rôle dans la biogenèse et la surveillance des mRNPs a été récemment proposé. Notre étude montre que la perte des Mlp, non seulement restaure la croissance de GFP-yra1-8, mais augmente aussi les niveaux des transcrits LacZ et facilite leur apparition dans le cytoplasme. Des expériences d'immunoprécipitations de la chromatine révèlent que Mlp2p diminue le taux de synthèse du transcrit LacZ dans GFP-yra1-8. Des analyses du transcriptome montrent que Mlp2p réduit aussi les niveaux d'une population de transcrits endogènes dans le mutant. Finalement, des localisations in situ suggèrent que la transcription du rapporteur LacZ a lieu à la périphérie du noyau, à proximité des Mlp. Ainsi, les protéines Mlp pourraient préférentiellement diminuer la transcription de gènes exprimés à la périphérie nucléaire. Nous montrons aussi que Yra1p interagit génétiquement avec Nab2p une protéine liée au mRNA et impliquée dans son export, mais non avec d'autres protéines également impliquées dans l'export des mRNAs. Les résultats obtenus soutiennent un modèle où les protéines Yra1p et Nab2p sont nécessaires à l'arrimage des mRNPs sur la plate-forme des Mlp. Si ces signaux manquent ou sont défectueux, les mRNPs ne peuvent pas poursuivre leur trajet vers le canal central du NPC. Ce bloc induirait par la suite une diminution de la transcription d'une population de gènes potentiellement localisée à la périphérie nucléaire. Dans son ensemble, cette étude suggère que les protéines Mlp établissent un lien entre la transcription de certains mRNAs et leur export au travers du pore nucléaire. Summary A hallmark of the eukaryotic cell is the packaging of DNA in the nucleus. To decode the genetic information, a messenger RNA (mRNA) is first synthesized as a pre-mRNA molecule, which undergoes different maturation steps resulting in an mRNP (messenger RNA ribonucleoprotein), which can be actively transported to the cytoplasm and translated into a protein. Yeast Mex67p and its human homologue TAP are export receptors mediating mRNP translocation through the nuclear pore complex (NPC). The recruitment of Mex67p/TAP to mRNA is mediated by mRNA export adaptors of the evolutionarily conserved REF (RNA and Export Factor binding) family: yeast Yra1p and human REF1. To uncover new functions of Yra1p or new factors implicated in mRNA export, we performed a genetic screen with a themiosensitive (ts) yra1 mutant, GFP-yra1-8. This mutant exhibits mRNA export defects and a decrease in the levels of LacZ reporter and certain endogenous transcripts. We found that the loss of Mlp2p, or the related Mlp1p protein, substantially rescues the growth defect of the GFP-yra1 -8 mutant. Mlp1p and M1p2p are large non-essential proteins, homologous to human TPR, proposed to form intra-nuclear filamentous structures anchored at the NPC. Their role is not clearly defined, but they have been implicated in mRNP biogenesis and surveillance. Our study shows that loss of Mlp proteins not only restores growth of GFP-yra1-8, but also rescues LacZ mRNA levels and increases their appearance in the cytoplasm. Chromatin immunoprecipitation and pulse chase experiments indicate that Mlp2p down-regulates LacZ mRNA synthesis in GFP-yra1-8. DNA micro- array analyses reveal that Mlp2p also reduces the levels of a subset of cellular transcripts in the yra1 mutant strain. In situ localizations suggest that LacZ transcription occurs at the nuclear periphery, in close proximity to Mlp proteins. Thus, Mlp proteins may preferentially down-regulate genes expressed at the nuclear periphery. Finally, we show that Yra1p genetically interacts with the shuttling mRNA-binding protein Nab2p and that loss of Mlp proteins rescues the growth defect of yra1 and nab2, but not other mRNA export mutants. The data support a model in which Nab2p and Yra1p are required for rnRNP docking to the Mlp platform. Lack of these signals prevents mRNPs from crossing the Mlp gate. This block may then negatively feed-back on the transcription of a subset of genes, potentially located at the nuclear envelope. Overall, this study suggests that perinuclear Mlp proteins establish a link between mRNA transcription and export.
Resumo:
The rationale of this study was to investigate molecular flexibility and its influence on physicochemical properties with a view to uncovering additional information on the fuzzy concept of dynamic molecular structure. Indeed, it is now known that computed molecular interaction fields (MIFs) such as molecular electrostatic potentials (MEPs) and lipophilicity potentials (MLPs) are conformation-dependent, as are dipole moments. A database of 125 compounds was used whose conformational space was explored, while conformation-dependent parameters were computed for each non-redundant conformer found in the conformational space of the compounds. These parameters were the virtual log P (log P(MLP), calculated by a MLP approach), the apolar surface area (ASA), polar surface area (PSA), and solvent-accessible surface (SAS). For each compound, the range taken by each parameter (its property space) was divided by the number of rotors taken as an index of flexibility, yielding a parameter termed 'molecular sensitivity'. This parameter was poorly correlated with others (i.e., it contains novel information) and showed the compounds to fall into two broad classes. 'Sensitive' molecules are those whose computed property ranges are markedly sensitive to conformational effects, whereas 'insensitive' (in fact, less sensitive) molecules have property ranges which are comparatively less affected by conformational fluctuations. A pharmacokinetic application is presented.
Resumo:
The present research deals with the review of the analysis and modeling of Swiss franc interest rate curves (IRC) by using unsupervised (SOM, Gaussian Mixtures) and supervised machine (MLP) learning algorithms. IRC are considered as objects embedded into different feature spaces: maturities; maturity-date, parameters of Nelson-Siegel model (NSM). Analysis of NSM parameters and their temporal and clustering structures helps to understand the relevance of model and its potential use for the forecasting. Mapping of IRC in a maturity-date feature space is presented and analyzed for the visualization and forecasting purposes.
Resumo:
OBJECTIVES: This study aimed at measuring the lipophilicity and ionization constants of diastereoisomeric dipeptides, interpreting them in terms of conformational behavior, and developing statistical models to predict them. METHODS: A series of 20 dipeptides of general structure NH(2) -L-X-(L or D)-His-OMe was designed and synthetized. Their experimental ionization constants (pK(1) , pK(2) and pK(3) ) and lipophilicity parameters (log P(N) and log D(7.4) ) were measured by potentiometry. Molecular modeling in three media (vacuum, water, and chloroform) was used to explore and sample their conformational space, and for each stored conformer to calculate their radius of gyration, virtual log P (preferably written as log P(MLP) , meaning obtained by the molecular lipophilicity potential (MLP) method) and polar surface area (PSA). Means and ranges were calculated for these properties, as was their sensitivity (i.e., the ratio between property range and number of rotatable bonds). RESULTS: Marked differences between diastereoisomers were seen in their experimental ionization constants and lipophilicity parameters. These differences are explained by molecular flexibility, configuration-dependent differences in intramolecular interactions, and accessibility of functional groups. Multiple linear equations correlated experimental lipophilicity parameters and ionization constants with PSA range and other calculated parameters. CONCLUSION: This study documents the differences in lipophilicity and ionization constants between diastereoisomeric dipeptides. Such configuration-dependent differences are shown to depend markedly on differences in conformational behavior and to be amenable to multiple linear regression. Chirality 24:566-576, 2012. © 2012 Wiley Periodicals, Inc.
Resumo:
Résumé Cette thèse est consacrée à l'analyse, la modélisation et la visualisation de données environnementales à référence spatiale à l'aide d'algorithmes d'apprentissage automatique (Machine Learning). L'apprentissage automatique peut être considéré au sens large comme une sous-catégorie de l'intelligence artificielle qui concerne particulièrement le développement de techniques et d'algorithmes permettant à une machine d'apprendre à partir de données. Dans cette thèse, les algorithmes d'apprentissage automatique sont adaptés pour être appliqués à des données environnementales et à la prédiction spatiale. Pourquoi l'apprentissage automatique ? Parce que la majorité des algorithmes d'apprentissage automatiques sont universels, adaptatifs, non-linéaires, robustes et efficaces pour la modélisation. Ils peuvent résoudre des problèmes de classification, de régression et de modélisation de densité de probabilités dans des espaces à haute dimension, composés de variables informatives spatialisées (« géo-features ») en plus des coordonnées géographiques. De plus, ils sont idéaux pour être implémentés en tant qu'outils d'aide à la décision pour des questions environnementales allant de la reconnaissance de pattern à la modélisation et la prédiction en passant par la cartographie automatique. Leur efficacité est comparable au modèles géostatistiques dans l'espace des coordonnées géographiques, mais ils sont indispensables pour des données à hautes dimensions incluant des géo-features. Les algorithmes d'apprentissage automatique les plus importants et les plus populaires sont présentés théoriquement et implémentés sous forme de logiciels pour les sciences environnementales. Les principaux algorithmes décrits sont le Perceptron multicouches (MultiLayer Perceptron, MLP) - l'algorithme le plus connu dans l'intelligence artificielle, le réseau de neurones de régression généralisée (General Regression Neural Networks, GRNN), le réseau de neurones probabiliste (Probabilistic Neural Networks, PNN), les cartes auto-organisées (SelfOrganized Maps, SOM), les modèles à mixture Gaussiennes (Gaussian Mixture Models, GMM), les réseaux à fonctions de base radiales (Radial Basis Functions Networks, RBF) et les réseaux à mixture de densité (Mixture Density Networks, MDN). Cette gamme d'algorithmes permet de couvrir des tâches variées telle que la classification, la régression ou l'estimation de densité de probabilité. L'analyse exploratoire des données (Exploratory Data Analysis, EDA) est le premier pas de toute analyse de données. Dans cette thèse les concepts d'analyse exploratoire de données spatiales (Exploratory Spatial Data Analysis, ESDA) sont traités selon l'approche traditionnelle de la géostatistique avec la variographie expérimentale et selon les principes de l'apprentissage automatique. La variographie expérimentale, qui étudie les relations entre pairs de points, est un outil de base pour l'analyse géostatistique de corrélations spatiales anisotropiques qui permet de détecter la présence de patterns spatiaux descriptible par une statistique. L'approche de l'apprentissage automatique pour l'ESDA est présentée à travers l'application de la méthode des k plus proches voisins qui est très simple et possède d'excellentes qualités d'interprétation et de visualisation. Une part importante de la thèse traite de sujets d'actualité comme la cartographie automatique de données spatiales. Le réseau de neurones de régression généralisée est proposé pour résoudre cette tâche efficacement. Les performances du GRNN sont démontrées par des données de Comparaison d'Interpolation Spatiale (SIC) de 2004 pour lesquelles le GRNN bat significativement toutes les autres méthodes, particulièrement lors de situations d'urgence. La thèse est composée de quatre chapitres : théorie, applications, outils logiciels et des exemples guidés. Une partie importante du travail consiste en une collection de logiciels : Machine Learning Office. Cette collection de logiciels a été développée durant les 15 dernières années et a été utilisée pour l'enseignement de nombreux cours, dont des workshops internationaux en Chine, France, Italie, Irlande et Suisse ainsi que dans des projets de recherche fondamentaux et appliqués. Les cas d'études considérés couvrent un vaste spectre de problèmes géoenvironnementaux réels à basse et haute dimensionnalité, tels que la pollution de l'air, du sol et de l'eau par des produits radioactifs et des métaux lourds, la classification de types de sols et d'unités hydrogéologiques, la cartographie des incertitudes pour l'aide à la décision et l'estimation de risques naturels (glissements de terrain, avalanches). Des outils complémentaires pour l'analyse exploratoire des données et la visualisation ont également été développés en prenant soin de créer une interface conviviale et facile à l'utilisation. Machine Learning for geospatial data: algorithms, software tools and case studies Abstract The thesis is devoted to the analysis, modeling and visualisation of spatial environmental data using machine learning algorithms. In a broad sense machine learning can be considered as a subfield of artificial intelligence. It mainly concerns with the development of techniques and algorithms that allow computers to learn from data. In this thesis machine learning algorithms are adapted to learn from spatial environmental data and to make spatial predictions. Why machine learning? In few words most of machine learning algorithms are universal, adaptive, nonlinear, robust and efficient modeling tools. They can find solutions for the classification, regression, and probability density modeling problems in high-dimensional geo-feature spaces, composed of geographical space and additional relevant spatially referenced features. They are well-suited to be implemented as predictive engines in decision support systems, for the purposes of environmental data mining including pattern recognition, modeling and predictions as well as automatic data mapping. They have competitive efficiency to the geostatistical models in low dimensional geographical spaces but are indispensable in high-dimensional geo-feature spaces. The most important and popular machine learning algorithms and models interesting for geo- and environmental sciences are presented in details: from theoretical description of the concepts to the software implementation. The main algorithms and models considered are the following: multi-layer perceptron (a workhorse of machine learning), general regression neural networks, probabilistic neural networks, self-organising (Kohonen) maps, Gaussian mixture models, radial basis functions networks, mixture density networks. This set of models covers machine learning tasks such as classification, regression, and density estimation. Exploratory data analysis (EDA) is initial and very important part of data analysis. In this thesis the concepts of exploratory spatial data analysis (ESDA) is considered using both traditional geostatistical approach such as_experimental variography and machine learning. Experimental variography is a basic tool for geostatistical analysis of anisotropic spatial correlations which helps to understand the presence of spatial patterns, at least described by two-point statistics. A machine learning approach for ESDA is presented by applying the k-nearest neighbors (k-NN) method which is simple and has very good interpretation and visualization properties. Important part of the thesis deals with a hot topic of nowadays, namely, an automatic mapping of geospatial data. General regression neural networks (GRNN) is proposed as efficient model to solve this task. Performance of the GRNN model is demonstrated on Spatial Interpolation Comparison (SIC) 2004 data where GRNN model significantly outperformed all other approaches, especially in case of emergency conditions. The thesis consists of four chapters and has the following structure: theory, applications, software tools, and how-to-do-it examples. An important part of the work is a collection of software tools - Machine Learning Office. Machine Learning Office tools were developed during last 15 years and was used both for many teaching courses, including international workshops in China, France, Italy, Ireland, Switzerland and for realizing fundamental and applied research projects. Case studies considered cover wide spectrum of the real-life low and high-dimensional geo- and environmental problems, such as air, soil and water pollution by radionuclides and heavy metals, soil types and hydro-geological units classification, decision-oriented mapping with uncertainties, natural hazards (landslides, avalanches) assessments and susceptibility mapping. Complementary tools useful for the exploratory data analysis and visualisation were developed as well. The software is user friendly and easy to use.