3 resultados para leave one out cross validation

em ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Analyzing and modeling relationships between the structure of chemical compounds, their physico-chemical properties, and biological or toxic effects in chemical datasets is a challenging task for scientific researchers in the field of cheminformatics. Therefore, (Q)SAR model validation is essential to ensure future model predictivity on unseen compounds. Proper validation is also one of the requirements of regulatory authorities in order to approve its use in real-world scenarios as an alternative testing method. However, at the same time, the question of how to validate a (Q)SAR model is still under discussion. In this work, we empirically compare a k-fold cross-validation with external test set validation. The introduced workflow allows to apply the built and validated models to large amounts of unseen data, and to compare the performance of the different validation approaches. Our experimental results indicate that cross-validation produces (Q)SAR models with higher predictivity than external test set validation and reduces the variance of the results. Statistical validation is important to evaluate the performance of (Q)SAR models, but does not support the user in better understanding the properties of the model or the underlying correlations. We present the 3D molecular viewer CheS-Mapper (Chemical Space Mapper) that arranges compounds in 3D space, such that their spatial proximity reflects their similarity. The user can indirectly determine similarity, by selecting which features to employ in the process. The tool can use and calculate different kinds of features, like structural fragments as well as quantitative chemical descriptors. Comprehensive functionalities including clustering, alignment of compounds according to their 3D structure, and feature highlighting aid the chemist to better understand patterns and regularities and relate the observations to established scientific knowledge. Even though visualization tools for analyzing (Q)SAR information in small molecule datasets exist, integrated visualization methods that allows for the investigation of model validation results are still lacking. We propose visual validation, as an approach for the graphical inspection of (Q)SAR model validation results. New functionalities in CheS-Mapper 2.0 facilitate the analysis of (Q)SAR information and allow the visual validation of (Q)SAR models. The tool enables the comparison of model predictions to the actual activity in feature space. Our approach reveals if the endpoint is modeled too specific or too generic and highlights common properties of misclassified compounds. Moreover, the researcher can use CheS-Mapper to inspect how the (Q)SAR model predicts activity cliffs. The CheS-Mapper software is freely available at http://ches-mapper.org.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Die Entstehung und Aufrechterhaltung von Knorpel- und Knochengewebe wird durch eine Vielzahl von hemmenden oder fördernden Faktoren hoch komplex reguliert, wobei die dabei involvierten physiologischen Prozesse bisher nur teilweise verstanden werden. Auch die Ursachen sowohl degenerativer Erkrankungen, aber auch durch Mutationen im FGFR3-Gen verursachter Chondrodysplasien sind in ihrer Ätiopathogenese noch nicht vollständig erforscht. In dieser Arbeit wurden verschiedene experimentelle Ansätze verfolgt, die zur weiteren Aufklärung der Pathophysiologie zweier unterschiedlicher Skeletterkrankungen beitragen sollten.rnEin relevantes Charakteristikum der degenerativen Gelenkserkrankung Osteoarthrose ist der Verlust an Aggrekan, hauptverantwortlich verursacht durch die Aggrekanase ADAMTS5. Es wurde ein Tiermodell generiert, bei dem gezielt mittels des Tet-ON-Systems die Aggrekanase mAdamts-5 überexprimiert werden kann. Nach Konstruktherstellung und Generierung als auch Charakterisierung des in vitro-Modells wurde das Tiermodell hergestellt, um die Folgen der Überexpression im Hinblick auf einen verstärkten Aggrekanabbau im Knorpel der Mäuse zu analysieren. Nach initialer Charakterisierung auf Induzierbarkeit zeigte eine Gründerlinie eine induzierbare transgene mAdamts5-Expression. Die Überprüfung auf Knorpelspezifität zeigte, sowohl embryonal als auch im adulten Tier, dass sich der verwendete, zusammengesetzte Kollagen-Typ II Promotor wie der endogene verhielt und somit funktional war. Nach Doxyzyklininduktion wurde bei der optimalen Dosis von 1 mg/ml im Vergleich zum induzierten Wildtyp-Tier eine 15%ige Abnahme des Gesamt-Glykosamino-glykan(GAG)-Gehaltes und eine um 120% erhöhte GAG-Abgabe ins Medium detektiert, was eine verstärkte Spaltung von Aggrekan bedeutete. Die transgene Aggrekanase wurde überexprimiert und spaltete verstärkt Aggrekan. Da aufgrund der histologischen Untersuchungen jedoch keine Knorpelerosionen feststellbar waren, konnte im Umkehrschluss gefolgert werden, dass der Knorpel einen Verlust an Glykosaminoglykanen bis zu einer gewissen Grenze tolerieren kann. Mit dem generierten und charakterisierten Tiermodell konnte mit dem Verlust an GAG eine Osteoarthrose-ähnliche Situation simuliert werden, insbesondere im Hinblick auf frühe Stadien der Erkrankung, bei denen noch keine makroskopisch eindeutig sichtbare Knorpelerosionen vorliegen. rnIm zweiten Teil der Arbeit wurden Zellkulturexperimente zur weiteren Aufklärung FGFR3-regulierter Prozesse durchgeführt. Nach Generierung und Verifizierung der stabilen Zelllinien, die mittels des Tet-ON-Systems das FGFR3-Gen mit jeweils einer Chondrodysplasie-assoziierten Mutation (Achondroplasie-Mutation G380R, Thanatophore Dysplasie Typ II-Mutation K650E) induzierbar überexprimieren, wurden die Auswirkungen der zwei verschiedenen Mutationen anhand bereits beschriebener Signalwege untersucht. Über die Rekrutierung des ERK-Signalweges konnte bei beiden Zelllinien die Funktionalität nachgewiesen werden, wobei die Zelllinie mit der einen schwereren Phänotyp beim Menschen verursachenden TDII-Mutation eine stärkere Aktivierung zeigte. Bei der Aktivierung von STAT1 wies nur die TDII-Zelllinie eine Phosphorylierung auf, nicht jedoch die ACH-Zelllinie; dies deckte sich mit bereits publizierten Untersuchungen. Beide Kaskaden zeigten eine unterschiedliche Signalantwort aufgrund der verschiedenen Mutationen. Des Weiteren konnte eine unterschiedliche MMP13-Zielgenexpression nachgewiesen werden, wobei lediglich die ACH-Zelllinie eine erhöhte MMP13-Expression (6-fach) zeigte. Zur Identifizierung neuer involvierter FGFR3-Zielgene wurde die differentielle Genexpression der TDII-Zelllinie im Vergleich induziert/nicht induziert mittels Microarray-Hybridisierung untersucht. Als interessantes Zielgen fiel STC1 auf, welches ebenfalls eine Rolle in der Chondrogenese spielt und bislang nicht mit FGFR3 in Verbindung gebracht wurde. Es konnte jedoch nur auf RNA-Ebene eine Regulation nachgewiesen werden. Nachfolgend durchgeführte transiente Experimente zeigten, dass die Wildtyp-Variante von FGFR3 möglicherweise eine Funktion in der Sekretion des Proteins STC1 hat und dass durch die beiden eingefügten Mutationen (ACH, TDII) diese aufgehoben ist. Der Einfluss von FGFR3 auf die Sekretion von STC1 stellt ein neues Ergebnis dar, insbesondere auch die Auswirkungen der beiden für die unterschiedlichen Krankheitsbilder stehenden Mutationen. Welche Relevanz allerdings die STC1-Sekretion im Rahmen FGFR3-assoziierter Erkrankungen hat, kann nicht eindeutig beurteilt werden. Weitere Faktoren aus dem hoch komplexen Zusammenspiel während der Knorpel/Knochenentwicklung müssen untersucht werden, um eine definitive Einordnung zu ermöglichen.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

The dominant process in hard proton-proton collisions is the production of hadronic jets.rnThese sprays of particles are produced by colored partons, which are struck out of their confinement within the proton.rnPrevious measurements of inclusive jet cross sections have provided valuable information for the determination of parton density functions and allow for stringent tests of perturbative QCD at the highest accessible energies.rnrnThis thesis will present a measurement of inclusive jet cross sections in proton-proton collisions using the ATLAS detector at the LHC at a center-of-mass energy of 7 TeV.rnJets are identified using the anti-kt algorithm and jet radii of R=0.6 and R=0.4.rnThey are calibrated using a dedicated pT and eta dependent jet calibration scheme.rnThe cross sections are measured for 40 GeV < pT <= 1 TeV and |y| < 2.8 in four bins of absolute rapidity, using data recorded in 2010 corresponding to an integrated luminosity of 3 pb^-1.rnThe data is fully corrected for detector effects and compared to theoretical predictions calculated at next-to-leading order including non-perturbative effects.rnThe theoretical predictions are found to agree with data within the experimental and theoretic uncertainties.rnrnThe ratio of cross sections for R=0.4 and R=0.6 is measured, exploiting the significant correlations of the systematic uncertainties, and is compared to recently developed theoretical predictions.rnThe underlying event can be characterized by the amount of transverse momentum per unit rapidity and azimuth, called rhoue.rnUsing analytical approaches to the calculation of non-perturbative corrections to jets, rhoue at the LHC is estimated using the ratio measurement.rnA feasibility study of a combined measurement of rhoue and the average strong coupling in the non-perturbative regime alpha_0 is presented and proposals for future jet measurements at the LHC are made.