8 resultados para spurious regressions
em Universitat de Girona, Spain
Resumo:
The energy and hardness profile for a series of inter and intramolecular conformational changes at several levels of calculation were computed. The hardness profiles were found to be calculated as the difference between the vertical ionization potential and electron affinity. The hardness profile shows the correct number of stationary points independently of the basis set and methodology used. It was found that the hardness profiles can be used to check the reliability of the energy profiles for those chemical system
Resumo:
There is almost not a case in exploration geology, where the studied data doesn’t includes below detection limits and/or zero values, and since most of the geological data responds to lognormal distributions, these “zero data” represent a mathematical challenge for the interpretation. We need to start by recognizing that there are zero values in geology. For example the amount of quartz in a foyaite (nepheline syenite) is zero, since quartz cannot co-exists with nepheline. Another common essential zero is a North azimuth, however we can always change that zero for the value of 360°. These are known as “Essential zeros”, but what can we do with “Rounded zeros” that are the result of below the detection limit of the equipment? Amalgamation, e.g. adding Na2O and K2O, as total alkalis is a solution, but sometimes we need to differentiate between a sodic and a potassic alteration. Pre-classification into groups requires a good knowledge of the distribution of the data and the geochemical characteristics of the groups which is not always available. Considering the zero values equal to the limit of detection of the used equipment will generate spurious distributions, especially in ternary diagrams. Same situation will occur if we replace the zero values by a small amount using non-parametric or parametric techniques (imputation). The method that we are proposing takes into consideration the well known relationships between some elements. For example, in copper porphyry deposits, there is always a good direct correlation between the copper values and the molybdenum ones, but while copper will always be above the limit of detection, many of the molybdenum values will be “rounded zeros”. So, we will take the lower quartile of the real molybdenum values and establish a regression equation with copper, and then we will estimate the “rounded” zero values of molybdenum by their corresponding copper values. The method could be applied to any type of data, provided we establish first their correlation dependency. One of the main advantages of this method is that we do not obtain a fixed value for the “rounded zeros”, but one that depends on the value of the other variable. Key words: compositional data analysis, treatment of zeros, essential zeros, rounded zeros, correlation dependency
Resumo:
In CoDaWork’05, we presented an application of discriminant function analysis (DFA) to 4 different compositional datasets and modelled the first canonical variable using a segmented regression model solely based on an observation about the scatter plots. In this paper, multiple linear regressions are applied to different datasets to confirm the validity of our proposed model. In addition to dating the unknown tephras by calibration as discussed previously, another method of mapping the unknown tephras into samples of the reference set or missing samples in between consecutive reference samples is proposed. The application of these methodologies is demonstrated with both simulated and real datasets. This new proposed methodology provides an alternative, more acceptable approach for geologists as their focus is on mapping the unknown tephra with relevant eruptive events rather than estimating the age of unknown tephra. Kew words: Tephrochronology; Segmented regression
Resumo:
In this paper we describe a system for underwater navigation with AUVs in partially structured environments, such as dams, ports or marine platforms. An imaging sonar is used to obtain information about the location of planar structures present in such environments. This information is incorporated into a feature-based SLAM algorithm in a two step process: (I) the full 360deg sonar scan is undistorted (to compensate for vehicle motion), thresholded and segmented to determine which measurements correspond to planar environment features and which should be ignored; and (2) SLAM proceeds once the data association is obtained: both the vehicle motion and the measurements whose correct association has been previously determined are incorporated in the SLAM algorithm. This two step delayed SLAM process allows to robustly determine the feature and vehicle locations in the presence of large amounts of spurious or unrelated measurements that might correspond to boats, rocks, etc. Preliminary experiments show the viability of the proposed approach
Resumo:
Compositional data, also called multiplicative ipsative data, are common in survey research instruments in areas such as time use, budget expenditure and social networks. Compositional data are usually expressed as proportions of a total, whose sum can only be 1. Owing to their constrained nature, statistical analysis in general, and estimation of measurement quality with a confirmatory factor analysis model for multitrait-multimethod (MTMM) designs in particular are challenging tasks. Compositional data are highly non-normal, as they range within the 0-1 interval. One component can only increase if some other(s) decrease, which results in spurious negative correlations among components which cannot be accounted for by the MTMM model parameters. In this article we show how researchers can use the correlated uniqueness model for MTMM designs in order to evaluate measurement quality of compositional indicators. We suggest using the additive log ratio transformation of the data, discuss several approaches to deal with zero components and explain how the interpretation of MTMM designs di ers from the application to standard unconstrained data. We show an illustration of the method on data of social network composition expressed in percentages of partner, family, friends and other members in which we conclude that the faceto-face collection mode is generally superior to the telephone mode, although primacy e ects are higher in the face-to-face mode. Compositions of strong ties (such as partner) are measured with higher quality than those of weaker ties (such as other network members)
Resumo:
Aquesta tesi doctoral estudia diferents aspectes sobre els habitatges a la província de Girona, combinant l'anàlisi sobre l'evolució històrica dels habitatges, el fenomen de les segones residències i el mercat d'apartaments turístics. El paper de la població és el principal motor del creixement dels habitatges durant el segle XX. Tot i així, durant la segona meitat, el pes dels habitatges secundaris en zones turístiques com Costa Brava i municipis de muntanya han tingut el seu paper significatiu. Altres factors determinants en els darrers anys han estat la immigració i la disminució del tamany de les llars. Les segones residències a Girona s'ubiquen en gran part a la Costa Brava (al voltant del 75% del total a la província). S'observa un fenomen d'expansió en forma de "taca d'oli" des de la Costa Brava cap a l'interior i des de la Cerdanya cap a zones més orientals. Dins el mercat d'apartaments turístics, una sèrie de regressions hedòniques han posat de manifest les variables que més influeixen sobre el preu final del lloguer de l'habitatge turístic com el nombre d'habitacions, el tipus d'allotjament, la distància sobre la platja, el municipi d'ubicació i la temporada turística. Respecte als hotels (el mateix exercici) com a bé substitutiu destaquen les mateixes variables excepte la piscina (menys valorat) i el pàrking (més valorat).
Resumo:
El objetivo de esta tesis es predecir el rendimiento de los estudiantes de doctorado en la Universidad de Girona según características personales (background), actitudinales y de redes sociales de los estudiantes. La población estudiada son estudiantes de tercer y cuarto curso de doctorado y sus directores de tesis doctoral. Para obtener los datos se ha diseño un cuestionario web especificando sus ventajas y teniendo en cuenta algunos problemas tradicionales de no cobertura o no respuesta. El cuestionario web se hizo debido a la complejidad que comportan de las preguntas de red social. El cuestionario electrónico permite, mediante una serie de instrucciones, reducir el tiempo para responder y hacerlo menos cargado. Este cuestionario web, además es auto administrado, lo cual nos permite, según la literatura, unas respuestas mas honestas que cuestionario con encuestador. Se analiza la calidad de las preguntas de red social en cuestionario web para datos egocéntricos. Para eso se calcula la fiabilidad y la validez de este tipo de preguntas, por primera vez a través del modelo Multirasgo Multimétodo (Multitrait Multimethod). Al ser datos egocéntricos, se pueden considerar jerárquicos, y por primera vez se una un modelo Multirasgo Multimétodo Multinivel (multilevel Multitrait Multimethod). Las la fiabilidad y validez se pueden obtener a nivel individual (within group component) o a nivel de grupo (between group component) y se usan para llevar a cabo un meta-análisis con otras universidades europeas para analizar ciertas características de diseño del cuestionario. Estas características analizan si para preguntas de red social hechas en cuestionarios web son más fiables y validas hechas "by questions" o "by alters", si son presentes todas las etiquetas de frecuencia para los ítems o solo la del inicio y final, o si es mejor que el diseño del cuestionario esté en con color o blanco y negro. También se analiza la calidad de la red social en conjunto, en este caso específico son los grupos de investigación de la universidad. Se tratan los problemas de los datos ausentes en las redes completas. Se propone una nueva alternativa a la solución típica de la red egocéntrica o los respondientes proxies. Esta nueva alternativa la hemos nombrado "Nosduocentered Network" (red Nosduocentrada), se basa en dos actores centrales en una red. Estimando modelos de regresión, esta "Nosduocentered network" tiene mas poder predictivo para el rendimiento de los estudiantes de doctorado que la red egocéntrica. Además se corrigen las correlaciones de las variables actitudinales por atenuación debido al pequeño tamaño muestral. Finalmente, se hacen regresiones de los tres tipos de variables (background, actitudinales y de red social) y luego se combinan para analizar cual para predice mejor el rendimiento (según publicaciones académicas) de los estudiantes de doctorado. Los resultados nos llevan a predecir el rendimiento académico de los estudiantes de doctorado depende de variables personales (background) i actitudinales. Asimismo, se comparan los resultados obtenidos con otros estudios publicados.
Resumo:
L'Estany de Banyoles, sistema peculiar tant des del punt de vista de la seva formació geològica com de les seves característiques limnològiques, conté actualment una comunitat de peixos profundament modificada respecte de la comunitat original. La perca americana (Micropterus salmoides), introduïda a finals dels anys seixanta del segle XX, és avui una de les espècies dominants en aquesta comunitat, i ocupa sobretot l'hàbitat litoral de l'Estany. Es tracta d'una espècie molt ben estudiada a Nord Amèrica des de diverses disciplines de la biologia i des de fa diverses dècades, cosa que ha comportat que actualment es disposi d'un gran volum d'informació sobre ella. Amb tot, fora del seu continent d'origen ha rebut poca atenció, malgrat l'amplia expansió que ha experimentat arreu del món. En aquesta tesi doctoral s'han abordat, amb un enfocament descriptiu, aspectes fins ara desconeguts per a l'espècie a l'Estany de Banyoles, a la península ibèrica i fins i tot a Europa. Concretament, se n'ha analitzat la condició, el creixement i la demografia, així com les seves variacions temporals. Amb aquesta finalitat, s'ha dissenyat un mostreig composat de deu campanyes de pesca intensives més alguns petits mostrejos addicionals intercalats, mostreig que s'ha allargat des del juliol del 1997 i fins el novembre del 1999. La captura dels exemplars s'ha realitzat mitjançant una tècnica de pesca elèctrica amb una embarcació posada a punt expressament per a aquest estudi, la qual s'ha mostrat considerablement eficient malgrat les dificultats que ofereix el medi. S'ha realitzat un mostreig de marcatge-recaptura basat en la mutilació d'aletes i, en alguns casos, en el marcatge amb pintura acrílica. Només en la darrera campanya (novembre del 1999) s'ha sacrificat una part important de les captures a fi de retirar-ne els otòlits per a la determinació de l'edat. Pel que fa a l'anàlisi de les dades, s'ha aplicat un ampli ventall de mètodes i models per a cada un dels aspectes estudiats, a fi de contrastar-ne els resultats i validar-ne la seva fiabilitat. En el cas de la condició, s'han aplicat mètodes d'anàlisi de la covariància (ANCOVA) i altres mètodes anàlegs, així com, paral·lelament, regressions i anàlisis derivades a partir de la relació longitud-pes. En l'estudi del creixement, s'han realitzat ajustaments de diversos models mitjançant regressions sobre dades de mida a l'edat i sobre dades d'increments de mida observats per interval de temps. També s'han aplicat anàlisis de freqüències de longitud, i, finalment, s'han aplicat mètodes de retrocàlcul a partir dels increments anuals del radi observats en els otòlits. Finalment, en el cas de l'estudi de la demografia, s'han aplicat models de marcatge-recaptura per a l'estimació de la grandària poblacional i de la supervivència, i, a més, s'han ajustat diversos models continus de supervivència sobre aquestes estimacions prèvies. També s'han estimat les capturabilitats associades a la nova tècnica de captura. Per una altra banda, s'ha implementat i realitzat un mostreig sobre la població de pescadors esportius de l'Estany encarat a determinar, bàsicament, la pressió de pesca a què es veu sotmesa l'espècie. Els resultats mostren sobretot una alta estabilitat interanual en tots els aspectes estudiats, que s'explica per l'estabilitat ambiental que, al seu torn, és característica d'aquest ecosistema lacustre. Això reverteix en una longevitat màxima observada que iguala la màxima descrita a la literatura per a l'espècie. Alhora, també s'han descrit fortes oscil·lacions estacionals tant en la condició, com en el creixement, com també en la supervivència, les quals, però, presenten certes diferències en la seva temporalitat, cosa que indica una certa diferenciació en els factors que les regulen.