12 resultados para Statistical variance
em Universitat de Girona, Spain
Resumo:
The preceding two editions of CoDaWork included talks on the possible consideration of densities as infinite compositions: Egozcue and D´ıaz-Barrero (2003) extended the Euclidean structure of the simplex to a Hilbert space structure of the set of densities within a bounded interval, and van den Boogaart (2005) generalized this to the set of densities bounded by an arbitrary reference density. From the many variations of the Hilbert structures available, we work with three cases. For bounded variables, a basis derived from Legendre polynomials is used. For variables with a lower bound, we standardize them with respect to an exponential distribution and express their densities as coordinates in a basis derived from Laguerre polynomials. Finally, for unbounded variables, a normal distribution is used as reference, and coordinates are obtained with respect to a Hermite-polynomials-based basis. To get the coordinates, several approaches can be considered. A numerical accuracy problem occurs if one estimates the coordinates directly by using discretized scalar products. Thus we propose to use a weighted linear regression approach, where all k- order polynomials are used as predictand variables and weights are proportional to the reference density. Finally, for the case of 2-order Hermite polinomials (normal reference) and 1-order Laguerre polinomials (exponential), one can also derive the coordinates from their relationships to the classical mean and variance. Apart of these theoretical issues, this contribution focuses on the application of this theory to two main problems in sedimentary geology: the comparison of several grain size distributions, and the comparison among different rocks of the empirical distribution of a property measured on a batch of individual grains from the same rock or sediment, like their composition
Resumo:
Observations in daily practice are sometimes registered as positive values larger then a given threshold α. The sample space is in this case the interval (α,+∞), α > 0, which can be structured as a real Euclidean space in different ways. This fact opens the door to alternative statistical models depending not only on the assumed distribution function, but also on the metric which is considered as appropriate, i.e. the way differences are measured, and thus variability
Resumo:
This paper is a first draft of the principle of statistical modelling on coordinates. Several causes —which would be long to detail—have led to this situation close to the deadline for submitting papers to CODAWORK’03. The main of them is the fast development of the approach along the last months, which let appear previous drafts as obsolete. The present paper contains the essential parts of the state of the art of this approach from my point of view. I would like to acknowledge many clarifying discussions with the group of people working in this field in Girona, Barcelona, Carrick Castle, Firenze, Berlin, G¨ottingen, and Freiberg. They have given a lot of suggestions and ideas. Nevertheless, there might be still errors or unclear aspects which are exclusively my fault. I hope this contribution serves as a basis for further discussions and new developments
Resumo:
Hydrogeological research usually includes some statistical studies devised to elucidate mean background state, characterise relationships among different hydrochemical parameters, and show the influence of human activities. These goals are achieved either by means of a statistical approach or by mixing models between end-members. Compositional data analysis has proved to be effective with the first approach, but there is no commonly accepted solution to the end-member problem in a compositional framework. We present here a possible solution based on factor analysis of compositions illustrated with a case study. We find two factors on the compositional bi-plot fitting two non-centered orthogonal axes to the most representative variables. Each one of these axes defines a subcomposition, grouping those variables that lay nearest to it. With each subcomposition a log-contrast is computed and rewritten as an equilibrium equation. These two factors can be interpreted as the isometric log-ratio coordinates (ilr) of three hidden components, that can be plotted in a ternary diagram. These hidden components might be interpreted as end-members. We have analysed 14 molarities in 31 sampling stations all along the Llobregat River and its tributaries, with a monthly measure during two years. We have obtained a bi-plot with a 57% of explained total variance, from which we have extracted two factors: factor G, reflecting geological background enhanced by potash mining; and factor A, essentially controlled by urban and/or farming wastewater. Graphical representation of these two factors allows us to identify three extreme samples, corresponding to pristine waters, potash mining influence and urban sewage influence. To confirm this, we have available analysis of diffused and widespread point sources identified in the area: springs, potash mining lixiviates, sewage, and fertilisers. Each one of these sources shows a clear link with one of the extreme samples, except fertilisers due to the heterogeneity of their composition. This approach is a useful tool to distinguish end-members, and characterise them, an issue generally difficult to solve. It is worth note that the end-member composition cannot be fully estimated but only characterised through log-ratio relationships among components. Moreover, the influence of each endmember in a given sample must be evaluated in relative terms of the other samples. These limitations are intrinsic to the relative nature of compositional data
Resumo:
Most of economic literature has presented its analysis under the assumption of homogeneous capital stock. However, capital composition differs across countries. What has been the pattern of capital composition associated with World economies? We make an exploratory statistical analysis based on compositional data transformed by Aitchinson logratio transformations and we use tools for visualizing and measuring statistical estimators of association among the components. The goal is to detect distinctive patterns in the composition. As initial findings could be cited that: 1. Sectorial components behaved in a correlated way, building industries on one side and , in a less clear view, equipment industries on the other. 2. Full sample estimation shows a negative correlation between durable goods component and other buildings component and between transportation and building industries components. 3. Countries with zeros in some components are mainly low income countries at the bottom of the income category and behaved in a extreme way distorting main results observed in the full sample. 4. After removing these extreme cases, conclusions seem not very sensitive to the presence of another isolated cases
Resumo:
Several eco-toxicological studies have shown that insectivorous mammals, due to their feeding habits, easily accumulate high amounts of pollutants in relation to other mammal species. To assess the bio-accumulation levels of toxic metals and their in°uence on essential metals, we quantified the concentration of 19 elements (Ca, K, Fe, B, P, S, Na, Al, Zn, Ba, Rb, Sr, Cu, Mn, Hg, Cd, Mo, Cr and Pb) in bones of 105 greater white-toothed shrews (Crocidura russula) from a polluted (Ebro Delta) and a control (Medas Islands) area. Since chemical contents of a bio-indicator are mainly compositional data, conventional statistical analyses currently used in eco-toxicology can give misleading results. Therefore, to improve the interpretation of the data obtained, we used statistical techniques for compositional data analysis to define groups of metals and to evaluate the relationships between them, from an inter-population viewpoint. Hypothesis testing on the adequate balance-coordinates allow us to confirm intuition based hypothesis and some previous results. The main statistical goal was to test equal means of balance-coordinates for the two defined populations. After checking normality, one-way ANOVA or Mann-Whitney tests were carried out for the inter-group balances
Resumo:
The identification of compositional changes in fumarolic gases of active and quiescent volcanoes is one of the most important targets in monitoring programs. From a general point of view, many systematic (often cyclic) and random processes control the chemistry of gas discharges, making difficult to produce a convincing mathematical-statistical modelling. Changes in the chemical composition of volcanic gases sampled at Vulcano Island (Aeolian Arc, Sicily, Italy) from eight different fumaroles located in the northern sector of the summit crater (La Fossa) have been analysed by considering their dependence from time in the period 2000-2007. Each intermediate chemical composition has been considered as potentially derived from the contribution of the two temporal extremes represented by the 2000 and 2007 samples, respectively, by using inverse modelling methodologies for compositional data. Data pertaining to fumaroles F5 and F27, located on the rim and in the inner part of La Fossa crater, respectively, have been used to achieve the proposed aim. The statistical approach has allowed us to highlight the presence of random and not random fluctuations, features useful to understand how the volcanic system works, opening new perspectives in sampling strategies and in the evaluation of the natural risk related to a quiescent volcano
Resumo:
In order to obtain a high-resolution Pleistocene stratigraphy, eleven continuously cored boreholes, 100 to 220m deep were drilled in the northern part of the Po Plain by Regione Lombardia in the last five years. Quantitative provenance analysis (QPA, Weltje and von Eynatten, 2004) of Pleistocene sands was carried out by using multivariate statistical analysis (principal component analysis, PCA, and similarity analysis) on an integrated data set, including high-resolution bulk petrography and heavy-mineral analyses on Pleistocene sands and of 250 major and minor modern rivers draining the southern flank of the Alps from West to East (Garzanti et al, 2004; 2006). Prior to the onset of major Alpine glaciations, metamorphic and quartzofeldspathic detritus from the Western and Central Alps was carried from the axial belt to the Po basin longitudinally parallel to the SouthAlpine belt by a trunk river (Vezzoli and Garzanti, 2008). This scenario rapidly changed during the marine isotope stage 22 (0.87 Ma), with the onset of the first major Pleistocene glaciation in the Alps (Muttoni et al, 2003). PCA and similarity analysis from core samples show that the longitudinal trunk river at this time was shifted southward by the rapid southward and westward progradation of transverse alluvial river systems fed from the Central and Southern Alps. Sediments were transported southward by braided river systems as well as glacial sediments transported by Alpine valley glaciers invaded the alluvial plain. Kew words: Detrital modes; Modern sands; Provenance; Principal Components Analysis; Similarity, Canberra Distance; palaeodrainage
Resumo:
The performance of the SAOP potential for the calculation of NMR chemical shifts was evaluated. SAOP results show considerable improvement with respect to previous potentials, like VWN or BP86, at least for the carbon, nitrogen, oxygen, and fluorine chemical shifts. Furthermore, a few NMR calculations carried out on third period atoms (S, P, and Cl) improved when using the SAOP potential
Resumo:
ABSRACT This thesis focuses on the monitoring, fault detection and diagnosis of Wastewater Treatment Plants (WWTP), which are important fields of research for a wide range of engineering disciplines. The main objective is to evaluate and apply a novel artificial intelligent methodology based on situation assessment for monitoring and diagnosis of Sequencing Batch Reactor (SBR) operation. To this end, Multivariate Statistical Process Control (MSPC) in combination with Case-Based Reasoning (CBR) methodology was developed, which was evaluated on three different SBR (pilot and lab-scales) plants and validated on BSM1 plant layout.
Resumo:
La implementació de la Directiva Europea 91/271/CEE referent a tractament d'aigües residuals urbanes va promoure la construcció de noves instal·lacions al mateix temps que la introducció de noves tecnologies per tractar nutrients en àrees designades com a sensibles. Tant el disseny d'aquestes noves infraestructures com el redisseny de les ja existents es va portar a terme a partir d'aproximacions basades fonamentalment en objectius econòmics degut a la necessitat d'acabar les obres en un període de temps relativament curt. Aquests estudis estaven basats en coneixement heurístic o correlacions numèriques provinents de models determinístics simplificats. Així doncs, moltes de les estacions depuradores d'aigües residuals (EDARs) resultants van estar caracteritzades per una manca de robustesa i flexibilitat, poca controlabilitat, amb freqüents problemes microbiològics de separació de sòlids en el decantador secundari, elevats costos d'operació i eliminació parcial de nutrients allunyant-les de l'òptim de funcionament. Molts d'aquestes problemes van sorgir degut a un disseny inadequat, de manera que la comunitat científica es va adonar de la importància de les etapes inicials de disseny conceptual. Precisament per aquesta raó, els mètodes tradicionals de disseny han d'evolucionar cap a sistemes d'avaluació mes complexos, que tinguin en compte múltiples objectius, assegurant així un millor funcionament de la planta. Tot i la importància del disseny conceptual tenint en compte múltiples objectius, encara hi ha un buit important en la literatura científica tractant aquest camp d'investigació. L'objectiu que persegueix aquesta tesi és el de desenvolupar un mètode de disseny conceptual d'EDARs considerant múltiples objectius, de manera que serveixi d'eina de suport a la presa de decisions al seleccionar la millor alternativa entre diferents opcions de disseny. Aquest treball de recerca contribueix amb un mètode de disseny modular i evolutiu que combina diferent tècniques com: el procés de decisió jeràrquic, anàlisi multicriteri, optimació preliminar multiobjectiu basada en anàlisi de sensibilitat, tècniques d'extracció de coneixement i mineria de dades, anàlisi multivariant i anàlisi d'incertesa a partir de simulacions de Monte Carlo. Això s'ha aconseguit subdividint el mètode de disseny desenvolupat en aquesta tesis en quatre blocs principals: (1) generació jeràrquica i anàlisi multicriteri d'alternatives, (2) anàlisi de decisions crítiques, (3) anàlisi multivariant i (4) anàlisi d'incertesa. El primer dels blocs combina un procés de decisió jeràrquic amb anàlisi multicriteri. El procés de decisió jeràrquic subdivideix el disseny conceptual en una sèrie de qüestions mes fàcilment analitzables i avaluables mentre que l'anàlisi multicriteri permet la consideració de diferent objectius al mateix temps. D'aquesta manera es redueix el nombre d'alternatives a avaluar i fa que el futur disseny i operació de la planta estigui influenciat per aspectes ambientals, econòmics, tècnics i legals. Finalment aquest bloc inclou una anàlisi de sensibilitat dels pesos que proporciona informació de com varien les diferents alternatives al mateix temps que canvia la importància relativa del objectius de disseny. El segon bloc engloba tècniques d'anàlisi de sensibilitat, optimització preliminar multiobjectiu i extracció de coneixement per donar suport al disseny conceptual d'EDAR, seleccionant la millor alternativa un cop s'han identificat decisions crítiques. Les decisions crítiques són aquelles en les que s'ha de seleccionar entre alternatives que compleixen de forma similar els objectius de disseny però amb diferents implicacions pel que respecte a la futura estructura i operació de la planta. Aquest tipus d'anàlisi proporciona una visió més àmplia de l'espai de disseny i permet identificar direccions desitjables (o indesitjables) cap on el procés de disseny pot derivar. El tercer bloc de la tesi proporciona l'anàlisi multivariant de les matrius multicriteri obtingudes durant l'avaluació de les alternatives de disseny. Específicament, les tècniques utilitzades en aquest treball de recerca engloben: 1) anàlisi de conglomerats, 2) anàlisi de components principals/anàlisi factorial i 3) anàlisi discriminant. Com a resultat és possible un millor accés a les dades per realitzar la selecció de les alternatives, proporcionant més informació per a una avaluació mes efectiva, i finalment incrementant el coneixement del procés d'avaluació de les alternatives de disseny generades. En el quart i últim bloc desenvolupat en aquesta tesi, les diferents alternatives de disseny són avaluades amb incertesa. L'objectiu d'aquest bloc és el d'estudiar el canvi en la presa de decisions quan una alternativa és avaluada incloent o no incertesa en els paràmetres dels models que descriuen el seu comportament. La incertesa en el paràmetres del model s'introdueix a partir de funcions de probabilitat. Desprès es porten a terme simulacions Monte Carlo, on d'aquestes distribucions se n'extrauen números aleatoris que es subsisteixen pels paràmetres del model i permeten estudiar com la incertesa es propaga a través del model. Així és possible analitzar la variació en l'acompliment global dels objectius de disseny per a cada una de les alternatives, quines són les contribucions en aquesta variació que hi tenen els aspectes ambientals, legals, econòmics i tècnics, i finalment el canvi en la selecció d'alternatives quan hi ha una variació de la importància relativa dels objectius de disseny. En comparació amb les aproximacions tradicionals de disseny, el mètode desenvolupat en aquesta tesi adreça problemes de disseny/redisseny tenint en compte múltiples objectius i múltiples criteris. Al mateix temps, el procés de presa de decisions mostra de forma objectiva, transparent i sistemàtica el perquè una alternativa és seleccionada en front de les altres, proporcionant l'opció que més bé acompleix els objectius marcats, mostrant els punts forts i febles, les principals correlacions entre objectius i alternatives, i finalment tenint en compte la possible incertesa inherent en els paràmetres del model que es fan servir durant les anàlisis. Les possibilitats del mètode desenvolupat es demostren en aquesta tesi a partir de diferents casos d'estudi: selecció del tipus d'eliminació biològica de nitrogen (cas d'estudi # 1), optimització d'una estratègia de control (cas d'estudi # 2), redisseny d'una planta per aconseguir eliminació simultània de carboni, nitrogen i fòsfor (cas d'estudi # 3) i finalment anàlisi d'estratègies control a nivell de planta (casos d'estudi # 4 i # 5).
Resumo:
En el presente estudio se analizan los efectos de los fotoperiodos ambientales de otoño e invierno y los fotoperiodos experimentales de 24, 12 y 0 horas de luz artificial sobre la calidad del semen de machos reproductores porcinos de raza Landrace. El estudio se realizó sobre 30 machos postpuberales de 8 meses de edad y testados con el fin de comprobar la homogeneidad. Los machos fueron distribuidos aleatóriamente en los 3 grupos de luz artificial durante 3 meses. El tratamiento de 12 horas de luz artificial fue considerado como grupo control. Previamente al inicio de cada tratamiento, se sometió a cada grupo de machos al fotoperiodo ambiental correspondiente a la época del año; así, se caracterizó también la calidad seminal en otoño e invierno, manteniendo la temperatura constante. La nave experimental que acogió a los machos tiene una superficie de 100 m2 y una altura de 3,5 m. Un pasillo central divide la nave en dos hileras de 5 y 6 celdas respectivamente. En una de las celdas pequeñas se instaló el maniquí y fue utilizada para las extracciones de semen. La iluminación artificial se consiguió con la instalación de 6 lámparas fluorescentes en el techo del pasillo central que proporcionaron una luz homogénea superior a 200 lux. Así mismo, la nave se mantuvo en todo momento a 21±1ºC y la humedad relativa osciló entre el 60-75%. A todos los verracos se les proporcionó una dieta nutritiva y equilibrada y se les sometió a un regimen de extracciones de semen de 2 veces por semana, habiendo sido previamente entrenados en la monta del maniquí. Les muestras de semen fueron recogidas según la técnica de la mano enguantada (Martín, 1982; Daza, 1992) y se analizaron los siguientes parámetros: el volumen y el pH seminales, la concentración, la vitalidad y la motilidad espermáticas, la resistencia acrosómica de los espermatozoides, la morfología espermàtica a partir de la frecuencia de los espermatozoides maduros, inmaduros y aberrantes, la producción testicular y el número de dosis seminales. Se analizó, además, bioquímicamente el plasma seminal al principio y al final de cada tratamiento experimental de luz artificial a partir de la concentración de proteína total, de la identificación de residuos fosforilados de proteína y del contenido de azúcares. También se determinaron los índices de fertilidad y prolificidad. El volumen y el pH de los eyaculados se utilizaron como marcadores del estado funcional de las glándulas sexuales accesorias; la concentración espermàtica como un indicador de la actividad testicular (Pinart y col., 1999). La vitalidad y la motilidad espermáticas fueron estimadores del grado de diferenciación del espermatozoide tanto a nivel testicular como epididimario; la resistencia acrosómica fue utilizada para valorar el nivel de diferenciación de la membrana acrosómica durante la espermiogénesis y/o maduración epididimària (Briz i col., 1996; Pinart i col., 1999). Referente a la morfología espermática, los espermatozoides inmaduros fueron marcadores de anomalías en la maduración de éstos a lo largo del conducto epididimario y los espermatozoides aberrantes se utilizaron como marcadores de una diferenciación defectuosa a nivel de testículo (anomalías primarias) y a nivel de conducto epididimario (anomalías secundarias) (Briz i col., 1996). La concentración de proteína total se utilizó para valorar la integridad funcional de las membranas del espermatozoide y la actividad de las glándulas sexuales accesorias. La identificación de proteínas con residuos de tirosina fosforilados fue un estimador de la viabilidad celular y la actividad de las glándulas sexuales, y el contenido de azúcares como un indicador de la producción de las vesículas seminales. La determinación del volumen y el pH de los eyaculados se realizó en las instalaciones de la granja a partir de semen fresco el mismo día de la extracción. El resto de parámetros se analizaron en el laboratorio durante las 48 horas posteriores a la extracción a partir de semen diluido en BTS (diluyente de Bestville) (Daza, 1992) y transportado y conservado a 15ºC. Las muestras fueron previamente filtradas con el fin de eliminar la tapioca. El estudio estadístico de los resultados obtenidos se realizó a partir del análisis de la varianza (ANOVA) con un nivel de significación de =0,05. En cuanto al estudio comparativo de los fotoperiodos ambientales estacionales se ha observado un incremento significativo del pH del eyaculado en los machos expuestos a otoño (P0,0001), mientras que el volumen seminal se mantiene en valores similares en ambos tratamientos (P=0,1650). La concentración espermàtica, la producción espermàtica y el número de dosis seminales que se pueden preparar a partir de un eyaculado se duplica en los verracos sometidos al fotoperiodo de primavera (P0,0001). La vitalidad y la motilidad espermáticas no experimentan cambios significativos entre tratamientos (P=0,3440 y P=0,9220, respectivamente). La resistencia osmótica de los acrosomas desciende únicamente en los machos expuestos a condiciones estacionales de otoño (P0,0001). En referencia a la morfología espermàtica aunque no se observan diferencias entre primavera y otoño (P0,05), sí se detecta un incremento de los porcentajes de espermatozoides inmaduros y aberrantes en ambos fotoperiodos estacionales, y en especial en los machos expuestos a condiciones fotoperiódicas de otoño. Según los resultados obtenidos en este estudio la calidad seminal de los verracos es inferior en el fotoperiodo de otoño debido a un descenso de la concentración y la producción espermáticas, un aumento del pH seminal, una disminución de la resistencia de la membrana acrosómica y a un incremento en la frecuencia de espermatozoides inmaduros y aberrantes. Parece ser, pues, que en el otoño tiene lugar la disminución de la producción testicular, cambios en la actividad de las glándulas sexuales accesorias y disfunciones en el proceso de diferenciación testicular y epididimària de los espermatozoides y especialmente del acrosoma. En relación a los resultados obtenidos en el estudio de los diferentes fotoperiodos artificiales se observa que la iluminación continua provoca un aumento significativo del volumen del eyaculado en el primer y segundo mes de tratamiento (P0,0001), disminuyendo en el tercer mes. La oscuridad absoluta no modifica este parámetro (P0,05). En cuanto al pH seminal la iluminación continua provoca un incremento progresivo del valor del pH a lo largo del periodo experimental (P0,0001), mientras que la oscuridad absoluta tiene un efecto más irregular. La exposición de los machos a iluminación continua y a oscuridad absoluta se manifiesta en un descenso de la concentración y la producción espermáticas que se mantiene hasta el segundo mes de tratamiento (P0,0001), observándose un incremento en el tercer mes de exposición de los machos a oscuridad absoluta (P=0,1010). De todas maneras, este descenso es mas severo en los machos sometidos a iluminación continua ya que no presentan recuperación. La vitalidad y la motilidad espermáticas no se ven alteradas por la iluminación continua y la oscuridad absoluta, ni tampoco el contenido de los azúcares mayoritarios del plasma seminal (P0,005). La glucosa aparece como un azúcar minoritario y sí que presenta concentraciones inferiores en los tratamientos experimentales de luz continua y de oscuridad absoluta (P0,0001 y P=0,0002, respectivamente). La resistencia osmótica de los acrosomas desciende en ambos tratamientos artificiales extremos de luz continua y oscuridad total (P0,0001), aunque en los machos expuestos a iluminación continua se produce una recuperación a partir del segundo mes de tratamiento (P=0,4930). Dado que tampoco se han observado diferencias significativas en las concentraciones de proteína total (P0,05), es probable que las anomalías de la membrana acrosómica se originen durante el proceso de espermiogénesis y/o maduración epididimària. La exposición de los verracos a oscuridad absoluta no altera la morfología espermàtica de los eyaculados, aunque se observa un aumento de la frecuencia de espermatozoides con anomalías en la forma de la cola en el primer mes (P0,0001), y un aumento de la frecuencia de espermatozoides inmaduros con gota distal y de espermatozoides con anomalías en el número de colas en el tercer mes de experimentación (P=0,0030 y P0,0001). La luz continua, sin embargo, provoca un incremento de la frecuencia de espermatozoides inmaduros con gota distal (P0,0001) y de espermatozoides con anomalías en la forma de la cola (P=0,0040) ya en el primer mes. El fotoperiodo provoca un descenso de la fertilidad de los machos expuestos a oscuridad absoluta en el tercer mes de tratamiento (P0,0001) y un incremento de ésta en los machos sometidos a iluminación continua (P=0,0005). La prolificidad no se ve modificada por ambas condiciones extremas de luz artificial (P0,05). Así pues, los resultados obtenidos demuestran que el fotoperiodo afecta la actividad testicular, provoca alteraciones en la actividad de las glándulas sexuales accesorias, altera el proceso de expulsión de la gota citoplasmática y provoca anomalías en el proceso de diferenciación de la cola tanto a nivel testicular como epididimario, siendo los verracos expuestos a luz continua más sensibles a estos parámetros que los verracos sometidos a oscuridad absoluta. El fotoperiodo, sin embargo, no altera de forma esencial la integridad de las membranas del espermatozoide ni la capacidad fecundante de éste.