29 resultados para Mixed Type Variables Clustering
em Universidad Politécnica de Madrid
Resumo:
Esta tesis doctoral tiene como objeto el acercamiento histórico-constructivo a la realidad material de las fortificaciones edificadas en el centro de la Península Ibérica durante los primeros siglos de la Edad Media. El marco geográfico se extiende desde el cauce del río Duero, delimitado por los valles de sus afluentes, el Duratón, al oeste, y el Escalote al este, hasta las cumbres del Sistema Central oriental en su entronque con el Ibérico, para descender por la falda sur de la sierra hasta los valles altos del Lozoya, Jarama y Henares. Siguiendo las demarcaciones actuales, el marco de estudio ocupa parcialmente las provincias de Soria, Guadalajara, Madrid, Segovia, Burgos y Valladolid. Desde un punto de vista cronológico, el espacio temporal se inicia con la conquista musulmana de la Península Ibérica de 711 y culmina con la incorporación definitiva al reino de Castilla de las zonas estudiadas, en torno al año 1150. Se trata de un espacio de transición, tanto desde el punto de vista social como ecológico. Los territorios al sur de la sierra correspondían a los confines septentrionales de la Marca Media de al-Andalus, mientras que la falta norte, los extrema durii, fueron un territorio escasamente poblado y desorganizado, foco de la expansión de los reinos de León y Castilla y zona de conflicto con al-Andalus a principios del siglo X. Un territorio tan amplio y heterogéneo, unido a una compleja evolución histórica y social y la parquedad de las fuentes escritas, ha necesitado de un acercamiento con una metodología de tipo mixto, en la que han convergido las técnicas propias de la documentación histórica, de la arqueología y de la historia de la construcción. Esta metodología parte de un exhaustivo vaciado bibliográfico, tras lo cual se planteó una prospección arqueológica dirigida que permitió realizar un catálogo de elementos fortificados en el área de estudio susceptibles de contener fases altomedievales. Sobre cada uno de los elementos localizados se realizó una toma de datos de tipo gráfico métrico y constructivo. Cruzando los datos recabados en cada edificio con técnicas propias de la estratigrafía e historia de la construcción se identificaron y aislaron las fases de la cronología analizada. Entre las fortificaciones que evidenciaron fases altomedievales y atendiendo a su singularidad, representatividad y calidad estratigráfica se ha profundizado en el análisis de nueve casos de estudio: el conjunto fortificado de Atienza, el castillo de Cogolludo, el recinto amurallado de Buitrago de Lozoya, el castillo de Caracena, la iglesia parroquial de la Inmaculada Concepción de Mezquetillas, la alcazaba de Gormaz, la torre de San Andrés de Sepúlveda, la iglesia parroquial de San Miguel de Ayllón y la fortificación rupestre de Alcolea de las Peñas. La investigación ha servido para dos fines principales. El primero se centra en el aspecto material. En este sentido no solo se ha identificado la presencia o ausencia de fases altomedievales en cado uno de los edificio lo que ha permitido realizar una lectura territorial, la caracterización de las diferentes técnicas y materiales constructivos y valorar la posibilidad de establecer una cronotipología. El segundo se centra en aspectos históricos y sociales. La vinculación de estos restos materiales con la documentación histórica ha devenido en un medio para conocer la historia de las gentes que construyeron estos edificios, la motivación que les llevó a emprender tales proyectos, así como el contexto en el que cada una de estas fortificaciones desempeñó las funciones para las que fue creada. Este estudio ha puesto de manifiesto la ruptura que supuso la ocupación estatal de esta zona por parte del ejército cordobés desde mediados del siglo X, tanto desde el punto de vista social como constructivo. Se ha podido documentar materialmente esta ocupación tras la restauración de Medinaceli, en torno a 946, y la sucedida tras la toma de Sepúlveda por parte de Almanzor en 984, diferenciándose claramente las técnicas constructivas propias de este momento, ejecutadas directamente por talleres foráneos, procedentes de Córdoba y Toledo. La posición estratigráfica de estas fábricas diagnósticas ha permito identificar fases constructivas inmediatamente anteriores y posteriores a este momento. También se ha podido comprobar la hipótesis inicial en relación a la pérdida de conocimientos constructivos durante el final de la Antigüedad y los primeros siglos del medievo en la zona estudiada. La sillería y la explotación de canteras, así como el ciclo productivo del ladrillo por completo, son recuperados sin recurrir a un sustrato tecnológico local, propiciados de manera efímera por la ocupación califal. Cuando se produce el desmembramiento del califato a partir del año 1010 estas técnicas se vuelven a abandonar. A finales del siglo XI y principios del siglo XII se produce un nuevo cambio en la construcción, recuperándose de nuevo estas técnicas de la mano del románico y del establecimiento de la red parroquial diocesana. En una zona y periodo histórico apenas explotado por la investigación, esta tesis doctoral busca no solo establecer una metodología de trabajo sino sentar las bases para futuros estudios, tanto desde el punto de vista particular, profundizando en el estudio constructivo y estratigráfico de cada uno de los elementos recogidos, como en otros aspectos más trasversales. ABSTRACT This doctoral thesis has a constructive historical material approach to the reality of the fortifications built in the center of the Iberian Peninsula during the first centuries of the middle Ages. The geographical framework extends from the Duero´s riverbed, bounded by the valleys of its tributaries, the Duratón on the west, and the Escalote on the east, until to the peaks of the eastern Central System at its connection with the Iberian, to descend the hillside of the mountain range to the high valleys of Lozoya, Jarama and Henares. Following the current demarcations under this framework study, partially cover the provinces of Soria, Guadalajara, Madrid, Segovia, Burgos and Valladolid. From a chronological point of view, the temporal space began with the Muslim conquest of the Iberian Peninsula in 711 A.D and ends with the final incorporation into the Kingdom of Castile in the studied areas, around the year 1150 A.D. It is a transitional gathering point, both socially and ecologically. The southern territories of the Sierra or mountain range corresponded to the northern boundaries of the Middle mark of al- Andalus , while the northern missing, the extrema Durii , were a disorganized sparsely populated territory and point of the expansion of the kingdoms of Leon and Castile and zone of conflict with al- Andalus at the beginning of the tenth century. Such a wide and diverse territory, connected with a complex historical, social evolution and the lack of written sources , has required an approach with a mixed type methodology, which have converged the techniques of historical documentation of the archeology and building history. This methodology comes from a comprehensive bibliographic study, after which an archaeological survey was directed that allowed building a fortified elements ‘catalog in the study area likely to contain high medieval period phases were raised. On each of the elements located one metric data collection and constructive graphic type was performed. Checking against the data collected in each building with its own history of stratigraphy and construction techniques and finally, they were identified and isolated the timing analysis phases. Among the early medieval fortifications that showed high period Medieval phases and according to its uniqueness , representativeness and stratigraphy’s quality of the nine case studies : the fortified complex of Atienza, Cogolludo Castle, the Buitrago de Lozoya´s walled enclosure , the Caracena´s castle , the Mezquetillas´ parish church, the Gormaz´s fortress, the San Andres toser in Sepulveda, the church of San Miguel de Ayllón and the Alcolea de las Peñas´ rock fortress. This research study has served two main purposes. The first focuses on the material side. In this sense it does not only identified the presence or absence of early medieval period phases in each one of the building, which has allowed a territorial reading and the characterization of the different construction techniques and materials, but it also assess the possibility of establishing a chrono–typology. The second focuses on historical and social aspects. The bound of these materials remains with the historical documentation has become a means to know the history of the people who built these buildings, the motivation that led them to undertake such projects as well as the context in which each of these fortifications played the functions for which it was created. This study has revealed the breach that led to the state occupation of the Cordovan army in this area by since mid-tenth century, from the social point of view and also from the structural one. It has been materially document this occupation after the restoration of Medinaceli, around 946, and succeeded after taking Sepulveda by Almanzor in 984, clearly differentiating their own building techniques currently implemented directly by foreign workshops, from Cordova and Toledo. The stratigraphic position of these factories has made it possible to identify earlier and later construction phases at this time. It has also been able to verify the initial hypothesis in relation with constructive knowledge loss during late antiquity and early medieval centuries in the studied area. Also ashlar, masonries as well as the brick production is recovered without resorting to a local technological substrate, fleetingly brought about by the Caliphate occupation. When the dismemberment of the Caliphate is produced from the year 1010 these techniques were abandoned again. In the late eleventh and early twelfth century these techniques are recovered from Romanesque and a new change came, also from the establishment of the diocesan parish network. In one historical period that has been hardly exploited by research, this thesis seeks not only to establish a working methodology but lay the groundwork for future studies, both from the particular point of view, paying special attention in the constructive and stratigraphic studies of each of the evidence collected , and additionally in other more transversal aspects.
Resumo:
Neuronal morphology is a key feature in the study of brain circuits, as it is highly related to information processing and functional identification. Neuronal morphology affects the process of integration of inputs from other neurons and determines the neurons which receive the output of the neurons. Different parts of the neurons can operate semi-independently according to the spatial location of the synaptic connections. As a result, there is considerable interest in the analysis of the microanatomy of nervous cells since it constitutes an excellent tool for better understanding cortical function. However, the morphologies, molecular features and electrophysiological properties of neuronal cells are extremely variable. Except for some special cases, this variability makes it hard to find a set of features that unambiguously define a neuronal type. In addition, there are distinct types of neurons in particular regions of the brain. This morphological variability makes the analysis and modeling of neuronal morphology a challenge. Uncertainty is a key feature in many complex real-world problems. Probability theory provides a framework for modeling and reasoning with uncertainty. Probabilistic graphical models combine statistical theory and graph theory to provide a tool for managing domains with uncertainty. In particular, we focus on Bayesian networks, the most commonly used probabilistic graphical model. In this dissertation, we design new methods for learning Bayesian networks and apply them to the problem of modeling and analyzing morphological data from neurons. The morphology of a neuron can be quantified using a number of measurements, e.g., the length of the dendrites and the axon, the number of bifurcations, the direction of the dendrites and the axon, etc. These measurements can be modeled as discrete or continuous data. The continuous data can be linear (e.g., the length or the width of a dendrite) or directional (e.g., the direction of the axon). These data may follow complex probability distributions and may not fit any known parametric distribution. Modeling this kind of problems using hybrid Bayesian networks with discrete, linear and directional variables poses a number of challenges regarding learning from data, inference, etc. In this dissertation, we propose a method for modeling and simulating basal dendritic trees from pyramidal neurons using Bayesian networks to capture the interactions between the variables in the problem domain. A complete set of variables is measured from the dendrites, and a learning algorithm is applied to find the structure and estimate the parameters of the probability distributions included in the Bayesian networks. Then, a simulation algorithm is used to build the virtual dendrites by sampling values from the Bayesian networks, and a thorough evaluation is performed to show the model’s ability to generate realistic dendrites. In this first approach, the variables are discretized so that discrete Bayesian networks can be learned and simulated. Then, we address the problem of learning hybrid Bayesian networks with different kinds of variables. Mixtures of polynomials have been proposed as a way of representing probability densities in hybrid Bayesian networks. We present a method for learning mixtures of polynomials approximations of one-dimensional, multidimensional and conditional probability densities from data. The method is based on basis spline interpolation, where a density is approximated as a linear combination of basis splines. The proposed algorithms are evaluated using artificial datasets. We also use the proposed methods as a non-parametric density estimation technique in Bayesian network classifiers. Next, we address the problem of including directional data in Bayesian networks. These data have some special properties that rule out the use of classical statistics. Therefore, different distributions and statistics, such as the univariate von Mises and the multivariate von Mises–Fisher distributions, should be used to deal with this kind of information. In particular, we extend the naive Bayes classifier to the case where the conditional probability distributions of the predictive variables given the class follow either of these distributions. We consider the simple scenario, where only directional predictive variables are used, and the hybrid case, where discrete, Gaussian and directional distributions are mixed. The classifier decision functions and their decision surfaces are studied at length. Artificial examples are used to illustrate the behavior of the classifiers. The proposed classifiers are empirically evaluated over real datasets. We also study the problem of interneuron classification. An extensive group of experts is asked to classify a set of neurons according to their most prominent anatomical features. A web application is developed to retrieve the experts’ classifications. We compute agreement measures to analyze the consensus between the experts when classifying the neurons. Using Bayesian networks and clustering algorithms on the resulting data, we investigate the suitability of the anatomical terms and neuron types commonly used in the literature. Additionally, we apply supervised learning approaches to automatically classify interneurons using the values of their morphological measurements. Then, a methodology for building a model which captures the opinions of all the experts is presented. First, one Bayesian network is learned for each expert, and we propose an algorithm for clustering Bayesian networks corresponding to experts with similar behaviors. Then, a Bayesian network which represents the opinions of each group of experts is induced. Finally, a consensus Bayesian multinet which models the opinions of the whole group of experts is built. A thorough analysis of the consensus model identifies different behaviors between the experts when classifying the interneurons in the experiment. A set of characterizing morphological traits for the neuronal types can be defined by performing inference in the Bayesian multinet. These findings are used to validate the model and to gain some insights into neuron morphology. Finally, we study a classification problem where the true class label of the training instances is not known. Instead, a set of class labels is available for each instance. This is inspired by the neuron classification problem, where a group of experts is asked to individually provide a class label for each instance. We propose a novel approach for learning Bayesian networks using count vectors which represent the number of experts who selected each class label for each instance. These Bayesian networks are evaluated using artificial datasets from supervised learning problems. Resumen La morfología neuronal es una característica clave en el estudio de los circuitos cerebrales, ya que está altamente relacionada con el procesado de información y con los roles funcionales. La morfología neuronal afecta al proceso de integración de las señales de entrada y determina las neuronas que reciben las salidas de otras neuronas. Las diferentes partes de la neurona pueden operar de forma semi-independiente de acuerdo a la localización espacial de las conexiones sinápticas. Por tanto, existe un interés considerable en el análisis de la microanatomía de las células nerviosas, ya que constituye una excelente herramienta para comprender mejor el funcionamiento de la corteza cerebral. Sin embargo, las propiedades morfológicas, moleculares y electrofisiológicas de las células neuronales son extremadamente variables. Excepto en algunos casos especiales, esta variabilidad morfológica dificulta la definición de un conjunto de características que distingan claramente un tipo neuronal. Además, existen diferentes tipos de neuronas en regiones particulares del cerebro. La variabilidad neuronal hace que el análisis y el modelado de la morfología neuronal sean un importante reto científico. La incertidumbre es una propiedad clave en muchos problemas reales. La teoría de la probabilidad proporciona un marco para modelar y razonar bajo incertidumbre. Los modelos gráficos probabilísticos combinan la teoría estadística y la teoría de grafos con el objetivo de proporcionar una herramienta con la que trabajar bajo incertidumbre. En particular, nos centraremos en las redes bayesianas, el modelo más utilizado dentro de los modelos gráficos probabilísticos. En esta tesis hemos diseñado nuevos métodos para aprender redes bayesianas, inspirados por y aplicados al problema del modelado y análisis de datos morfológicos de neuronas. La morfología de una neurona puede ser cuantificada usando una serie de medidas, por ejemplo, la longitud de las dendritas y el axón, el número de bifurcaciones, la dirección de las dendritas y el axón, etc. Estas medidas pueden ser modeladas como datos continuos o discretos. A su vez, los datos continuos pueden ser lineales (por ejemplo, la longitud o la anchura de una dendrita) o direccionales (por ejemplo, la dirección del axón). Estos datos pueden llegar a seguir distribuciones de probabilidad muy complejas y pueden no ajustarse a ninguna distribución paramétrica conocida. El modelado de este tipo de problemas con redes bayesianas híbridas incluyendo variables discretas, lineales y direccionales presenta una serie de retos en relación al aprendizaje a partir de datos, la inferencia, etc. En esta tesis se propone un método para modelar y simular árboles dendríticos basales de neuronas piramidales usando redes bayesianas para capturar las interacciones entre las variables del problema. Para ello, se mide un amplio conjunto de variables de las dendritas y se aplica un algoritmo de aprendizaje con el que se aprende la estructura y se estiman los parámetros de las distribuciones de probabilidad que constituyen las redes bayesianas. Después, se usa un algoritmo de simulación para construir dendritas virtuales mediante el muestreo de valores de las redes bayesianas. Finalmente, se lleva a cabo una profunda evaluaci ón para verificar la capacidad del modelo a la hora de generar dendritas realistas. En esta primera aproximación, las variables fueron discretizadas para poder aprender y muestrear las redes bayesianas. A continuación, se aborda el problema del aprendizaje de redes bayesianas con diferentes tipos de variables. Las mixturas de polinomios constituyen un método para representar densidades de probabilidad en redes bayesianas híbridas. Presentamos un método para aprender aproximaciones de densidades unidimensionales, multidimensionales y condicionales a partir de datos utilizando mixturas de polinomios. El método se basa en interpolación con splines, que aproxima una densidad como una combinación lineal de splines. Los algoritmos propuestos se evalúan utilizando bases de datos artificiales. Además, las mixturas de polinomios son utilizadas como un método no paramétrico de estimación de densidades para clasificadores basados en redes bayesianas. Después, se estudia el problema de incluir información direccional en redes bayesianas. Este tipo de datos presenta una serie de características especiales que impiden el uso de las técnicas estadísticas clásicas. Por ello, para manejar este tipo de información se deben usar estadísticos y distribuciones de probabilidad específicos, como la distribución univariante von Mises y la distribución multivariante von Mises–Fisher. En concreto, en esta tesis extendemos el clasificador naive Bayes al caso en el que las distribuciones de probabilidad condicionada de las variables predictoras dada la clase siguen alguna de estas distribuciones. Se estudia el caso base, en el que sólo se utilizan variables direccionales, y el caso híbrido, en el que variables discretas, lineales y direccionales aparecen mezcladas. También se estudian los clasificadores desde un punto de vista teórico, derivando sus funciones de decisión y las superficies de decisión asociadas. El comportamiento de los clasificadores se ilustra utilizando bases de datos artificiales. Además, los clasificadores son evaluados empíricamente utilizando bases de datos reales. También se estudia el problema de la clasificación de interneuronas. Desarrollamos una aplicación web que permite a un grupo de expertos clasificar un conjunto de neuronas de acuerdo a sus características morfológicas más destacadas. Se utilizan medidas de concordancia para analizar el consenso entre los expertos a la hora de clasificar las neuronas. Se investiga la idoneidad de los términos anatómicos y de los tipos neuronales utilizados frecuentemente en la literatura a través del análisis de redes bayesianas y la aplicación de algoritmos de clustering. Además, se aplican técnicas de aprendizaje supervisado con el objetivo de clasificar de forma automática las interneuronas a partir de sus valores morfológicos. A continuación, se presenta una metodología para construir un modelo que captura las opiniones de todos los expertos. Primero, se genera una red bayesiana para cada experto y se propone un algoritmo para agrupar las redes bayesianas que se corresponden con expertos con comportamientos similares. Después, se induce una red bayesiana que modela la opinión de cada grupo de expertos. Por último, se construye una multired bayesiana que modela las opiniones del conjunto completo de expertos. El análisis del modelo consensuado permite identificar diferentes comportamientos entre los expertos a la hora de clasificar las neuronas. Además, permite extraer un conjunto de características morfológicas relevantes para cada uno de los tipos neuronales mediante inferencia con la multired bayesiana. Estos descubrimientos se utilizan para validar el modelo y constituyen información relevante acerca de la morfología neuronal. Por último, se estudia un problema de clasificación en el que la etiqueta de clase de los datos de entrenamiento es incierta. En cambio, disponemos de un conjunto de etiquetas para cada instancia. Este problema está inspirado en el problema de la clasificación de neuronas, en el que un grupo de expertos proporciona una etiqueta de clase para cada instancia de manera individual. Se propone un método para aprender redes bayesianas utilizando vectores de cuentas, que representan el número de expertos que seleccionan cada etiqueta de clase para cada instancia. Estas redes bayesianas se evalúan utilizando bases de datos artificiales de problemas de aprendizaje supervisado.
Resumo:
Objectives: A recently introduced pragmatic scheme promises to be a useful catalog of interneuron names.We sought to automatically classify digitally reconstructed interneuronal morphologies according tothis scheme. Simultaneously, we sought to discover possible subtypes of these types that might emergeduring automatic classification (clustering). We also investigated which morphometric properties weremost relevant for this classification.Materials and methods: A set of 118 digitally reconstructed interneuronal morphologies classified into thecommon basket (CB), horse-tail (HT), large basket (LB), and Martinotti (MA) interneuron types by 42 of theworld?s leading neuroscientists, quantified by five simple morphometric properties of the axon and fourof the dendrites. We labeled each neuron with the type most commonly assigned to it by the experts. Wethen removed this class information for each type separately, and applied semi-supervised clustering tothose cells (keeping the others? cluster membership fixed), to assess separation from other types and lookfor the formation of new groups (subtypes). We performed this same experiment unlabeling the cells oftwo types at a time, and of half the cells of a single type at a time. The clustering model is a finite mixtureof Gaussians which we adapted for the estimation of local (per-cluster) feature relevance. We performedthe described experiments on three different subsets of the data, formed according to how many expertsagreed on type membership: at least 18 experts (the full data set), at least 21 (73 neurons), and at least26 (47 neurons).Results: Interneurons with more reliable type labels were classified more accurately. We classified HTcells with 100% accuracy, MA cells with 73% accuracy, and CB and LB cells with 56% and 58% accuracy,respectively. We identified three subtypes of the MA type, one subtype of CB and LB types each, andno subtypes of HT (it was a single, homogeneous type). We got maximum (adapted) Silhouette widthand ARI values of 1, 0.83, 0.79, and 0.42, when unlabeling the HT, CB, LB, and MA types, respectively,confirming the quality of the formed cluster solutions. The subtypes identified when unlabeling a singletype also emerged when unlabeling two types at a time, confirming their validity. Axonal morphometricproperties were more relevant that dendritic ones, with the axonal polar histogram length in the [pi, 2pi) angle interval being particularly useful.Conclusions: The applied semi-supervised clustering method can accurately discriminate among CB, HT, LB, and MA interneuron types while discovering potential subtypes, and is therefore useful for neuronal classification. The discovery of potential subtypes suggests that some of these types are more heteroge-neous that previously thought. Finally, axonal variables seem to be more relevant than dendritic ones fordistinguishing among the CB, HT, LB, and MA interneuron types.
Resumo:
La relación entre la estructura urbana y la movilidad ha sido estudiada desde hace más de 70 años. El entorno urbano incluye múltiples dimensiones como por ejemplo: la estructura urbana, los usos de suelo, la distribución de instalaciones diversas (comercios, escuelas y zonas de restauración, parking, etc.). Al realizar una revisión de la literatura existente en este contexto, se encuentran distintos análisis, metodologías, escalas geográficas y dimensiones, tanto de la movilidad como de la estructura urbana. En este sentido, se trata de una relación muy estudiada pero muy compleja, sobre la que no existe hasta el momento un consenso sobre qué dimensión del entorno urbano influye sobre qué dimensión de la movilidad, y cuál es la manera apropiada de representar esta relación. Con el propósito de contestar estas preguntas investigación, la presente tesis tiene los siguientes objetivos generales: (1) Contribuir al mejor entendimiento de la compleja relación estructura urbana y movilidad. y (2) Entender el rol de los atributos latentes en la relación entorno urbano y movilidad. El objetivo específico de la tesis es analizar la influencia del entorno urbano sobre dos dimensiones de la movilidad: número de viajes y tipo de tour. Vista la complejidad de la relación entorno urbano y movilidad, se pretende contribuir al mejor entendimiento de la relación a través de la utilización de 3 escalas geográficas de las variables y del análisis de la influencia de efectos inobservados en la movilidad. Para el análisis se utiliza una base de datos conformada por tres tipos de datos: (1) Una encuesta de movilidad realizada durante los años 2006 y 2007. Se obtuvo un total de 943 encuestas, en 3 barrios de Madrid: Chamberí, Pozuelo y Algete. (2) Información municipal del Instituto Nacional de Estadística: dicha información se encuentra enlazada con los orígenes y destinos de los viajes recogidos en la encuesta. Y (3) Información georeferenciada en Arc-GIS de los hogares participantes en la encuesta: la base de datos contiene información respecto a la estructura de las calles, localización de escuelas, parking, centros médicos y lugares de restauración. Se analizó la correlación entre e intra-grupos y se modelizaron 4 casos de atributos bajo la estructura ordinal logit. Posteriormente se evalúa la auto-selección a través de la estimación conjunta de las elecciones de tipo de barrio y número de viajes. La elección del tipo de barrio consta de 3 alternativas: CBD, Urban y Suburban, según la zona de residencia recogida en las encuestas. Mientras que la elección del número de viajes consta de 4 categorías ordinales: 0 viajes, 1-2 viajes, 3-4 viajes y 5 o más viajes. A partir de la mejor especificación del modelo ordinal logit. Se desarrolló un modelo joint mixed-ordinal conjunto. Los resultados indican que las variables exógenas requieren un análisis exhaustivo de correlaciones con el fin de evitar resultados sesgados. ha determinado que es importante medir los atributos del BE donde se realiza el viaje, pero también la información municipal es muy explicativa de la movilidad individual. Por tanto, la percepción de las zonas de destino a nivel municipal es considerada importante. En el contexto de la Auto-selección (self-selection) es importante modelizar conjuntamente las decisiones. La Auto-selección existe, puesto que los parámetros estimados conjuntamente son significativos. Sin embargo, sólo ciertos atributos del entorno urbano son igualmente importantes sobre la elección de la zona de residencia y frecuencia de viajes. Para analizar la Propensión al Viaje, se desarrolló un modelo híbrido, formado por: una variable latente, un indicador y un modelo de elección discreta. La variable latente se denomina “Propensión al Viaje”, cuyo indicador en ecuación de medida es el número de viajes; la elección discreta es el tipo de tour. El modelo de elección consiste en 5 alternativas, según la jerarquía de actividades establecida en la tesis: HOME, no realiza viajes durante el día de estudio, HWH tour cuya actividad principal es el trabajo o estudios, y no se realizan paradas intermedias; HWHs tour si el individuo reaiza paradas intermedias; HOH tour cuya actividad principal es distinta a trabajo y estudios, y no se realizan paradas intermedias; HOHs donde se realizan paradas intermedias. Para llegar a la mejor especificación del modelo, se realizó un trabajo importante considerando diferentes estructuras de modelos y tres tipos de estimaciones. De tal manera, se obtuvieron parámetros consistentes y eficientes. Los resultados muestran que la modelización de los tours, representa una ventaja sobre la modelización de los viajes, puesto que supera las limitaciones de espacio y tiempo, enlazando los viajes realizados por la misma persona en el día de estudio. La propensión al viaje (PT) existe y es específica para cada tipo de tour. Los parámetros estimados en el modelo híbrido resultaron significativos y distintos para cada alternativa de tipo de tour. Por último, en la tesis se verifica que los modelos híbridos representan una mejora sobre los modelos tradicionales de elección discreta, dando como resultado parámetros consistentes y más robustos. En cuanto a políticas de transporte, se ha demostrado que los atributos del entorno urbano son más importantes que los LOS (Level of Service) en la generación de tours multi-etapas. la presente tesis representa el primer análisis empírico de la relación entre los tipos de tours y la propensión al viaje. El concepto Propensity to Travel ha sido desarrollado exclusivamente para la tesis. Igualmente, el desarrollo de un modelo conjunto RC-Number of trips basado en tres escalas de medida representa innovación en cuanto a la comparación de las escalas geográficas, que no había sido hecha en la modelización de la self-selection. The relationship between built environment (BE) and travel behaviour (TB) has been studied in a number of cases, using several methods - aggregate and disaggregate approaches - and different focuses – trip frequency, automobile use, and vehicle miles travelled and so on. Definitely, travel is generated by the need to undertake activities and obtain services, and there is a general consensus that urban components affect TB. However researches are still needed to better understand which components of the travel behaviour are affected most and by which of the urban components. In order to fill the gap in the research, the present dissertation faced two main objectives: (1) To contribute to the better understanding of the relationship between travel demand and urban environment. And (2) To develop an econometric model for estimating travel demand with urban environment attributes. With this purpose, the present thesis faced an exhaustive research and computation of land-use variables in order to find the best representation of BE for modelling trip frequency. In particular two empirical analyses are carried out: 1. Estimation of three dimensions of travel demand using dimensions of urban environment. We compare different travel dimensions and geographical scales, and we measure self-selection contribution following the joint models. 2. Develop a hybrid model, integrated latent variable and discrete choice model. The implementation of hybrid models is new in the analysis of land-use and travel behaviour. BE and TB explicitly interact and allow richness information about a specific individual decision process For all empirical analysis is used a data-base from a survey conducted in 2006 and 2007 in Madrid. Spatial attributes describing neighbourhood environment are derived from different data sources: National Institute of Statistics-INE (Administrative: municipality and district) and GIS (circular units). INE provides raw data for such spatial units as: municipality and district. The construction of census units is trivial as the census bureau provides tables that readily define districts and municipalities. The construction of circular units requires us to determine the radius and associate the spatial information to our households. The first empirical part analyzes trip frequency by applying an ordered logit model. In this part is studied the effect of socio-economic, transport and land use characteristics on two travel dimensions: trip frequency and type of tour. In particular the land use is defined in terms of type of neighbourhoods and types of dwellers. Three neighbourhood representations are explored, and described three for constructing neighbourhood attributes. In particular administrative units are examined to represent neighbourhood and circular – unit representation. Ordered logit models are applied, while ordinal logit models are well-known, an intensive work for constructing a spatial attributes was carried out. On the other hand, the second empirical analysis consists of the development of an innovative econometric model that considers a latent variable called “propensity to travel”, and choice model is the choice of type of tour. The first two specifications of ordinal models help to estimate this latent variable. The latent variable is unobserved but the manifestation is called “indicators”, then the probability of choosing an alternative of tour is conditional to the probability of latent variable and type of tour. Since latent variable is unknown we fit the integral over its distribution. Four “sets of best variables” are specified, following the specification obtained from the correlation analysis. The results evidence that the relative importance of SE variables versus BE variables depends on how BE variables are measured. We found that each of these three spatial scales has its intangible qualities and drawbacks. Spatial scales play an important role on predicting travel demand due to the variability in measures at trip origin/destinations within the same administrative unit (municipality, district and so on). Larger units will produce less variation in data; but it does not affect certain variables, such as public transport supply, that are more significant at municipality level. By contrast, land-use measures are more efficient at district level. Self-selection in this context, is weak. Thus, the influence of BE attributes is true. The results of the hybrid model show that unobserved factors affect the choice of tour complexity. The latent variable used in this model is propensity to travel that is explained by socioeconomic aspects and neighbourhood attributes. The results show that neighbourhood attributes have indeed a significant impact on the choice of the type of tours either directly and through the propensity to travel. The propensity to travel has a different impact depending on the structure of each tour and increases the probability of choosing more complex tours, such as tours with many intermediate stops. The integration of choice and latent variable model shows that omitting important perception and attitudes leads to inconsistent estimates. The results also indicate that goodness of fit improves by adding the latent variable in both sequential and simultaneous estimation. There are significant differences in the sensitivity to the latent variable across alternatives. In general, as expected, the hybrid models show a major improvement into the goodness of fit of the model, compared to a classical discrete choice model that does not incorporate latent effects. The integrated model leads to a more detailed analysis of the behavioural process. Summarizing, the effect that built environment characteristics on trip frequency studied is deeply analyzed. In particular we tried to better understand how land use characteristics can be defined and measured and which of these measures do have really an impact on trip frequency. We also tried to test the superiority of HCM on this field. We can concluded that HCM shows a major improvement into the goodness of fit of the model, compared to classical discrete choice model that does not incorporate latent effects. And consequently, the application of HCM shows the importance of LV on the decision of tour complexity. People are more elastic to built environment attributes than level of services. Thus, policy implications must take place to develop more mixed areas, work-places in combination with commercial retails.
Resumo:
Abstract Air pollution is a big threat and a phenomenon that has a specific impact on human health, in addition, changes that occur in the chemical composition of the atmosphere can change the weather and cause acid rain or ozone destruction. Those are phenomena of global importance. The World Health Organization (WHO) considerates air pollution as one of the most important global priorities. Salamanca, Gto., Mexico has been ranked as one of the most polluted cities in this country. The industry of the area led to a major economic development and rapid population growth in the second half of the twentieth century. The impact in the air quality is important and significant efforts have been made to measure the concentrations of pollutants. The main pollution sources are locally based plants in the chemical and power generation sectors. The registered concerning pollutants are Sulphur Dioxide (SO2) and particles on the order of ∼10 micrometers or less (PM10). The prediction in the concentration of those pollutants can be a powerful tool in order to take preventive measures such as the reduction of emissions and alerting the affected population. In this PhD thesis we propose a model to predict concentrations of pollutants SO2 and PM10 for each monitoring booth in the Atmospheric Monitoring Network Salamanca (REDMAS - for its spanish acronym). The proposed models consider the use of meteorological variables as factors influencing the concentration of pollutants. The information used along this work is the current real data from REDMAS. In the proposed model, Artificial Neural Networks (ANN) combined with clustering algorithms are used. The type of ANN used is the Multilayer Perceptron with a hidden layer, using separate structures for the prediction of each pollutant. The meteorological variables used for prediction were: Wind Direction (WD), wind speed (WS), Temperature (T) and relative humidity (RH). Clustering algorithms, K-means and Fuzzy C-means, are used to find relationships between air pollutants and weather variables under consideration, which are added as input of the RNA. Those relationships provide information to the ANN in order to obtain the prediction of the pollutants. The results of the model proposed in this work are compared with the results of a multivariate linear regression and multilayer perceptron neural network. The evaluation of the prediction is calculated with the mean absolute error, the root mean square error, the correlation coefficient and the index of agreement. The results show the importance of meteorological variables in the prediction of the concentration of the pollutants SO2 and PM10 in the city of Salamanca, Gto., Mexico. The results show that the proposed model perform better than multivariate linear regression and multilayer perceptron neural network. The models implemented for each monitoring booth have the ability to make predictions of air quality that can be used in a system of real-time forecasting and human health impact analysis. Among the main results of the development of this thesis we can cite: A model based on artificial neural network combined with clustering algorithms for prediction with a hour ahead of the concentration of each pollutant (SO2 and PM10) is proposed. A different model was designed for each pollutant and for each of the three monitoring booths of the REDMAS. A model to predict the average of pollutant concentration in the next 24 hours of pollutants SO2 and PM10 is proposed, based on artificial neural network combined with clustering algorithms. Model was designed for each booth of the REDMAS and each pollutant separately. Resumen La contaminación atmosférica es una amenaza aguda, constituye un fenómeno que tiene particular incidencia sobre la salud del hombre. Los cambios que se producen en la composición química de la atmósfera pueden cambiar el clima, producir lluvia ácida o destruir el ozono, fenómenos todos ellos de una gran importancia global. La Organización Mundial de la Salud (OMS) considera la contaminación atmosférica como una de las más importantes prioridades mundiales. Salamanca, Gto., México; ha sido catalogada como una de las ciudades más contaminadas en este país. La industria de la zona propició un importante desarrollo económico y un crecimiento acelerado de la población en la segunda mitad del siglo XX. Las afectaciones en el aire son graves y se han hecho importantes esfuerzos por medir las concentraciones de los contaminantes. Las principales fuentes de contaminación son fuentes fijas como industrias químicas y de generación eléctrica. Los contaminantes que se han registrado como preocupantes son el Bióxido de Azufre (SO2) y las Partículas Menores a 10 micrómetros (PM10). La predicción de las concentraciones de estos contaminantes puede ser una potente herramienta que permita tomar medidas preventivas como reducción de emisiones a la atmósfera y alertar a la población afectada. En la presente tesis doctoral se propone un modelo de predicción de concentraci ón de los contaminantes más críticos SO2 y PM10 para cada caseta de monitorización de la Red de Monitorización Atmosférica de Salamanca (REDMAS). Los modelos propuestos plantean el uso de las variables meteorol ógicas como factores que influyen en la concentración de los contaminantes. La información utilizada durante el desarrollo de este trabajo corresponde a datos reales obtenidos de la REDMAS. En el Modelo Propuesto (MP) se aplican Redes Neuronales Artificiales (RNA) combinadas con algoritmos de agrupamiento. La RNA utilizada es el Perceptrón Multicapa con una capa oculta, utilizando estructuras independientes para la predicción de cada contaminante. Las variables meteorológicas disponibles para realizar la predicción fueron: Dirección de Viento (DV), Velocidad de Viento (VV), Temperatura (T) y Humedad Relativa (HR). Los algoritmos de agrupamiento K-means y Fuzzy C-means son utilizados para encontrar relaciones existentes entre los contaminantes atmosféricos en estudio y las variables meteorológicas. Dichas relaciones aportan información a las RNA para obtener la predicción de los contaminantes, la cual es agregada como entrada de las RNA. Los resultados del modelo propuesto en este trabajo son comparados con los resultados de una Regresión Lineal Multivariable (RLM) y un Perceptrón Multicapa (MLP). La evaluación de la predicción se realiza con el Error Medio Absoluto, la Raíz del Error Cuadrático Medio, el coeficiente de correlación y el índice de acuerdo. Los resultados obtenidos muestran la importancia de las variables meteorológicas en la predicción de la concentración de los contaminantes SO2 y PM10 en la ciudad de Salamanca, Gto., México. Los resultados muestran que el MP predice mejor la concentración de los contaminantes SO2 y PM10 que los modelos RLM y MLP. Los modelos implementados para cada caseta de monitorizaci ón tienen la capacidad para realizar predicciones de calidad del aire, estos modelos pueden ser implementados en un sistema que permita realizar la predicción en tiempo real y analizar el impacto en la salud de la población. Entre los principales resultados obtenidos del desarrollo de esta tesis podemos citar: Se propone un modelo basado en una red neuronal artificial combinado con algoritmos de agrupamiento para la predicción con una hora de anticipaci ón de la concentración de cada contaminante (SO2 y PM10). Se diseñó un modelo diferente para cada contaminante y para cada una de las tres casetas de monitorización de la REDMAS. Se propone un modelo de predicción del promedio de la concentración de las próximas 24 horas de los contaminantes SO2 y PM10, basado en una red neuronal artificial combinado con algoritmos de agrupamiento. Se diseñó un modelo para cada caseta de monitorización de la REDMAS y para cada contaminante por separado.
Resumo:
The effects of conversion treatments, depending on ecological factors and silvicultural parameters (thinning intensity, thinning type and rotation, among others) have been studied during the last fifteen years in an experimental trial in Central Spain. The general climate is continental Mediterranean; soils are low depth and limy; vegetation is an homogeneous dense coppices of Quercus ilex with isolated Pinus nigra trees. The experimental design (three locations) includes different thinning intensities (from 0 to 100% of extracted basal area). Inventories have been carried out in 1994 and 2010; thinning treatments were done in 1995 and 2011. Analysis of the effects of the conversion treatment show the increment of diameter and height growth rates, the canopy recovery and the stand resprouting, finding differences in these effects between thinning treatments. Besides the induced changes at holm oak stand, the application of conversion treatment clearly changed the woodland dynamics. Fifteen years after the thinnings, floristic composition varied and an abundant pine regeneration was installed in the woodland. In this work we describe the changes between inventories in tree species composition and diameter distribution, specially in the case of black pine. The conversion treatment caused changes in forest dynamics in the short term, increasing biodiversity and diversifying the forest structure. The fast installation of Pinus regeneration suggests the potential of the zone for the establishment of multipurpose mixed Quercus-Pinus stands in wide areas where Quercus species were favoured by human populations for firewood production. Conversion treatment of coppices, with the creation of mixed stands, constitutes a good management alternative for extensive areas and an interesting technique to adaptation to global change.
Resumo:
The classical Kramer sampling theorem provides a method for obtaining orthogonal sampling formulas. In particular, when the involved kernel is analytic in the sampling parameter it can be stated in an abstract setting of reproducing kernel Hilbert spaces of entire functions which includes as a particular case the classical Shannon sampling theory. This abstract setting allows us to obtain a sort of converse result and to characterize when the sampling formula associated with an analytic Kramer kernel can be expressed as a Lagrange-type interpolation series. On the other hand, the de Branges spaces of entire functions satisfy orthogonal sampling formulas which can be written as Lagrange-type interpolation series. In this work some links between all these ideas are established.
Resumo:
We investigated how richness and composition of vascular plant species in the understory of a mixed hardwood forest stand varied with respect to the abundance and composition of the overstory. The stand is in central Spain and represents the southernmost range of distribution of several tree and herbaceous species in Europe. Understory species were identified in 46 quadrats (0.25 m2) where variables litter depth and light availability were measured. In addition, we estimated tree density, basal area, and percent basal area by tree species within 6-m-radius areas around each plot. Species richness and composition were studied using path analysis and scale-dependent geostatistical methods, respectively. We found that the relative abundance of certain trees species in the overstory was more important than total overstory abundance in explaining understory species richness. Richness decreased as soil litter depth increased, and soil litter increased as the relative proportion of Fagus sylvatica in the overstory increased, which accounted for a negative, indirect effect of Fagus sylvatica on richness. Regarding understory species composition, we found that some species distributed preferentially below certain tree species. For example, Melica uniflora was most frequent below Fagus sylvatica and Quercus petraea while the increasing proportion of Q. pyrenaica in the overstory favored the presence of Cruciata glabra, Arenaria montana, Prunus avium, Conopodium bourgaei, Holcus mollis, Stellaria media and Galium aparine in the understory. Overall, these results emphasize the importance of individual tree species in controlling the assemblage and richness of understory species in mixed stands. We conclude that soil litter accumulation is one way through which overstory composition shapes the understory community.
Resumo:
The ecological intensification of crops is proposed as a solution to the growing demand of agricultural and forest resources, in opposition to intensive monocultures. The introduction of mixed cultures as mixtures between nitrogen fixing species and non nitrogen fixing species intended to increase crop yield as a result of an improvement of the available nitrogen and phosphorus in soil. Relationship between crops have received little attention despite the wide range of advantages that confers species diversity to these systems, such as increased productivity, resilience to disruption and ecological sustainability. Forests and forestry plantations can develop an important role in storing carbon in their tissues, especially in wood which become into durable product. A simplifying parameter to analyze the amount allocated carbon by plantation is the TBCA (total belowground carbon allocation), whereby, for short periods and mature plantations, is admitted as the subtraction between soil carbon efflux and litterfall. Soil respiration depends on a wide range of factors, such as soil temperature and soil water content, soil fertility, presence and type of vegetation, among others. The studied orchard is a mixed forestry plantation of hybrid walnuts(Juglans × intermedia Carr.) for wood and alders (Alnus cordata (Loisel.) Duby.), a nitrogen fixing specie through the actinomycete Frankia alni ((Woronin, 1866) Von Tubeuf 1895). The study area is sited at Restinclières, a green area near Montpellier (South of France). In the present work, soil respiration varied greatly throughout the year, mainly influenced by soil temperature. Soil water content did not significantly influence the response of soil respiration as it was constant during the measurement period and under no water stress conditions. Distance between nearest walnut and measurement was also a highly influential factor in soil respiration. Generally there was a decreasing trend in soil respiration when the distance to the nearest tree increased. It was also analyzed the response of soil respiration according to alder presence and fertilizer management (50 kg N·ha-1·año-1 from 1999 to 2010). None of these treatments significantly influenced soil respiration, although previous studies noticed an inhibition in rates of soil respiration under fertilized conditions and high rates of available nitrogen. However, treatments without fertilization and without alder presence obtained higher respiration rates in those cases with significant differences. The lack of significant differences between treatments may be due to the high coefficient of variation experienced by soil respiration measurements. Finally an asynchronous fluctuation was observed between soil respiration and litterfall during senescence period. This is possibly due to the slowdown in the emission of exudates by roots during senescence period, which are largely related to microbial activity.
Resumo:
En la actualidad, el seguimiento de la dinámica de los procesos medio ambientales está considerado como un punto de gran interés en el campo medioambiental. La cobertura espacio temporal de los datos de teledetección proporciona información continua con una alta frecuencia temporal, permitiendo el análisis de la evolución de los ecosistemas desde diferentes escalas espacio-temporales. Aunque el valor de la teledetección ha sido ampliamente probado, en la actualidad solo existe un número reducido de metodologías que permiten su análisis de una forma cuantitativa. En la presente tesis se propone un esquema de trabajo para explotar las series temporales de datos de teledetección, basado en la combinación del análisis estadístico de series de tiempo y la fenometría. El objetivo principal es demostrar el uso de las series temporales de datos de teledetección para analizar la dinámica de variables medio ambientales de una forma cuantitativa. Los objetivos específicos son: (1) evaluar dichas variables medio ambientales y (2) desarrollar modelos empíricos para predecir su comportamiento futuro. Estos objetivos se materializan en cuatro aplicaciones cuyos objetivos específicos son: (1) evaluar y cartografiar estados fenológicos del cultivo del algodón mediante análisis espectral y fenometría, (2) evaluar y modelizar la estacionalidad de incendios forestales en dos regiones bioclimáticas mediante modelos dinámicos, (3) predecir el riesgo de incendios forestales a nivel pixel utilizando modelos dinámicos y (4) evaluar el funcionamiento de la vegetación en base a la autocorrelación temporal y la fenometría. Los resultados de esta tesis muestran la utilidad del ajuste de funciones para modelizar los índices espectrales AS1 y AS2. Los parámetros fenológicos derivados del ajuste de funciones permiten la identificación de distintos estados fenológicos del cultivo del algodón. El análisis espectral ha demostrado, de una forma cuantitativa, la presencia de un ciclo en el índice AS2 y de dos ciclos en el AS1 así como el comportamiento unimodal y bimodal de la estacionalidad de incendios en las regiones mediterránea y templada respectivamente. Modelos autorregresivos han sido utilizados para caracterizar la dinámica de la estacionalidad de incendios y para predecir de una forma muy precisa el riesgo de incendios forestales a nivel pixel. Ha sido demostrada la utilidad de la autocorrelación temporal para definir y caracterizar el funcionamiento de la vegetación a nivel pixel. Finalmente el concepto “Optical Functional Type” ha sido definido, donde se propone que los pixeles deberían ser considerados como unidades temporales y analizados en función de su dinámica temporal. ix SUMMARY A good understanding of land surface processes is considered as a key subject in environmental sciences. The spatial-temporal coverage of remote sensing data provides continuous observations with a high temporal frequency allowing the assessment of ecosystem evolution at different temporal and spatial scales. Although the value of remote sensing time series has been firmly proved, only few time series methods have been developed for analyzing this data in a quantitative and continuous manner. In the present dissertation a working framework to exploit Remote Sensing time series is proposed based on the combination of Time Series Analysis and phenometric approach. The main goal is to demonstrate the use of remote sensing time series to analyze quantitatively environmental variable dynamics. The specific objectives are (1) to assess environmental variables based on remote sensing time series and (2) to develop empirical models to forecast environmental variables. These objectives have been achieved in four applications which specific objectives are (1) assessing and mapping cotton crop phenological stages using spectral and phenometric analyses, (2) assessing and modeling fire seasonality in two different ecoregions by dynamic models, (3) forecasting forest fire risk on a pixel basis by dynamic models, and (4) assessing vegetation functioning based on temporal autocorrelation and phenometric analysis. The results of this dissertation show the usefulness of function fitting procedures to model AS1 and AS2. Phenometrics derived from function fitting procedure makes it possible to identify cotton crop phenological stages. Spectral analysis has demonstrated quantitatively the presence of one cycle in AS2 and two in AS1 and the unimodal and bimodal behaviour of fire seasonality in the Mediterranean and temperate ecoregions respectively. Autoregressive models has been used to characterize the dynamics of fire seasonality in two ecoregions and to forecasts accurately fire risk on a pixel basis. The usefulness of temporal autocorrelation to define and characterized land surface functioning has been demonstrated. And finally the “Optical Functional Types” concept has been proposed, in this approach pixels could be as temporal unities based on its temporal dynamics or functioning.
Resumo:
The influence of climate on forest stand composition, development and growth is undeniable. Many studies have tried to quantify the effect of climatic variables on forest growth and yield. These works become especially important because there is a need to predict the effects of climate change on the development of forest ecosystems. One of the ways of facing this problem is the inclusion of climatic variables into the classic empirical growth models. The work has a double objective: (i) to identify the indicators which best describe the effect of climate on Pinus halepensis growth and (ii) to quantify such effect in several scenarios of rainfall decrease which are likely to occur in the Mediterranean area. A growth mixed model for P. halepensis including climatic variables is presented in this work. Growth estimates are based on data from the Spanish National Forest Inventory (SNFI). The best results are obtained for the indices including rainfall, or rainfall and temperature together, with annual precipitation, precipitation effectiveness, Emberger?s index or free bioclimatic intensity standing out among them. The final model includes Emberger?s index, free bioclimatic intensity and interactions between competition and climate indices. The results obtained show that a rainfall decrease about 5% leads to a decrease in volume growth of 5.5?7.5% depending on site quality.
Resumo:
Probabilistic modeling is the de�ning characteristic of estimation of distribution algorithms (EDAs) which determines their behavior and performance in optimization. Regularization is a well-known statistical technique used for obtaining an improved model by reducing the generalization error of estimation, especially in high-dimensional problems. `1-regularization is a type of this technique with the appealing variable selection property which results in sparse model estimations. In this thesis, we study the use of regularization techniques for model learning in EDAs. Several methods for regularized model estimation in continuous domains based on a Gaussian distribution assumption are presented, and analyzed from di�erent aspects when used for optimization in a high-dimensional setting, where the population size of EDA has a logarithmic scale with respect to the number of variables. The optimization results obtained for a number of continuous problems with an increasing number of variables show that the proposed EDA based on regularized model estimation performs a more robust optimization, and is able to achieve signi�cantly better results for larger dimensions than other Gaussian-based EDAs. We also propose a method for learning a marginally factorized Gaussian Markov random �eld model using regularization techniques and a clustering algorithm. The experimental results show notable optimization performance on continuous additively decomposable problems when using this model estimation method. Our study also covers multi-objective optimization and we propose joint probabilistic modeling of variables and objectives in EDAs based on Bayesian networks, speci�cally models inspired from multi-dimensional Bayesian network classi�ers. It is shown that with this approach to modeling, two new types of relationships are encoded in the estimated models in addition to the variable relationships captured in other EDAs: objectivevariable and objective-objective relationships. An extensive experimental study shows the e�ectiveness of this approach for multi- and many-objective optimization. With the proposed joint variable-objective modeling, in addition to the Pareto set approximation, the algorithm is also able to obtain an estimation of the multi-objective problem structure. Finally, the study of multi-objective optimization based on joint probabilistic modeling is extended to noisy domains, where the noise in objective values is represented by intervals. A new version of the Pareto dominance relation for ordering the solutions in these problems, namely �-degree Pareto dominance, is introduced and its properties are analyzed. We show that the ranking methods based on this dominance relation can result in competitive performance of EDAs with respect to the quality of the approximated Pareto sets. This dominance relation is then used together with a method for joint probabilistic modeling based on `1-regularization for multi-objective feature subset selection in classi�cation, where six di�erent measures of accuracy are considered as objectives with interval values. The individual assessment of the proposed joint probabilistic modeling and solution ranking methods on datasets with small-medium dimensionality, when using two di�erent Bayesian classi�ers, shows that comparable or better Pareto sets of feature subsets are approximated in comparison to standard methods.
Resumo:
Este trabajo aborda el problema de modelizar sistemas din´amicos reales a partir del estudio de sus series temporales, usando una formulaci´on est´andar que pretende ser una abstracci´on universal de los sistemas din´amicos, independientemente de su naturaleza determinista, estoc´astica o h´ıbrida. Se parte de modelizaciones separadas de sistemas deterministas por un lado y estoc´asticos por otro, para converger finalmente en un modelo h´ıbrido que permite estudiar sistemas gen´ericos mixtos, esto es, que presentan una combinaci´on de comportamiento determinista y aleatorio. Este modelo consta de dos componentes, uno determinista consistente en una ecuaci´on en diferencias, obtenida a partir de un estudio de autocorrelaci´on, y otro estoc´astico que modeliza el error cometido por el primero. El componente estoc´astico es un generador universal de distribuciones de probabilidad, basado en un proceso compuesto de variables aleatorias, uniformemente distribuidas en un intervalo variable en el tiempo. Este generador universal es deducido en la tesis a partir de una nueva teor´ıa sobre la oferta y la demanda de un recurso gen´erico. El modelo resultante puede formularse conceptualmente como una entidad con tres elementos fundamentales: un motor generador de din´amica determinista, una fuente interna de ruido generadora de incertidumbre y una exposici´on al entorno que representa las interacciones del sistema real con el mundo exterior. En las aplicaciones estos tres elementos se ajustan en base al hist´orico de las series temporales del sistema din´amico. Una vez ajustados sus componentes, el modelo se comporta de una forma adaptativa tomando como inputs los nuevos valores de las series temporales del sistema y calculando predicciones sobre su comportamiento futuro. Cada predicci´on se presenta como un intervalo dentro del cual cualquier valor es equipro- bable, teniendo probabilidad nula cualquier valor externo al intervalo. De esta forma el modelo computa el comportamiento futuro y su nivel de incertidumbre en base al estado actual del sistema. Se ha aplicado el modelo en esta tesis a sistemas muy diferentes mostrando ser muy flexible para afrontar el estudio de campos de naturaleza dispar. El intercambio de tr´afico telef´onico entre operadores de telefon´ıa, la evoluci´on de mercados financieros y el flujo de informaci´on entre servidores de Internet son estudiados en profundidad en la tesis. Todos estos sistemas son modelizados de forma exitosa con un mismo lenguaje, a pesar de tratarse de sistemas f´ısicos totalmente distintos. El estudio de las redes de telefon´ıa muestra que los patrones de tr´afico telef´onico presentan una fuerte pseudo-periodicidad semanal contaminada con una gran cantidad de ruido, sobre todo en el caso de llamadas internacionales. El estudio de los mercados financieros muestra por su parte que la naturaleza fundamental de ´estos es aleatoria con un rango de comportamiento relativamente acotado. Una parte de la tesis se dedica a explicar algunas de las manifestaciones emp´ıricas m´as importantes en los mercados financieros como son los “fat tails”, “power laws” y “volatility clustering”. Por ´ultimo se demuestra que la comunicaci´on entre servidores de Internet tiene, al igual que los mercados financieros, una componente subyacente totalmente estoc´astica pero de comportamiento bastante “d´ocil”, siendo esta docilidad m´as acusada a medida que aumenta la distancia entre servidores. Dos aspectos son destacables en el modelo, su adaptabilidad y su universalidad. El primero es debido a que, una vez ajustados los par´ametros generales, el modelo se “alimenta” de los valores observables del sistema y es capaz de calcular con ellos comportamientos futuros. A pesar de tener unos par´ametros fijos, la variabilidad en los observables que sirven de input al modelo llevan a una gran riqueza de ouputs posibles. El segundo aspecto se debe a la formulaci´on gen´erica del modelo h´ıbrido y a que sus par´ametros se ajustan en base a manifestaciones externas del sistema en estudio, y no en base a sus caracter´ısticas f´ısicas. Estos factores hacen que el modelo pueda utilizarse en gran variedad de campos. Por ´ultimo, la tesis propone en su parte final otros campos donde se han obtenido ´exitos preliminares muy prometedores como son la modelizaci´on del riesgo financiero, los algoritmos de routing en redes de telecomunicaci´on y el cambio clim´atico. Abstract This work faces the problem of modeling dynamical systems based on the study of its time series, by using a standard language that aims to be an universal abstraction of dynamical systems, irrespective of their deterministic, stochastic or hybrid nature. Deterministic and stochastic models are developed separately to be merged subsequently into a hybrid model, which allows the study of generic systems, that is to say, those having both deterministic and random behavior. This model is a combination of two different components. One of them is deterministic and consisting in an equation in differences derived from an auto-correlation study and the other is stochastic and models the errors made by the deterministic one. The stochastic component is an universal generator of probability distributions based on a process consisting in random variables distributed uniformly within an interval varying in time. This universal generator is derived in the thesis from a new theory of offer and demand for a generic resource. The resulting model can be visualized as an entity with three fundamental elements: an engine generating deterministic dynamics, an internal source of noise generating uncertainty and an exposure to the environment which depicts the interactions between the real system and the external world. In the applications these three elements are adjusted to the history of the time series from the dynamical system. Once its components have been adjusted, the model behaves in an adaptive way by using the new time series values from the system as inputs and calculating predictions about its future behavior. Every prediction is provided as an interval, where any inner value is equally probable while all outer ones have null probability. So, the model computes the future behavior and its level of uncertainty based on the current state of the system. The model is applied to quite different systems in this thesis, showing to be very flexible when facing the study of fields with diverse nature. The exchange of traffic between telephony operators, the evolution of financial markets and the flow of information between servers on the Internet are deeply studied in this thesis. All these systems are successfully modeled by using the same “language”, in spite the fact that they are systems physically radically different. The study of telephony networks shows that the traffic patterns are strongly weekly pseudo-periodic but mixed with a great amount of noise, specially in the case of international calls. It is proved that the underlying nature of financial markets is random with a moderate range of variability. A part of this thesis is devoted to explain some of the most important empirical observations in financial markets, such as “fat tails”, “power laws” and “volatility clustering”. Finally it is proved that the communication between two servers on the Internet has, as in the case of financial markets, an underlaying random dynamics but with a narrow range of variability, being this lack of variability more marked as the distance between servers is increased. Two aspects of the model stand out as being the most important: its adaptability and its universality. The first one is due to the fact that once the general parameters have been adjusted , the model is “fed” on the observable manifestations of the system in order to calculate its future behavior. Despite the fact that the model has fixed parameters the variability in the observable manifestations of the system, which are used as inputs of the model, lead to a great variability in the possible outputs. The second aspect is due to the general “language” used in the formulation of the hybrid model and to the fact that its parameters are adjusted based on external manifestations of the system under study instead of its physical characteristics. These factors made the model suitable to be used in great variety of fields. Lastly, this thesis proposes other fields in which preliminary and promising results have been obtained, such as the modeling of financial risk, the development of routing algorithms for telecommunication networks and the assessment of climate change.
Resumo:
El objetivo general de esta Tesis doctoral fue estudiar la influencia de diversos factores nutricionales sobre los parámetros productivos y el desarrollo del tracto digestivo de pollitas rubias destinadas a la producción de huevos comerciales. Para alcanzar este objetivo se realizaron tres experimentos donde se estudió el cereal principal, el tamaño de partícula del cereal y el nivel de energía y la presentación de los piensos. En el experimento 1 se estudió la influencia del cereal (piensos con enzimas) y la presentación del pienso sobre los parámetros productivos y las características del tracto digestivo en 576 pollitas rubias de 1 a 120 d de edad. De 1 a 45 d de la edad, se utilizaron 4 piensos experimentales organizados de forma factorial con 2 cereales al 50% de inclusión (maíz vs. trigo) y 2 presentaciones del pienso (harina vs. gránulo de 2- mm de diámetro). Cada tratamiento se replicó 6 veces (24 pollitas por réplica). De 46 a 120 d de edad todas las dietas (maíz o trigo) se ofrecieron en harina y por tanto, la única diferencia entre tratamientos fue el cereal utilizado. De 1 a 120 d de edad, las pollitas que recibieron los piensos basados en maíz tuvieron una ganancia de peso vivo (PV) superior (P < 0,05) que las que recibieron los piensos basados en trigo, pero el índice de conversión (IC) fue similar para ambos grupos. De 1 a 45 d de edad, las pollitas alimentadas con gránulo consumieron más pienso (P < 0,001) y tuvieron una ganancia de peso superior (P < 0,001) que las pollitas alimentadas con harina. Gran parte de los efectos beneficiosos de la granulación sobre los parámetros productivos se mantuvieron al final de la prueba (120 d de edad). A los 45 d de edad, el peso relativo de la molleja (PR; g/kg PV) fue superior (P < 0,01) en pollitas alimentadas con maíz que en pollitas alimentadas con trigo. La alimentación en gránulo redujo el PR del tracto gastro intestinal (TGI) y de la molleja (P < 0,001), así como la longitud relativa (LR; cm/kg PV) del intestino delgado (P< 0.01) a ambas edades (45 y 120 d de edad). El tipo de cereal utilizado no afectó al pH del contenido de la molleja a 120 d de edad pero fué inferior (P < 0,01) en las pollitas que recibieron el pienso en harina de 1 a 45 d de la edad que en las que recibieron el pienso en gránulo. Se concluye que el trigo puede substituir al maíz en piensos para pollitas si se acepta una ligera reducción en la ganancia de peso. Asímismo, la alimentación en gránulo de 1 a 45 d de edad aumentó la ganancia de peso a esta edad y al final de la prueba, así como el pH de la molleja a 120 d de edad. La presentación del pienso en gránulo redujo el PR de la molleja y la LR del TGI a 120 d de edad. En el experimento 2 se utilizaron un total de 864 pollitas rubias Hy-Line de 1 d de edad para estudiar la influencia del cereal de la dieta (500 g de maíz o trigo/kg) y el tamaño de partícula del mismo (molienda con molino de martillos con un diámetro de criba de 6, 8, o 10-mm) sobre los parámetros productivos y las características del TGI de 1 a 120 d de edad. Cada uno de los 6 tratamientos se replicó 6 veces (24 pollitas por réplica). De 1 a 45 d de edad, la ganancia de PV aumentó (P< 0,001) y el IC se mejoró (P < 0,05) al reducir el tamaño de partícula del cereal, pero no se observaron diferencias en el periodo crecimiento de 45 a 120 d de edad. A los 45 d de vida, las pollitas alimentadas con maíz tendieron (P < 0,10) a tener un mayor PR del TGI y del proventrículo y una mayor LR del intestino delgado que las pollitas alimentadas con trigo. Asímismo, el PR del TGI a esta edad, aumentó (P < 0,05) a medida que aumentaba el tamaño de partícula del cereal utilizado. A los 120 d de edad, el tratamiento no afectó el PR de ninguno de los órganos del TGI ni al pH de la molleja. Sin embargo, la LR del intestino delgado fue superior (P < 0,05) para las pollitas alimentadas con trigo que para las pollitas alimentadas con maíz. La LR del TGI se redujó (P < 0,05) al aumentar el tamaño de partícula del cereal. Se concluye que el trigo puede incluirse 500 g/kg en piensos de pollitas de 1 a 120 días de edad y que el tamaño de partícula de los cereales afecta el crecimiento de las pollitas durante los primeros 45 d de vida, pero no después. Por lo tanto, se recomienda moler el cereal utilizado al inicio del período de recría (1 a 45 d de edad) con una criba de diámetro igual o inferior a 8 mm. En el experimento 3 se utilizaron un total de 1.152 pollitas rubias Hy-Line de 1 d de edad para estudiar la influencia del nivel de energía de la dieta y la presentación del pienso sobre la productividad y las características del TGI. De 1 a 45 d de edad se utilizaron 6 piensos organizados de forma factorial con 3 concentraciones energéticas (baja: 11,44 MJ; media: 12,05 MJ y alta: 12,66 MJ/kg) y 2 presentaciones del pienso (harina vs. gránulo). De 45 a 120 d todos los piensos experimentales se suministraron en forma de harina y por tanto, la única diferencia entre tratamientos fue el nivel de EMAn utilizado. Cada uno de los 6 tratamientos se replicó 8 veces y la unidad experimental fue la jaula con 24 pollitas. De 1 a 120 d de edad, la ganancia de PV y el IC mejoraron a medida que aumentó la EMAn del pienso (P < 0,001). Las pollitas alimentadas con gránulo de 1 a 45 d de edad comieron mas y tuvieron una ganancia de peso superior (P < 0,001) que las alimentadas con harina. En el global de la prueba, la ganancia de PV fue mayor (P < 0,01) para las pollitas alimentadas con piensos en gránulo. A los 45 d de edad, el PR de todos los segmentos del TGI estudiados fue inferior para las pollitas alimentadas con piensos de alta energía que para las pollitas alimentadas con piensos de media o baja energía. A 120 d de edad, el PR de la molleja fue superior (P < 0,01) para las pollitas alimentadas con piensos de baja energía que con los otros piensos. Sin embargo, la LR del TGI no se vió afectada por el nivel de energía de los piensos. A los 45 d de edad, la alimentación con gránulo redujo el PR del proventrículo (P < 0,05), de la molleja (P < 0,001) y del TGI (P < 0.001), así como la LR del intestino delgado (P < 0,05) y de los ciegos (P < 0,001). A pesar de que las pollitas solo recibieron los piensos en gránulo durante los primeros 45 d de vida, la alimentación con gránulos redujo el PR de la molleja y del proventrículo a 120 d de edad. Se concluye que la alimentación con gránulos durante los primeros 45 d de vida mejora el consumo de pienso y el PV de las pollitas a 120 d de edad. Un aumento del nivel de energía de la dieta de 12,0 a 12,7 MJ/kg mejora los parámetros productivos de 1 a 120 d de edad pero reduce el tamaño del proventrículo y de la molleja. En base de estos resultados concluimos que maíz y trigo con enzimas pueden utilizarse indistintamente en piensos para pollitas de 1 a 120 d de edad con sólo una ligera disminución del PV final con trigo. La granulación y la reducción del tamaño de partícula del cereal del pienso de primera edad (1 a 45 d de vida) y el uso de piensos de alta densidad energética, mejoran los PV a 120 d de edad. Por lo tanto, es recomendable moler los cereales con cribas de no más de 8-mm de diámetro. También, la granulación del pienso y el uso de piensos de alta energía (pobres en fibra bruta) pueden reducir el desarrollo del TGI especialmente de la molleja, lo que puede perjudicar el consumo posterior de pienso durante el inicio del ciclo de puesta. ABSTRACT The general objective of this Thesis was to study the effect of different nutritional factors on productive performance and the development of the gastrointestinal tract (GIT) of commercial brown egg-laying pullets from 1 to 120 d of age. In this respect, the influence of type and particle size of the cereal, and feed form, and energy content of the die,t were studied in 3 experiments. In experiment 1, the influence of the main cereal and feed form of the diet on performance and GIT traits was studied in 576 brown-egg laying pullets from 1 to 120 d of age. From 1 to 45 d of age, 4 diets arranged factorially with 2 cereals (maize vs. wheat) and 2 feed forms (mash vs. pellets) were used. Each treatment was replicated 6 times (24 pullets per replicate). From 46 to 120 d of age, all diets were offered in mash form and therefore, the only difference among diets was the cereal used. Cumulatively, pullets fed the maize diets had higher body weight (BW) gain (P< 0.05) but similar feed conversion ratio (FCR) than pullets fed the wheat diets. From 1 to 45 d of age, pullets fed pellets consumed more feed (P < 0.001) and had higher BW gain (P < 0.001) than pullets fed mash. Most of the beneficial effects of pelleting on productive performance of the birds were still evident at 120 d of age. At 45 d of age, gizzard relative weight (RW; g/kg BW) was higher (P < 0.01) in pullets fed maize than in pullets fed wheat. Feeding pellets reduced the RW of the GIT and the gizzard (P < 0.001) as well as the relative length (RL; cm/kg BW) of the small intestine (SI, P < 0.01) at both ages. The pH of the gizzard contents at 120 d of age was not affected by the main cereal of the diet, but was lower in pullets fed mash from 1 to 45 d of age (P < 0.01) than in pullets fed pellets. We conclude that wheat supplemented with enzymes can be used in substitution of maize in pullet diets with only a slight reduction in BW gain at 120 d of age. Also, feeding pellets from 1 to 45 d of age increased BW gain and pH of the gizzard, and reduced the RW of the gizzard and the RL of the GIT at 120 d of age. In experiment 2, a total of 864 brown-egg laying pullets was used to study the effects of the main cereal of the diet (500 g maize or wheat/kg) and particle size of the cereal (hammer milled to pass through a 6, 8, and 10-mm screen) on growth performance and GIT traits from 1 to 120 d of age. Each of the 6 treatments was replicated 6 times (24 pullets per replicate). Type of cereal did not affect pullet performance at any age. From 1 to 45 d of age, BW gain was increased (P < 0.001) and FCR was improved (P < 0.05) as the particle size of the cereal was reduced, but no effects were observed after this age. At 45 d of age, pullets fed maize tended (P < 0.10) to have a heavier RW of the GIT and proventriculus and a higher relative length (RL, cm/kg BW) of the SI than pullets fed wheat. Also at this age, the RW of the GIT increased (P < 0.05) with increases in particle size of the cereal. At 120 d of age, dietary treatment did not affect the RW of any of the organs studied or gizzard pH, but the RL of the SI was higher (P < 0.05) for pullets fed wheat than for pullets fed maize. Also, the RL of the SI was reduced (P < 0.05) as the particle size of the cereal increased. We conclude that 500 g wheat/kg can be included in pullet feeds from 1 to 120 d of age, and that particle size of the cereal affects pullet performance during the first 45 d of life but not thereafter. Therefore, it is recommended to grind the cereal used in this period with a screen size of no more than 8-mm. In experiment 3, a total of 1,152 one-day-old Hy-Line Brown egg laying pullets were used to study the influence of the energy content of the diet and feed form on productive performance and on several GIT traits. From 1 to 45 d of age, there were 6 diets arranged factorially with 3 concentrations of AMEn (low: 11.66 MJ/kg, medium: 12.05 MJ/kg and high: 12.66 MJ/kg) of the diet and 2 feed forms (mash vs. pellets). From 45 to 120 d all diets were fed in mash form and therefore, the only difference among treatments in this period was the energy content of the diets. Each of the 6 treatments was replicated 8 times and the experimental unit was formed by 24 pullets. Cumulatively, BW gain and FCR improved as the AMEn of the diet increased (P < 0.001). Also, pullets fed pellets from 1 to 45 d of age had higher feed intake and BW gain (P < 0.001) in this period and higher cumulative BW gain (P < 0.01) than pullets fed mash. At 45 d of age, the RWof all the segments of the GIT was lower for pullets fed the high- than for pullets fed the medium- or low- energy diets. At 120 d of age, the RW of the gizzard was higher (P < 0.01) for pullets fed the low energy diets than for pullets fed the other diets. However, the RL of the GIT was not affected by the energy content of the diet. Feeding pellets reduced the RW of the proventriculus (P < 0.05), gizzard (P < 0.001), and GIT (P < 0.001), as well as the RL of the small intestine (P < 0.05) and the ceaca (P < 0.001) at 45 d of age. The effects of feeding pellets on RW of gizzard and proventriculus were still evident at 120 d of age. We concluded that feeding pellets from 1 to 45 d of age improved feed intake and BW of pullets at 120 d of age and that an increase in the energy content of the diet increased pullet performance at all ages but reduced the RW of the proventriculus and gizzard. We conclude that maize and wheat can be used indistinctly in diets for egg laying pullets from 1 to 120 d of age, with only a slight reduction in final BW when wheat is used. Also, particle size of the cereal affects pullet performance during the first 45 d of life but not thereafter. Pelleting of the feeds, and grinding the cereal with a screen size of no more than 8-mm from 1 to 45 d of age, and the use of high density energy diets are recommended in order to achieve adequate target BW at 120 d of age. However, pelleting of the feed, very fine grinding, and the use of high AMEn diets might hinder the development of the GIT, especially that of the gizzard, which might affect feed intake of laying hens especially at the beginning of the production cycle.
Resumo:
Las reformas de agua en países en desarrollo suelen llevarse a cabo junto con cambios institucionales más profundos o, incluso, acompañadas de cambios constitucionales o de régimen político. Por lo tanto, los marcos institucionales adaptados a países gobernados sujetos al estado de derecho pueden no ser apropiados para contextos gobernados fundamentalmente, al menos en sus inicios, por instituciones informales o poco maduras. Esta tesis toma las reformas de agua como punto de partida y pretende contribuir a la literatura mediante una serie de análisis empíricos tanto del ámbito general como del plano individual o sujeto personal de la política del agua. En el ámbito general, el foco se pone en los factores que explican el fallo de la acción colectiva en dos contextos diferentes: 1) en la implementación de la nueva Ley de Aguas de Nicaragua y 2) en el mantenimiento y revitalización de las instituciones de riego en Surinam. En el plano del individuo, la investigación se centra en las decisiones de los usuarios de los recursos y analiza el papel crítico de las variables sociales para la gestión de los recursos comunes. Para ello, el método de investigación utilizado es mixto, combinando el análisis de entrevistas, encuestas y experimentos. En el ámbito general, los resultados muestran que las principales barreras para la implementación de la nueva Ley de Aguas de Nicaragua podrían tener su reflejo en el lenguaje de la Ley y, por tanto, en la forma en la que se definen y configuran las instituciones incluidas en dicha Ley. Así, la investigación demuestra que la implementación de políticas no puede ser estudiada o entendida sin tener en cuenta tanto el diseño de la propia política como el marco socio-ecológico en el que se enmarca. El contexto específico de Nicaragua remarca la importancia de considerar tanto las instituciones formales como informales en los procesos de transición política. A pesar de que las reformas de agua requieren plazos largos para su implementación, el hecho de que exista una diferencia entre las reglas tal cual se definen formalmente y las reglas que operan en la realidad merece una mayor consideración en el diseño de políticas basadas fundamentalmente en instituciones formales. En el ámbito de la conducta individual, el análisis de la acción colectiva ofrece una serie de observaciones empíricas interesantes. En el caso de Nicaragua, los resultados indican que la intensidad de las relaciones sociales, el tipo de agentes dispuestos a proporcionar apoyo social y el nivel de confianza en la comunidad son factores que explican de manera significativa la participación en la comunidad. Sin embargo, el hecho de que la gestión colectiva de riego se produzca, en la mayoría de casos, en torno a lazos familiares sugiere que las variables de capital social críticas se definen en gran medida en la esfera familiar, siendo difícil que se extiendan fuera de estos nexos. El análisis experimental de los resultados de un juego de uso de recurso común y contribución al bien público muestra que las preferencias pro-sociales de los individuos y la heterogeneidad del grupo en términos de composición por sexo son factores que explican significativamente los resultados y las decisiones de apropiación a lo largo del juego. En términos del diseño de las políticas, es fundamental tener en cuenta las dinámicas de participación y uso de los recursos comunes de manera que los niveles de cooperación puedan mantenerse en el largo plazo, lo cual, como se observa en el caso de Surinam, no es siempre posible. Finalmente, el caso de Surinam es un ejemplo ilustrativo de los procesos de acción colectiva en economías en transición. El análisis del fallo de la acción colectiva en Surinam muestra que los procesos políticos vinculados al período colonial y de independencia explican en gran medida la falta de claridad en las reglas operacionales y colectivas que gobiernan la gestión de los sistemas de riego y drenaje. Los resultados empíricos sugieren que a pesar de que la acción colectiva para la provisión de los servicios de riego y drenaje estaba bien establecida bajo el régimen colonial, la auto-organización no prosperó en un contexto dependiente del apoyo externo y regido fundamentalmente por reglas diseñadas al nivel competencial del gobierno central. El sistema socio-ecológico que se desarrolló durante la transición post-colonial favoreció, así, la emergencia de comportamientos oportunistas, y posteriormente la inoperancia de los Water Boards (WBs) creados en la época colonial. En este sentido, cualquier intento por revitalizar los WBs y fomentar el desarrollo de la auto-organización de los usuarios necesitará abordar los problemas relacionados con los patrones demográficos, incluyendo la distribución de la tierra, el diseño de instituciones y la falta de confianza en el gobierno, además de las inversiones típicas en infraestructura y sistemas de información hidrológicos. El liderazgo del gobierno, aportando empuje de arriba-abajo, es, además, otro elemento imprescindible en Surinam. ABSTRACT Water reforms in developing countries take place along deeper institutional and even constitutional. Therefore, institutional frameworks that might result in positive outcomes in countries governed by the rule of law might not fit in contexts governed mainly by informal or immature institutions. This thesis takes water reforms as the starting point and aims to contribute to the literature by presenting several conceptual and empirical analyses at both general and individual levels. At the general national level, the focus is on the factors explaining failure of collective action in two different settings: 1) in the implementation of the new Nicaraguan Water Law and 2) in sustaining and revitalizing irrigation institutions in Suriname. At the individual level, the research focuses on the actions of resource users and analyzes the critical role of social variables for common pool resources management. For this purpose, the research presented in this thesis makes use of a mixed-method approach, combining interviews, surveys and experimental methods. Overall, the results show that major barriers for the implementation of the new Nicaraguan Water Law have its reflection on the language of the Law and, therefore, on the way institutions are defined and configured. In this sense, our study shows that implementation cannot fruitfully be studied and understood without taking into account both the policy design and the social-ecological context in which it is framed. The specific setting of Nicaragua highlights the relevance of considering both formal and informal institutions when promoting policy transitions. Despite the unquestionable fact that water reforms implementation needs long periods of time, there is still a gap between the rules on paper and the rules on the ground that deserves further attention when proposing policy changes on the basis of formal institutions. At the level of the individual agent, the analysis of collective action provides a number of interesting empirical insights. In the case of Nicaragua, I found that the intensity of social networks, the type of agents willing to provide social support and the level of trust in the community are all significant factors in explaining collective action at community level. However, the fact that most collective irrigation relies on family ties suggests that critical social capital variables might be defined within the family sphere and making it difficult to go beyond it. Experimental research combining a common pool resource and a public good game in Nicaragua shows that individuals’ pro-social traits and group heterogeneity in terms of sex composition are significant variables in explaining efficiency outcomes and effort decisions along the game. Thus, with regard to policy design, it is fundamental to consider carefully the dynamics of agents' participation and use of common pool resources, for sustaining cooperation in the long term, which, as seen in the case and Surinam, is not always possible. The case of Suriname provides a rich setting for the analysis of collective action in transition economies. The analysis of decay of collective irrigation in Suriname shows that the lack of clear operational and collective choice rules appear to be rooted in deeper political processes that date back to the colonial period. The empirical findings suggest that despite collective action for the provision of irrigation and drainage services was well established during the colonial period, self-organization did not flourish in a context governed by colonial state-crafted rules and mostly dependent on external support. The social-ecological system developed during the post-colonial transition process favored the emergence of opportunistic behavior. In this respect, any attempt to revitalize WBs and support self-organization will need to tackle the problems derived from demographic patterns, including land allocation, institutions design and government distrust, in addition to the typical investments in both physical infrastructure and hydrological information systems. The leadership role of the government, acting as a top-down trigger, is another essential element in Suriname.