1000 resultados para k-Medias
Resumo:
Peer-reviewed
Resumo:
Peer-reviewed
Resumo:
Zonal management in vineyards requires the prior delineation of stable yield zones within the parcel. Among the different methodologies used for zone delineation, cluster analysis of yield data from several years is one of the possibilities cited in scientific literature. However, there exist reasonable doubts concerning the cluster algorithm to be used and the number of zones that have to be delineated within a field. In this paper two different cluster algorithms have been compared (k-means and fuzzy c-means) using the grape yield data corresponding to three successive years (2002, 2003 and 2004), for a ‘Pinot Noir’ vineyard parcel. Final choice of the most recommendable algorithm has been linked to obtaining a stable pattern of spatial yield distribution and to allowing for the delineation of compact and average sized areas. The general recommendation is to use reclassified maps of two clusters or yield classes (low yield zone and high yield zone) and, consequently, the site-specific vineyard management should be based on the prior delineation of just two different zones or sub-parcels. The two tested algorithms are good options for this purpose. However, the fuzzy c-means algorithm allows for a better zoning of the parcel, forming more compact areas and with more equilibrated zonal differences over time.
Resumo:
Analisa-se se os funcionamentos inferenciais têm uma estrutura própria dos sistemas dinâmicos não lineais, estudados a partir de quatro gráficas humorísticas. Os primeiros resultados com o tratamento estadístico lineal de K-medias projetam a presencia de perfis de diferentes funcionamentos inferenciais em função das diferentes piadas. Os resultados com a técnica da wavelet, proveniente dos sistemas dinâmicos não lineais, mostram patrões dos funcionamentos inferenciais que dão conta de sua natureza multifractal, sem uma sequencialidade fixa e sem uma organização aparente. Isto implica que é necessário revisar a concepção de estádios sequenciais fixos como os que dominam os estudos de desenvolvimento cognitivo.
Resumo:
Obtener subtipos, con diferentes perfiles neuropsicológicos, de niños en edad escolar que presentan problemas de aprendizaje. 82 sujetos, siendo 65 varones y 17 mujeres. El porcentaje de mujeres, entre los alumnos con dificultades de aprendizaje en esta muestra se sitúa alrededor del 21 por ciento. Plantea la evaluación neuropsicológica a escolares entre 8 y 11 años, que no presentan alteración neurológica cerebral demostrable y que a pesar de una capacidad cognitiva dentro de la normalidad, manifiestan dificultades de aprendizaje. Se hace eco de la necesidad de abordar el estudio de estos niños, asumiendo la concepción neuropsicológica y los métodos de Luria para la evaluación y la consiguiente obtención de subtipos de niños con problemas escolares de aprendizaje. Entrevista; Batería Luria-DNI; Escala de inteligencia de Wechsler para niños-revisada, WISC-R; Escala de comportamiento infantil ECI, para profesores y test breve de inteligencia de Kaufman, K-BIT. Se utilizaron paquetes estadísticos como STATISTICA y SPSS 13.0 para Windows y otros diseños de los estudios como son: el análisis de Cluster y el método K-medias que es un proceso de partición repetitiva. La presencia de niños normales con dificultades de aprendizaje indican que los procesos de enseñanza-aprendizaje son extremadamente complejos e influyen en ellos multitud de aspectos cognitivos, socioeconómicos y motivacionales. Hay un notable solapamiento entre problemas de lecto-escritura y aritméticos ya que la mayor parte de los sujetos del estudio los comparten. Los niños con problemas de aprendizaje mejor capacitados intelectualmente, son los más desmotivados a nivel escolar. El déficit de atención esta presente en todos los subtipos de niños con dificultades de aprendizaje. Los problemas de memoria los manifiestan todos los subtipos de niños con problemas de aprendizaje. No hay diferencias al comparar los niveles de edad. El porcentaje de mujeres con dificultades de aprendizaje coincide con los porcentajes hallados en diferentes estudios. En definitiva, lo que se pretende es diferenciar subtipos de niños con problemas de aprendizaje desde la perspectiva neuropsicológica, cognitiva y del comportamiento. Siendo una de las mayores dificultades en el estudio de los trastornos de aprendizaje la heterogeneidad de la población que presenta dichos trastornos.
Resumo:
Resumen tomado de la publicación
Resumo:
Resumen tomado de la publicación. Con el apoyo económico del departamento MIDE de la UNED. Incluye anexo con el cuestionario utilizado para la realización del estudio
Resumo:
Definir las estrategias, planes, guiones, esquemas, etc., utilizados por los alumnos universitarios para asimilar contenidos curriculares (asignaturas de la carrera) en diferentes campos específicos del conocimiento, y caracterización general de los mismos desde el punto de vista cognitivo. Se pretende a medio plazo (cinco años): a) redactar unas guías o directorios en los que se ofrezcan modelos de aprendizaje/alumnos e instruccionales/profesores y aplicados, en ambos casos, a materias del plan de estudios de las carreras correspondientes y tendentes a la optimación/mejora de los resultados actuales y prevención del fracaso escolar/de los rendimientos académicos, todo ello en el contexto normal, o natural de la enseñanza universitaria; y b) fundamentar empíricamente la programación de futuros cursos de estrategias de aprendizaje pedidos por los alumnos de los primeros cursos de carrera y destinados a ellos y a grupos de profesores universitarios (en la vertiente didáctica). 79 estudiantes universitarios que cursan los primeros o los últimos cursos de carrera y con un alto o un bajo rendimiento académico. La metodología corresponde al punto de vista científico experimental, con especial atención a la observación controlada y al autoinforme retrospectivo, post tarea que estudia los procesos cognitivos de los sujetos en su contexto natural. Se establecen las siguientes variables agrupadas, a su vez, en seis dimensiones y veinte indicadores. Variables independientes: estilo cognitivo, autoconcepto y hábito de estudio. Variables intervinientes: las estrategias de aprendizaje. Variables dependientes: el rendimiento académico. Análisis de Cluster por el metodo k-medias (paquete systad). El análisis de Cluster demuestra que existe una fuerte relación entre las estrategias de aprendizaje de alto-bajo nivel y el rendimiento académico, dependiendo de la carrera cursada y en la siguiente dirección: a un alto rendimiento académico corresponde el uso de estrategias de alto nivel y a un bajo rendimiento corresponden estrategias de bajo nivel. Existe una relación poco significativa entre el rendimiento académico y los hábitos de estudio, en todo caso, éstos influyen más detenidamente en los últimos cursos de carrera que en los primeros. Las relaciones entre el autoconcepto y el rendimiento y entre éste y el estilo cognitivo, respectivamente, son muy escasos. Se revela una posible relación entre las estrategias de aprendizaje y el estilo cognitivo.
Resumo:
Resumen basado en el de la publicación
Resumo:
Los avances en el hardware permiten disponer de grandes volúmenes de datos, surgiendo aplicaciones que deben suministrar información en tiempo cuasi-real, la monitorización de pacientes, ej., el seguimiento sanitario de las conducciones de agua, etc. Las necesidades de estas aplicaciones hacen emerger el modelo de flujo de datos (data streaming) frente al modelo almacenar-para-despuésprocesar (store-then-process). Mientras que en el modelo store-then-process, los datos son almacenados para ser posteriormente consultados; en los sistemas de streaming, los datos son procesados a su llegada al sistema, produciendo respuestas continuas sin llegar a almacenarse. Esta nueva visión impone desafíos para el procesamiento de datos al vuelo: 1) las respuestas deben producirse de manera continua cada vez que nuevos datos llegan al sistema; 2) los datos son accedidos solo una vez y, generalmente, no son almacenados en su totalidad; y 3) el tiempo de procesamiento por dato para producir una respuesta debe ser bajo. Aunque existen dos modelos para el cómputo de respuestas continuas, el modelo evolutivo y el de ventana deslizante; éste segundo se ajusta mejor en ciertas aplicaciones al considerar únicamente los datos recibidos más recientemente, en lugar de todo el histórico de datos. En los últimos años, la minería de datos en streaming se ha centrado en el modelo evolutivo. Mientras que, en el modelo de ventana deslizante, el trabajo presentado es más reducido ya que estos algoritmos no sólo deben de ser incrementales si no que deben borrar la información que caduca por el deslizamiento de la ventana manteniendo los anteriores tres desafíos. Una de las tareas fundamentales en minería de datos es la búsqueda de agrupaciones donde, dado un conjunto de datos, el objetivo es encontrar grupos representativos, de manera que se tenga una descripción sintética del conjunto. Estas agrupaciones son fundamentales en aplicaciones como la detección de intrusos en la red o la segmentación de clientes en el marketing y la publicidad. Debido a las cantidades masivas de datos que deben procesarse en este tipo de aplicaciones (millones de eventos por segundo), las soluciones centralizadas puede ser incapaz de hacer frente a las restricciones de tiempo de procesamiento, por lo que deben recurrir a descartar datos durante los picos de carga. Para evitar esta perdida de datos, se impone el procesamiento distribuido de streams, en concreto, los algoritmos de agrupamiento deben ser adaptados para este tipo de entornos, en los que los datos están distribuidos. En streaming, la investigación no solo se centra en el diseño para tareas generales, como la agrupación, sino también en la búsqueda de nuevos enfoques que se adapten mejor a escenarios particulares. Como ejemplo, un mecanismo de agrupación ad-hoc resulta ser más adecuado para la defensa contra la denegación de servicio distribuida (Distributed Denial of Services, DDoS) que el problema tradicional de k-medias. En esta tesis se pretende contribuir en el problema agrupamiento en streaming tanto en entornos centralizados y distribuidos. Hemos diseñado un algoritmo centralizado de clustering mostrando las capacidades para descubrir agrupaciones de alta calidad en bajo tiempo frente a otras soluciones del estado del arte, en una amplia evaluación. Además, se ha trabajado sobre una estructura que reduce notablemente el espacio de memoria necesario, controlando, en todo momento, el error de los cómputos. Nuestro trabajo también proporciona dos protocolos de distribución del cómputo de agrupaciones. Se han analizado dos características fundamentales: el impacto sobre la calidad del clustering al realizar el cómputo distribuido y las condiciones necesarias para la reducción del tiempo de procesamiento frente a la solución centralizada. Finalmente, hemos desarrollado un entorno para la detección de ataques DDoS basado en agrupaciones. En este último caso, se ha caracterizado el tipo de ataques detectados y se ha desarrollado una evaluación sobre la eficiencia y eficacia de la mitigación del impacto del ataque. ABSTRACT Advances in hardware allow to collect huge volumes of data emerging applications that must provide information in near-real time, e.g., patient monitoring, health monitoring of water pipes, etc. The data streaming model emerges to comply with these applications overcoming the traditional store-then-process model. With the store-then-process model, data is stored before being consulted; while, in streaming, data are processed on the fly producing continuous responses. The challenges of streaming for processing data on the fly are the following: 1) responses must be produced continuously whenever new data arrives in the system; 2) data is accessed only once and is generally not maintained in its entirety, and 3) data processing time to produce a response should be low. Two models exist to compute continuous responses: the evolving model and the sliding window model; the latter fits best with applications must be computed over the most recently data rather than all the previous data. In recent years, research in the context of data stream mining has focused mainly on the evolving model. In the sliding window model, the work presented is smaller since these algorithms must be incremental and they must delete the information which expires when the window slides. Clustering is one of the fundamental techniques of data mining and is used to analyze data sets in order to find representative groups that provide a concise description of the data being processed. Clustering is critical in applications such as network intrusion detection or customer segmentation in marketing and advertising. Due to the huge amount of data that must be processed by such applications (up to millions of events per second), centralized solutions are usually unable to cope with timing restrictions and recur to shedding techniques where data is discarded during load peaks. To avoid discarding of data, processing of streams (such as clustering) must be distributed and adapted to environments where information is distributed. In streaming, research does not only focus on designing for general tasks, such as clustering, but also in finding new approaches that fit bests with particular scenarios. As an example, an ad-hoc grouping mechanism turns out to be more adequate than k-means for defense against Distributed Denial of Service (DDoS). This thesis contributes to the data stream mining clustering technique both for centralized and distributed environments. We present a centralized clustering algorithm showing capabilities to discover clusters of high quality in low time and we provide a comparison with existing state of the art solutions. We have worked on a data structure that significantly reduces memory requirements while controlling the error of the clusters statistics. We also provide two distributed clustering protocols. We focus on the analysis of two key features: the impact on the clustering quality when computation is distributed and the requirements for reducing the processing time compared to the centralized solution. Finally, with respect to ad-hoc grouping techniques, we have developed a DDoS detection framework based on clustering.We have characterized the attacks detected and we have evaluated the efficiency and effectiveness of mitigating the attack impact.
Resumo:
La planificación y las políticas de transporte no pueden descuidar la calidad del servicio, considerando que influye notablemente en el cambio modal del coche hacia otros medios de transporte más sostenibles. El concepto se aplica también a los intercambiadores de transporte público, los nodos del sistema donde se cruzan las distintas redes del transporte público y privado. Aunque se han logrado numerosos avances para medir y evaluar la calidad en el sector del transporte público, se han dedicado relativamente pocos esfuerzos a investigar estos aspectos relacionados con la calidad de los intercambiadores del transporte público. Este trabajo de investigación se concentra en la calidad del servicio de la transferencia modal en los intercambiadores interurbanos, según la perspectiva de los viajeros. Su objetivo es identificar los factores clave de la calidad del servicio y los perfiles de los viajeros en los intercambiadores. La investigación es exploratoria y ofrece información acerca de la percepción de los viajeros intermodales relacionada con los aspectos de la calidad, aportando nuevos elementos y datos para adentrarse en estudios más detallados. La metodología del trabajo combina técnicas de análisis estadístico multivariante para analizar los datos de las encuestas sobre la satisfacción de los clientes y se subdivide en tres etapas. En primer lugar, se ha implementado el análisis de correspondencias múltiples para explorar los constructos latentes relacionados con la satisfacción de las características cualitativas de los intercambiadores interurbanos, identificando así los factores clave de la calidad. En segundo lugar, se ha aplicado un análisis de conglomerados de k-medias sobre los factores clave de calidad para clasificar a los viajeros en grupos de usuarios de transportes homogéneos, de acuerdo con su percepción de satisfacción, identificando de este modo los perfiles de los viajeros. Por último, se han formulado sugerencias y recomendaciones sobre la calidad para respaldar la formulación de políticas, estableciendo las prioridades para los intercambiadores interurbanos. La metodología se aplicó en cuatro intercambiadores interurbanos (estaciones de ferrocarriles o de autobuses ) en Madrid, Zaragoza, Gothenburg y Lion, analizando los datos recogidos mediante una encuesta de satisfacción del cliente llevada a cabo en 2011 en los cuatro casos de estudio, donde se interconectan distintos medios de transporte público y privado, de corta y larga distancia. Se recogieron datos sobre la satisfacción de los viajeros con 26 criterios de calidad, así como información sobre aspectos socio-económicos y pautas de comportamiento de viajes. Mediante el análisis de correspondencias múltiples se identificaron 4-5 factores clave de calidad en cada intercambiador, que se asocian principalmente con el sistema de emisión de billetes, el confort y la interconexión, mientras que los viajeros no perciben los temas clásicos como la información. Mediante el análisis de conglomerados se identificaron 2-5 perfiles de viajeros en cada intercambiador. Se reconocieron dos grupos de viajeros en casi todos los casos de estudio: viajeros de cercanía/trabajadores y turistas. Por lo que concierne a las prioridades para apoyar a las partes interesadas en la formulación de políticas, la expedición de billetes es el factor clave para los intercambiadores interurbanos españoles, mientras que la interconexión y los aspectos temporales se destacan en los intercambiadores de Francia y Suecia. Quality of Service can not be neglected in public transport planning and policy making, since it strongly influences modal shifts from car to more sustainable modes. This concept is also related to Public Transport interchanges, the nodes of the transport system where the different sub-systems of public passenger transport and personal vehicles meet. Although a lot of progress has been generally done to measure and assess quality in public transport sector, relatively little investigation has been conducted on quality at PT interchanges. This research work focusses on Quality of Service in the use of transfer facilities at interurban interchanges, according to current travellers’ perspective. It aims at identifying key quality factors and travellers profiles at interurban interchanges. The research is exploratory and offers insight into intermodal travellers’ perception on quality aspects, providing new elements and inputs for more definitive investigation. The methodology of the work combines multivariate statistical techniques to analyse data from customer satisfaction surveys and is subdivided in three steps. Firstly, multiple correspondence analysis was performed to explore latent constructs as concern satisfaction of quality attributes at interurban interchanges, thus identifying the so-called Key Quality Factor. Secondly, k-means cluster analysis was implemented on the key quality factors to classify travellers in homogeneous groups of transport users, according to their perception of satisfaction, thus identifying the so-called Travellers Profiles. Finally, hints and recommendations on quality were identified to support policy making, setting priorities for interurban interchanges. The methodology was applied at four interurban interchanges in Madrid, Zaragoza, Gothenburg and Lyon, analysing the data collected through a customer satisfaction survey carried out in 2011 at the four railway or bus stations where different modes of public and private transport are interconnected covering both short and long trips. Data on travellers’ satisfaction with 26 quality attributes were collected, as well as information on socio-economical and travel patterns. Through multiple correspondence analysis were identified 4-5 key quality factors per interchange. They are mainly related to ticketing, comfort and connectivity, while classical issues, as information, are not perceived as important by travellers’. Through cluster analysis were identified 2-5 travellers profiles per interchange. Two groups of travellers can be found in almost all case studies: commuter / business travellers and holiday travellers. As regards the priorities to support stakeholders in policy making, ticketing is the key-issue for the Spanish interurban interchanges, while connectivity and temporal issues emerge in the French and Swedish case studies.
Resumo:
En el siguiente Trabajo de Fin de Máster se pone en práctica la Minería de Datos (Data Mining), llevando a cabo una investigación de CRM (Customer Relationship Management) en la cual se analizan los comportamientos de compra de los clientes de una empresa que comercializa solo por internet (online). Este negocio es de origen español y mediante estos análisis podremos saber principalmente cuántos tipos de clientes posee y cómo son sus hábitos de compra para poder clasificarlos. Para ello, utilizaremos la segmentación RFM (Recency, Frequency, Monetary) que la calcularemos mediante dos metodologías muy importantes que son el Método Convencional y el Método de las 2-Tuplas. En el primer método realizaremos una clasificación numérica mediante quintiles que se numerarán de 1 a 5 tanto para la Recencia, la Frecuencia y el Valor Monetario, con los que podremos determinar el comportamiento de compra de cada cliente. En el segundo método veremos otra clasificación de los clientes más precisa, más detallada y con la ventaja que ofrece un valor lingüístico para poder entender mejor a que cluster pertenece cada cliente. Finalmente, realizaremos unos análisis de clusters con el método de “K-medias” con diferentes segmentos (entre 5 y 7 segmentos) que nos permitirán distinguir cuántos tipos de clientes tiene este negocio y cómo son con respecto a su hábito de compra. Todo esto con el fin de dar respuesta a este negocio sobre cómo es el comportamiento de compra de cada cliente, cuáles son los más importantes, cuáles son los menos importantes, cuántos han dejado de comprar, etc.
Resumo:
La eutrofización marina es un problema que afecta a los mares europeos y particularmente a sus aguas costeras. Se trata del enriquecimiento anómalo en nutrientes de las aguas marinas, generalmente compuestos del nitrógeno y fósforo aportados por la actividad del ser humano, y que tiene como resultado consecuencias nocivas para la calidad de las aguas y la biodiversidad. La Directiva Marco de las Estrategias Marinas, que entró en vigor en 2010, recoge esta problemática y emplaza a los estados miembros para su evaluación y en su caso para la remediación de sus efectos nocivos identificando el origen de los aportes de nutrientes. Esta tarea requiere metodologías y procedimientos operativos que permitan ser implementados de forma coordinada por los estados miembros a nivel regional. En el primer capítulo de esta tesis se presenta una metodología para realizar la zonación del norte del mar Alborán a partir de imágenes de satélite de clorofila a tal que permite delimitar las áreas con características de productividad diferenciadas que pueden ser propuestas como unidades de gestión de la eutrofización y que se puedan emplear tanto en el diseño de los programas de seguimiento como en el aprovechamiento de los datos oceanográficos medidos in situ. En este capítulo se describe la metodología analítica utilizada, que está basada en la aplicación del análisis clúster de las k-medias a las imágenes de satélite de clorofila, así como su validez a partir del análisis de las series temporales de datos tomados in situ. El segundo capítulo se hace una evaluación de los indicadores de la eutrofización en una zona reducida de Alborán, donde existen multitud de datos oceanográficos, meteorológicos y ambientales. Para llevarla a cabo, se adaptó la metodología empleada en el capítulo 1 a la región ECOMALAGA. Una vez realizada la zonación, se agregaron los datos oceanográficos, meteorológicos y ambientales potencialmente relacionados con la eutrofización en cada área, y posteriormente se evaluaron las diferencias estadísticas a lo largo del ciclo estacional y entre las diferentes zonas. Con esta finalidad, se estiman las tendencias temporales de las variables ambientales en cada zona. A partir de los resultados obtenidos se infirió qué variables y/o mecanismos podrían estar influyendo sobre la concentración superficial de la clorofila a. En el tercer capítulo se ensayaron modelos aditivos generalizados (GAM) con el fin de identificar las variables más importantes que afectan a los indicadores de la eutrofización. Como variable respuesta del modelo se usó la clorofila a, pues se trata del indicador directo de la eutrofización más empleado. Las variables explicativas se componen de variables oceanográficas, meteorológicas y ambientales. En el cuarto capítulo se desarrolla un algoritmo regional para el mar de Alborán que permite obtener valores de clorofila a a partir de imágenes de satélite más ajustados a los valores que proporcionan los algoritmos disponibles que la sobreestiman considerablemente. En la discusión final y conclusiones se hace énfasis en el enfoque práctico de esta tesis doctoral, detallando la potencialidad de la metodología presentada para la evaluación de la eutrofización. Para esto, se detallan los resultados de la evaluación obtenidos para el mar Alborán empleando dicha metodología, definiendo su estado actual y las tendencias registradas, así como las causas de los problemas encontrados. Finalmente se evalúan y proponen posibles medidas para su remediación y control.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Welsch (Projektbearbeiter): Eingehende Schilderung der Gefechte im Raum Mediasch (2. bis 4. März 1849), in deren Verlauf ein ungarisches Revolutionskorps unter Bem in Richtung Maros-Vásárhely zurückgedrängt wird. Erwarteter Durchbruchsversuch von in der Bukowina stehenden ungarischen Verbänden nach Galizien