782 resultados para Spatial Data mining
Resumo:
Knowledge discovery support environments include beside classical data analysis tools also data mining tools. For supporting both kinds of tools, a unified knowledge representation is needed. We show that concept lattices which are used as knowledge representation in Conceptual Information Systems can also be used for structuring the results of mining association rules. Vice versa, we use ideas of association rules for reducing the complexity of the visualization of Conceptual Information Systems.
Resumo:
In this paper we study two orthogonal extensions of the classical data mining problem of mining association rules, and show how they naturally interact. The first is the extension from a propositional representation to datalog, and the second is the condensed representation of frequent itemsets by means of Formal Concept Analysis (FCA). We combine the notion of frequent datalog queries with iceberg concept lattices (also called closed itemsets) of FCA and introduce two kinds of iceberg query lattices as condensed representations of frequent datalog queries. We demonstrate that iceberg query lattices provide a natural way to visualize relational association rules in a non-redundant way.
Resumo:
Zur Abbildung heterogener Standorteigenschaften und Ertragspotenziale werden zunehmend flächenhafte Daten nachgefragt. Insbesondere für Grünland, das häufig durch ausgeprägte Standortheterogenität gekennzeichnet ist, ergeben sich hohe Anforderungen an die Wiedergabequalität, denn die realen Verhältnisse sollen in praktikabler Weise möglichst exakt abgebildet werden. Außerdem können flächenhafte Daten genutzt werden, um Zusammenhänge zwischen teilflächenspezifischen Standorteigenschaften und Grünlandaspekten detaillierter zu analysieren und bisher nicht erkannte Wechselbeziehungen nachzuweisen. Für mitteleuropäisches Grünland lagen zu Beginn dieser Arbeit derartige räumliche Untersuchungen nicht oder nur in Teilaspekten vor. Diese Arbeit befasste sich mit der Analyse von Wirkungsbeziehungen zwischen Standort- und Grünlandmerkmalen auf einer im Nordhessischen Hügelland (Deutschland) weitgehend praxisüblicher bewirtschafteten 20 ha großen Weidefläche. Erhoben wurden als Standortfaktoren die Geländemorphologie, die Bodentextur, die Grundnährstoffgehalten sowie als Parameter des Grünlandbestandes die botanische Zusammensetzung, der Ertrag und die Qualitätsparameter. Sie wurden sowohl in einem 50 m-Raster ganzflächig, als auch auf drei 50x50 m großen Teilflächen in erhöhter Beprobungsdichte (6,25 m-Rasterweite) aufgenommen. Die relevanten Fragestellungen zielen auf die räumliche und zeitliche Variabilität von Grünlandbestandesparametern innerhalb von Grünlandflächen sowie deren Abhängigkeit von den Standortfaktoren. Ein weiterer Schwerpunkt war die Überprüfung der Frage, ob die reale Variabilität der Zielvariablen durch die Interpolierung der punktuell erfassten Daten wiedergegeben werden kann. Die Beziehungen zwischen Standort- und Grünlandmerkmalen wurden mit monokausalen und multivariaten Ansätzen untersucht. Die Ergebnisse ließen, unabhängig vom Jahreseinfluss, bereits bestimmte Zusammenhänge zwischen botanischer Zusammensetzung und Standort, auch auf dem untersuchten kleinen Maßstab innerhalb der Grünlandfläche, finden. Demzufolge können unterschiedliche Areale abgegrenzt und charakterisiert werden, die als Grundlage für Empfehlungen zur Ausweisung von Arealen zur teilspezifischen Bewirtschaftung erarbeitet wurden. Die Validierung der interpolierten Daten zeigte, dass die 50-m Rasterbeprobung nur eine begrenzte Wiedergabe der räumlichen Variabilität ermöglicht. Inwieweit derartige Beziehungen quantitativ genauer beschreibbar sind, bleibt auf Grund der verbliebenen unerklärten Varianz im Datensatz dieser Studie offen.
Resumo:
Einhergehend mit der Entwicklung und zunehmenden Verfügbarkeit des Internets hat sich die Art der Informationsbereitstellung und der Informationsbeschaffung deutlich geändert. Die einstmalige Trennung zwischen Publizist und Konsument wird durch kollaborative Anwendungen des sogenannten Web 2.0 aufgehoben, wo jeder Teilnehmer gleichsam Informationen bereitstellen und konsumieren kann. Zudem können Einträge anderer Teilnehmer erweitert, kommentiert oder diskutiert werden. Mit dem Social Web treten schließlich die sozialen Beziehungen und Interaktionen der Teilnehmer in den Vordergrund. Dank mobiler Endgeräte können zu jeder Zeit und an nahezu jedem Ort Nachrichten verschickt und gelesen werden, neue Bekannschaften gemacht oder der aktuelle Status dem virtuellen Freundeskreis mitgeteilt werden. Mit jeder Aktivität innerhalb einer solchen Applikation setzt sich ein Teilnehmer in Beziehung zu Datenobjekten und/oder anderen Teilnehmern. Dies kann explizit geschehen, indem z.B. ein Artikel geschrieben wird und per E-Mail an Freunde verschickt wird. Beziehungen zwischen Datenobjekten und Nutzern fallen aber auch implizit an, wenn z.B. die Profilseite eines anderen Teilnehmers aufgerufen wird oder wenn verschiedene Teilnehmer einen Artikel ähnlich bewerten. Im Rahmen dieser Arbeit wird ein formaler Ansatz zur Analyse und Nutzbarmachung von Beziehungsstrukturen entwickelt, welcher auf solchen expliziten und impliziten Datenspuren aufbaut. In einem ersten Teil widmet sich diese Arbeit der Analyse von Beziehungen zwischen Nutzern in Applikationen des Social Web unter Anwendung von Methoden der sozialen Netzwerkanalyse. Innerhalb einer typischen sozialen Webanwendung haben Nutzer verschiedene Möglichkeiten zu interagieren. Aus jedem Interaktionsmuster werden Beziehungsstrukturen zwischen Nutzern abgeleitet. Der Vorteil der impliziten Nutzer-Interaktionen besteht darin, dass diese häufig vorkommen und quasi nebenbei im Betrieb des Systems abfallen. Jedoch ist anzunehmen, dass eine explizit angegebene Freundschaftsbeziehung eine stärkere Aussagekraft hat, als entsprechende implizite Interaktionen. Ein erster Schwerpunkt dieser Arbeit ist entsprechend der Vergleich verschiedener Beziehungsstrukturen innerhalb einer sozialen Webanwendung. Der zweite Teil dieser Arbeit widmet sich der Analyse eines der weit verbreitetsten Profil-Attributen von Nutzern in sozialen Webanwendungen, dem Vornamen. Hierbei finden die im ersten Teil vorgestellten Verfahren und Analysen Anwendung, d.h. es werden Beziehungsnetzwerke für Namen aus Daten von sozialen Webanwendungen gewonnen und mit Methoden der sozialen Netzwerkanalyse untersucht. Mithilfe externer Beschreibungen von Vornamen werden semantische Ähnlichkeiten zwischen Namen bestimmt und mit jeweiligen strukturellen Ähnlichkeiten in den verschiedenen Beziehungsnetzwerken verglichen. Die Bestimmung von ähnlichen Namen entspricht in einer praktischen Anwendung der Suche von werdenden Eltern nach einem passenden Vornamen. Die Ergebnisse zu der Analyse von Namensbeziehungen sind die Grundlage für die Implementierung der Namenssuchmaschine Nameling, welche im Rahmen dieser Arbeit entwickelt wurde. Mehr als 35.000 Nutzer griffen innerhalb der ersten sechs Monate nach Inbetriebnahme auf Nameling zu. Die hierbei anfallenden Nutzungsdaten wiederum geben Aufschluss über individuelle Vornamenspräferenzen der Anwender. Im Rahmen dieser Arbeit werden diese Nutzungsdaten vorgestellt und zur Bestimmung sowie Bewertung von personalisierten Vornamensempfehlungen verwendet. Abschließend werden Ansätze zur Diversifizierung von personalisierten Vornamensempfehlungen vorgestellt, welche statische Beziehungsnetzwerke für Namen mit den individuellen Nutzungsdaten verknüpft.
Resumo:
Co-training is a semi-supervised learning method that is designed to take advantage of the redundancy that is present when the object to be identified has multiple descriptions. Co-training is known to work well when the multiple descriptions are conditional independent given the class of the object. The presence of multiple descriptions of objects in the form of text, images, audio and video in multimedia applications appears to provide redundancy in the form that may be suitable for co-training. In this paper, we investigate the suitability of utilizing text and image data from the Web for co-training. We perform measurements to find indications of conditional independence in the texts and images obtained from the Web. Our measurements suggest that conditional independence is likely to be present in the data. Our experiments, within a relevance feedback framework to test whether a method that exploits the conditional independence outperforms methods that do not, also indicate that better performance can indeed be obtained by designing algorithms that exploit this form of the redundancy when it is present.
Resumo:
In this document we describe the use of metadata catalog Geonetwork software for creating thematic nodes in a spatial data infrastructure
Resumo:
El auge de las Infraestructuras de Datos Espaciales (IDE) en los últimos años ha provocado el despliegue masivo de este tipo de plataformas en el territorio español. A pesar de hacer uso de estándares del OGC, estar reguladas por iniciativas como la directiva INSPIRE y que existen recomendaciones y normativas para su implantación, la red de nodos IDE es muy heterogénea y se detectan grandes desigualdades. Conscientes de esta situación surge la necesidad de un método objetivo para el estudio y análisis comparativo de IDEs. Como parte del desarrollo de esta metodología nace SDIAnalyzer, programa de software libre que permite la extracción masiva, almacenamiento y estudio de información relativa a servicios del OGC. SDIAnalyzer (Spatial Data Infraestructure Analyzer), creado por el CartoLab de la Universidade da Coruña, ha sido aplicado en el análisis de aproximadamente 180 IDEs españolas de nivel regional elaborando mapas temáticos de diversas características y pretendemos seguir avanzando en su desarrollo. En el presente artículo, se exponen sus características principales y se lanza de forma pública a la comunidad de software libre
Resumo:
MapFish is an open-source development framework for building webmapping applications. MapFish is based on the OpenLayers API and the Geo extension of Ext library, and extends the Pylons general-purpose web development framework with geo-specific functionnalities. This presentation first describes what the MapFish development framework provides and how it can help developers implement rich web-mapping applications. It then demonstrates through real web-mapping realizations what can be achieved using MapFish : Geo Business Intelligence applications, 2D/3D data visualization, on/off line data edition, advanced vectorial print functionnalities, advanced administration suite to build WebGIS applications from scratch, etc. In particular, the web-mapping application for the UN Refugee Agency (UNHCR) and a Regional Spatial Data Infrastructure will be demonstrated
Resumo:
Recommender systems attempt to predict items in which a user might be interested, given some information about the user's and items' profiles. Most existing recommender systems use content-based or collaborative filtering methods or hybrid methods that combine both techniques (see the sidebar for more details). We created Informed Recommender to address the problem of using consumer opinion about products, expressed online in free-form text, to generate product recommendations. Informed recommender uses prioritized consumer product reviews to make recommendations. Using text-mining techniques, it maps each piece of each review comment automatically into an ontology
Resumo:
Consumer reviews, opinions and shared experiences in the use of a product is a powerful source of information about consumer preferences that can be used in recommender systems. Despite the importance and value of such information, there is no comprehensive mechanism that formalizes the opinions selection and retrieval process and the utilization of retrieved opinions due to the difficulty of extracting information from text data. In this paper, a new recommender system that is built on consumer product reviews is proposed. A prioritizing mechanism is developed for the system. The proposed approach is illustrated using the case study of a recommender system for digital cameras
Resumo:
This paper aims to survey the techniques and methods described in literature to analyse and characterise voltage sags and the corresponding objectives of these works. The study has been performed from a data mining point of view
Resumo:
Monitor a distribution network implies working with a huge amount of data coining from the different elements that interact in the network. This paper presents a visualization tool that simplifies the task of searching the database for useful information applicable to fault management or preventive maintenance of the network
Resumo:
Se basa en un análisis teórico de los sistemas de información como lo es el almacenaje de datos, cubos OLAP e inteligencia de negocios. Seguidamente, se hace un análisis de los sectores económicos de Colombia con un especial interés sobre el sector de alimentos, de esta manera conceptualizar la empresa sobre la cual este trabajo se enfocara. Se encontrará un análisis del caso de éxito Summerwood Corporation, el cual brindará una justificación para la propuesta final presentada a la empresa Dipsa Food, Pyme dedicada a la producción de alimentos no perecederos ubicada en la ciudad de Bogotá D.C –Colombia, la cual tiene gran interés en cuanto al desarrollo de nuevas tecnologías que brinden información fidedigna para la toma de decisiones
Resumo:
Este texto contribuirá a que la institución de salud se organice y prepare la información necesaria para emprender el largo y tortuoso camino de la determinación de la razón costo/beneficio y de la acreditación. Además, podrá ser muy útil para los estudiantes de los programas de pregrado y posgrado de ingeniería biomédica que se quieran especializar en la gestión de tecnologías del equipamiento biomédico y la ingeniería clínica. También podrá ser usado como guía de referencia por personas que estén directamente vinculadas al sector de la salud en departamentos de mantenimiento, ingeniería clínica o de servicios hospitalarios.