225 resultados para 519 Probalidades y matemática aplicada
Resumo:
Tema 1. Variables aleatorias discretas. Binomial. Poisson.
Resumo:
Contraste de Bondad de Ajuste de distribuciones discretas. Método de Chi-Cuadrado (para contrastar el ajuste a una Binomial).
Resumo:
Nowadays, data mining is based on low-level specications of the employed techniques typically bounded to a specic analysis platform. Therefore, data mining lacks a modelling architecture that allows analysts to consider it as a truly software-engineering process. Here, we propose a model-driven approach based on (i) a conceptual modelling framework for data mining, and (ii) a set of model transformations to automatically generate both the data under analysis (via data-warehousing technology) and the analysis models for data mining (tailored to a specic platform). Thus, analysts can concentrate on the analysis problem via conceptual data-mining models instead of low-level programming tasks related to the underlying-platform technical details. These tasks are now entrusted to the model-transformations scaffolding.
Resumo:
Data mining is one of the most important analysis techniques to automatically extract knowledge from large amount of data. Nowadays, data mining is based on low-level specifications of the employed techniques typically bounded to a specific analysis platform. Therefore, data mining lacks a modelling architecture that allows analysts to consider it as a truly software-engineering process. Bearing in mind this situation, we propose a model-driven approach which is based on (i) a conceptual modelling framework for data mining, and (ii) a set of model transformations to automatically generate both the data under analysis (that is deployed via data-warehousing technology) and the analysis models for data mining (tailored to a specific platform). Thus, analysts can concentrate on understanding the analysis problem via conceptual data-mining models instead of wasting efforts on low-level programming tasks related to the underlying-platform technical details. These time consuming tasks are now entrusted to the model-transformations scaffolding. The feasibility of our approach is shown by means of a hypothetical data-mining scenario where a time series analysis is required.
Resumo:
Geographic knowledge discovery (GKD) is the process of extracting information and knowledge from massive georeferenced databases. Usually the process is accomplished by two different systems, the Geographic Information Systems (GIS) and the data mining engines. However, the development of those systems is a complex task due to it does not follow a systematic, integrated and standard methodology. To overcome these pitfalls, in this paper, we propose a modeling framework that addresses the development of the different parts of a multilayer GKD process. The main advantages of our framework are that: (i) it reduces the design effort, (ii) it improves quality systems obtained, (iii) it is independent of platforms, (iv) it facilitates the use of data mining techniques on geo-referenced data, and finally, (v) it ameliorates the communication between different users.
Resumo:
Biotic indices have been developed to summarise information provided by benthic macroinvertebrates, but their use can require specialized taxonomic expertise as well as a time-consuming operation. Using high taxonomic level in biotic indices reduces sampling processing time but should be considered with caution, since assigning tolerance level to high taxonomic levels may cause uncertainty. A methodology for family level tolerance categorization based on the affinity of each family with disturbed or undisturbed conditions was employed. This family tolerance classification approach was tested in two different areas from Mediterranean Sea affected by sewage discharges. Biotic indices employed at family level responded correctly to sewage presence. However, in areas with different communities among stations and high diversity of species within each family, assigning the same tolerance level to a whole family could imply mistakes. Thus, use of high taxonomic level in biotic indices should be only restricted to areas where homogeneous community is presented and families across sites have similar species composition.
Open business intelligence: on the importance of data quality awareness in user-friendly data mining
Resumo:
Citizens demand more and more data for making decisions in their daily life. Therefore, mechanisms that allow citizens to understand and analyze linked open data (LOD) in a user-friendly manner are highly required. To this aim, the concept of Open Business Intelligence (OpenBI) is introduced in this position paper. OpenBI facilitates non-expert users to (i) analyze and visualize LOD, thus generating actionable information by means of reporting, OLAP analysis, dashboards or data mining; and to (ii) share the new acquired information as LOD to be reused by anyone. One of the most challenging issues of OpenBI is related to data mining, since non-experts (as citizens) need guidance during preprocessing and application of mining algorithms due to the complexity of the mining process and the low quality of the data sources. This is even worst when dealing with LOD, not only because of the different kind of links among data, but also because of its high dimensionality. As a consequence, in this position paper we advocate that data mining for OpenBI requires data quality-aware mechanisms for guiding non-expert users in obtaining and sharing the most reliable knowledge from the available LOD.
Resumo:
El éxito en la búsqueda de conocimiento a partir de grandes cantidades de datos radica en la calidad de los mismos. Hasta ahora los aspectos de calidad de los datos se han enfocado principalmente a la limpieza de los datos: detección de duplicados, valores atípicos, perdidos, incompletos o conflictos en instancias, entre otros. En este trabajo se presenta un caso de estudio que nos ha permitido determinar ciertos aspectos de calidad que pueden mejorar la expectativa de éxito en el análisis evitando resultados erróneos, incorrectos o poco fiables. Este es un primer paso hacia la consideración de manera sistemática y estructurada de criterios de calidad específicos para minería de datos que ayude al minero de datos en sus objetivos.
Resumo:
Comunicación presentada en las XVI Jornadas de Ingeniería del Software y Bases de Datos, JISBD 2011, A Coruña, 5-7 septiembre 2011.
Resumo:
El marco docente de algunas asignaturas de la licenciatura de biología se ha enfocado desde sus comienzos con una perspectiva integradora de los conocimientos teóricos y prácticos. Sin embargo, la preparación del alumnado para el mundo laboral, exige además, que el alumno esté capacitado para integrar los conocimientos que en algunos casos están diseminados por diferentes materias y asignaturas. La elaboración de proyectos de investigación, ha sido utilizada en los tres últimos años por los profesores de Biología marina e Inferencia estadística, como herramienta de interconexión entre asignaturas. En este artículo, se relata la experiencia de diseño de prácticas trasversales, el trabajo de coordinación entre profesorado y la integración y complementariedad de contenidos y objetivos entre asignaturas, así como la descripción de la metodología aplicada y el diseño conceptual de dichas prácticas trasversales, partiendo de una propuesta de desarrollo de un proyecto de investigación por parte de los alumnos.
Resumo:
El desarrollo de competencias transversales proporciona al alumno una formación integral. Sin embargo, la puesta en práctica de la transversalidad entre asignaturas no es una tarea trivial y plantea varios inconvenientes que deben resueltos de una manera óptima para aprovechar las sinergias entre asignaturas. En nuestro caso las necesidades son: i) espacio común para la gestión de documentos, ii) disponibilidad en cualquier momento y en cualquier lugar, y iii) posibilidad de colaboración en tareas de edición de los documentos. Hemos aplicado un portafolio discente en línea que permite evaluar el resultado del aprendizaje de las asignaturas en su conjunto, y para ello hemos usado las herramientas de acceso libre que proporciona Google por su interactividad, disponibilidad y facilidad para las tareas de colaboración.
Resumo:
La planificación de los programas educativos debe basarse y tener en cuenta las necesidades y tendencias de la sociedad. Para ello es necesario someter al proceso educativo a un diagnóstico y evaluación continuada, con el fin de detectar vacíos y fallos. El análisis DAFO -Debilidades-Amenazas-Fortalezas-Oportunidades- crea un marco de apoyo enfocado a identificar las necesidades de un sistema; en este caso, la sociedad educativa. Esta herramienta está diseñada para ser usado en estados preliminares de toma de decisiones o como un precursor de estrategias de planificación. En nuestro caso puede suministrar una visión general de la situación en la licenciatura de Ciencias del Mar, en base a un análisis interno por parte de los colectivos usuarios directos, además de una comprensión de los factores externos que permita conseguir una visión de futuro, con perspectivas a la hora de definir objetivos educativos, diseños programáticos o herramientas docentes eficientes. La experiencia docente obtenida durante los últimos años muestra que los alumnos, a menudo, no encuentran conexión entre los contenidos de las diferentes materias impartidas en una licenciatura y la extrapolación de los conocimientos adquiridos a situaciones reales, con una falta patente de motivación y una reducción en el rendimiento final de los alumnos en cuanto a asimilación de contenidos. Los resultados de este análisis ayudan a definir programas innovadores e integrados transversalmente, evitando contenidos redundantes e irrelevantes, y permitiendo una coherencia multidisciplinar. Con todo ello se espera mejorar el aprendizaje de contenidos transversales que permitan aprovechar los conocimientos en las materias para su aplicación posterior.