Biblioteca Digital

1000 resultados para Mineria de dades -- TFM

Modelado, extracción y análisis de información del flujo de datos de Twitter

Relevância:

100.00% 100.00%

Publicador:

Resumo:

En este artículo se propone el análisis de las interacciones entre usuarios de Twitter, tanto lo que se genera alrededor de un usuario concreto como el análisis de un hashtag dado durante un periodo de tiempo establecido.

Veja mais

Intercanvi de dades per dominis continus i ordres parcials

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Projecte de recerca elaborat a partir d’una estada a la Universitat de Tsukuba, Japó, durant l’agost 2007. L’intercanvi de dades (rank swapping), que va ser originàriament definit per variables ordinals, s’aplica també a valors numèrics. En aquest treball en proposem una extensió per a dominis continus i per a conjunts parcialment ordenats.

Veja mais

Introducció d'una empresa a l'extracció del coneixement a partir d'unes dades

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Treball de final de carrera de l'àrea de mineria de dades que té com a objectiu la implantació d'un projecte de

Veja mais

Comparativa de rendiment OLAP per a diferents motors de bases de dades orientades a columnes

Relevância:

90.00% 90.00%

Publicador:

Resumo:

En aquest projecte es realitza una comparativa de rendiment i utilització entre els diferents models de bases de dades orientades a columnes mitjançant la construcció i explotació d'un cub OLAP utilitzant la suite de BI Pentaho.

Veja mais

Mineria d'opinions a Twitter en un entorn multilingüe

Relevância:

90.00% 90.00%

Publicador:

Resumo:

L'objectiu d'aquest treball serà fer mineria d'opinions de la xarxa social de microblogging Twitter. En primer lloc, durem a terme una tasca de classificació de sentiments fent servir un lexicó simple. A continuació, emprarem la tècnica de les regles d'associació i, finalment, farem tasques de clustering.

Veja mais

Magatzem de dades : Anàlisi d'un sistema de club de fitness

Relevância:

90.00% 90.00%

Publicador:

Resumo:

En aquest projecte es vol explorar en el mercat per trobar una bona solució open source de business intelligence que permeti als dirigents d'un club de fitness millorar la gestió dels seus centres i respondre's algunes preguntes que s'han començat a fer sobre el funcionament del seu negoci, el qual intueixen que ha patit un retrocés de beneficis i de confiança dels seus socis. La finalitat del treball ha estat crear un data warehouse que s'ajustés a les dades de què disposen, transformar-les mitjançant processos ETL i crear cubs OLAP per explotar-les amb eficàcia des de la plataforma de BI escollida.

Veja mais

MB-MDR: Model-Based Multifactor Dimensionality Reduction for detecting interactions in high-dimensional genomic data

Relevância:

80.00% 80.00%

Publicador:

Resumo:

L’anàlisi de l’efecte dels gens i els factors ambientals en el desenvolupament de malalties complexes és un gran repte estadístic i computacional. Entre les diverses metodologies de mineria de dades que s’han proposat per a l’anàlisi d’interaccions una de les més populars és el mètode Multifactor Dimensionality Reduction, MDR, (Ritchie i al. 2001). L’estratègia d’aquest mètode és reduir la dimensió multifactorial a u mitjançant l’agrupació dels diferents genotips en dos grups de risc: alt i baix. Tot i la seva utilitat demostrada, el mètode MDR té alguns inconvenients entre els quals l’agrupació excessiva de genotips pot fer que algunes interaccions importants no siguin detectades i que no permet ajustar per efectes principals ni per variables confusores. En aquest article il•lustrem les limitacions de l’estratègia MDR i d’altres aproximacions no paramètriques i demostrem la conveniència d’utilitzar metodologies parametriques per analitzar interaccions en estudis cas-control on es requereix l’ajust per variables confusores i per efectes principals. Proposem una nova metodologia, una versió paramètrica del mètode MDR, que anomenem Model-Based Multifactor Dimensionality Reduction (MB-MDR). La metodologia proposada té com a objectiu la identificació de genotips específics que estiguin associats a la malaltia i permet ajustar per efectes marginals i variables confusores. La nova metodologia s’il•lustra amb dades de l’Estudi Espanyol de Cancer de Bufeta.

Veja mais

Bioinformática: consultas cruzadas a bases de datos biomédicas remotas

Relevância:

80.00% 80.00%

Publicador:

Resumo:

En la presente memoria se detallan con exactitud los pasos y procesos realizados para construir una aplicación que posibilite el cruce de datos genéticos a partir de información contenida en bases de datos remotas. Desarrolla un estudio en profundidad del contenido y estructura de las bases de datos remotas del NCBI y del KEGG, documentando una minería de datos con el objetivo de extraer de ellas la información necesaria para desarrollar la aplicación de cruce de datos genéticos. Finalmente se establecen los programas, scripts y entornos gráficos que han sido implementados para la construcción y posterior puesta en marcha de la aplicación que proporciona la funcionalidad de cruce de la que es objeto este proyecto fin de carrera.

Veja mais

A Data mining approach to indirect inference

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Consider a model with parameter phi, and an auxiliary model with parameter theta. Let phi be a randomly sampled from a given density over the known parameter space. Monte Carlo methods can be used to draw simulated data and compute the corresponding estimate of theta, say theta_tilde. A large set of tuples (phi, theta_tilde) can be generated in this manner. Nonparametric methods may be use to fit the function E(phi|theta_tilde=a), using these tuples. It is proposed to estimate phi using the fitted E(phi|theta_tilde=theta_hat), where theta_hat is the auxiliary estimate, using the real sample data. This is a consistent and asymptotically normally distributed estimator, under certain assumptions. Monte Carlo results for dynamic panel data and vector autoregressions show that this estimator can have very attractive small sample properties. Confidence intervals can be constructed using the quantiles of the phi for which theta_tilde is close to theta_hat. Such confidence intervals are found to have very accurate coverage.

Veja mais

Implementación y entrenamiento de un modelo clasificatorio de red neural sobre la base de datos IGBADAT para la clasificación de las rocas basálticas de acuerdo a las clases del sistema de clasificación tradicional de Yoder and Tiller.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Aquest treball vol implementar un projecte de mineria de dades en l'àrea de la petrologia ígnia, especialitat englobada dins la geologia clàssica.

Veja mais

Recommender System Based on Consumer Product Reviews

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Consumer reviews, opinions and shared experiences in the use of a product is a powerful source of information about consumer preferences that can be used in recommender systems. Despite the importance and value of such information, there is no comprehensive mechanism that formalizes the opinions selection and retrieval process and the utilization of retrieved opinions due to the difficulty of extracting information from text data. In this paper, a new recommender system that is built on consumer product reviews is proposed. A prioritizing mechanism is developed for the system. The proposed approach is illustrated using the case study of a recommender system for digital cameras

Veja mais

Aplicación de técnicas de minería de datos a los log generados por CATEDU

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Extracción de conocimiento de los log generados por un servidor web aplicando técnicas de minería de datos.

Veja mais

Using free data mining software and clustering algorithms to find predictors from student qualifications

Relevância:

80.00% 80.00%

Publicador:

Resumo:

In this project a research both in finding predictors via clustering techniques and in reviewing the Data Mining free software is achieved. The research is based in a case of study, from where additionally to the KDD free software used by the scientific community; a new free tool for pre-processing the data is presented. The predictors are intended for the e-learning domain as the data from where these predictors have to be inferred are student qualifications from different e-learning environments. Through our case of study not only clustering algorithms are tested but also additional goals are proposed.

Veja mais

A survey on voltage sag events in power systems

Relevância:

80.00% 80.00%

Publicador:

Resumo:

This paper aims to survey the techniques and methods described in literature to analyse and characterise voltage sags and the corresponding objectives of these works. The study has been performed from a data mining point of view

Veja mais

Visual management of sags and incidents gathered in distribution substations for power quality management

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Monitor a distribution network implies working with a huge amount of data coining from the different elements that interact in the network. This paper presents a visualization tool that simplifies the task of searching the database for useful information applicable to fault management or preventive maintenance of the network

Veja mais

1000 resultados para Mineria de dades -- TFM

Filtro por publicador