944 resultados para Minería de datos (Informática)


Relevância:

90.00% 90.00%

Publicador:

Resumo:

Presentación para la docencia de la asignatura "Ingeniería del conocimiento biomédico y del producto, I+D en investigación traslacional del Master Universitario Investigación Traslacional y Medicina Personalizda (Transmed)de la Universidad de Granada.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

En la actualidad, existen un gran número de investigaciones que usan técnicas de aprendizaje automático basadas en árboles de decisión. Como evolución de dichos trabajos, se han desarrollado métodos que usan Multiclasificadores (Random forest, Boosting, Bagging) que resuelven los mismos problemas abordados con árboles de decisión simples, aumentando el porcentaje de acierto. El ámbito de los problemas resueltos tradicionalmente por dichas técnicas es muy variado aunque destaca la bio-informática. En cualquier caso, la clasificación siempre puede ser consultada a un experto considerándose su respuesta como correcta. Existen problemas donde un experto en la materia no siempre acierta. Un ejemplo, pueden ser las quinielas (1X2). Donde podemos observar que un conocimiento del dominio del problema aumenta el porcentaje de aciertos, sin embargo, predecir un resultado erróneo es muy posible. El motivo es que el número de factores que influyen en un resultado es tan grande que, en muchas ocasiones, convierten la predicción en un acto de azar. En este trabajo pretendemos encontrar un multiclasificador basado en los clasificadores simples más estudiados como pueden ser el Perceptrón Multicapa o Árboles de Decisión con el porcentaje de aciertos más alto posible. Con tal fin, se van a estudiar e implementar una serie de configuraciones de clasificadores propios junto a multiclasificadores desarrollados por terceros. Otra línea de estudio son los propios datos, es decir, el conjunto de entrenamiento. Mediante un estudio del dominio del problema añadiremos nuevos atributos que enriquecen la información que disponemos de cada resultado intentando imitar el conocimiento en el que se basa un experto. Los desarrollos descritos se han realizado en R. Además, se ha realizado una aplicación que permite entrenar un multiclasificador (bien de los propios o bien de los desarrollados por terceros) y como resultado obtenemos la matriz de confusión junto al porcentaje de aciertos. En cuanto a resultados, obtenemos porcentajes de aciertos entre el 50% y el 55%. Por encima del azar y próximos a los resultados de los expertos.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

La Analítica Web supone hoy en día una tarea ineludible para las empresas de comercio electrónico, ya que les permite analizar el comportamiento de sus clientes. El proyecto Europeo SME-Ecompass tiene como objetivo desarrollar herramientas avanzadas de analítica web accesibles para las PYMES. Con esta motivación, proponemos un servicio de integración de datos basado en ontologías para recopilar, integrar y almacenar información de traza web procedente de distintas fuentes.Estas se consolidan en un repositorio RDF diseñado para proporcionar semántica común a los datos de análisis y dar servicio homogéneo a algoritmos de Minería de Datos. El servicio propuesto se ha validado mediante traza digital real (Google Analitics y Piwik) de 15 tiendas virtuales de diferentes sectores y países europeos (UK, España, Grecia y Alemania) durante varios meses de actividad.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

El objetivo de este trabajo es estudiar el Desastre del Titanic, utilizando la metodología del Descubrimiento del Conocimiento (KDD). La tesis propone diferentes variantes de cómo aplicar técnicas de Minería de Datos y herramientas del Aprendizaje Automático para predecir de forma eficiente la sobrevivencia de los pasajeros. Con este fin se han adaptado diferentes algoritmos de pre-procesamiento de datos, selección de variables y clasificación, a las características particulares del problema tratado. Algunos de estos algoritmos han sido implementados o sus implementaciones han sido modificadas para el caso específico del problema del Titanic.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

In the analysis of relations among the elements of two sets it is usual to obtain different values depending on the point of view from which these relations are measured. The main goal of the paper is the modelization of these situations by means of a generalization of the L-fuzzy concept analysis called L-fuzzy bicontext. We study the L-fuzzy concepts of these L-fuzzy bicontexts obtaining some interesting results. Specifically, we will be able to classify the biconcepts of the L-fuzzy bicontext. Finally, a practical case is developed using this new tool.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Diferentes corrientes teóricas han intentado conocer cuáles son los factores que inciden en los procesos educativos, cuál es su relevancia y cómo podrían ser modificadas con la finalidad de obtener una mejor calidad en la educación. Fortalecer esta corriente de investigación en México es imprescindible. El objetivo de este trabajo es, identificar factores individuales, familiares y escolares incidentes en el nivel de logro académico en matemáticas de estudiantes de tercer año de secundaria. Se analizaran los resultados del examen de matemáticas propuesto por la Evaluación Nacional de Logro Académico en Centros Escolares (ENLACE). También se estudiaran los resultados de los cuestionarios de contexto que se aplicaron a una muestra representativa de estudiantes a sus profesores y a sus padres. Para ello se hará uso de Minería de Datos con el objetivo de encontrar relaciones ocultas entre las variables, sacar conclusiones y generar conocimiento a partir de estas.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Contexto: la esquizofrenia es un síndrome complejo relacionado con genes y factores de riesgo no genéticos. Estudios epidemiológicos reconocidos reportan su presencia en todas las culturas y regiones geográficas. En este sentido, las Hipótesis Etiológicas Unificadas enfrentan simultáneamente el desafío de presentar los datos experimentales y demostrar que éstos dan cuenta del perfil universal del síndrome. Objetivos: revisar sistemáticamente las más prominentes Hipótesis Etiológicas Unifi - cadas, así como la distribución semántica de los hallazgos genéticos (mediante técnicas de minería de datos) y proponer un nuevo modelo, basado en los efectos dinámicos de carácter epigenético sobre la activación genética en el neurodesarrollo y la pubertad. Resultados: de manera general, las Hipótesis Etiológicas Unificadas contradicen los  principales hallazgos genéticos (que sugieren que la esquizofrenia está asociada al perfil de neurotransmisores como D-1 y la cascada Glutamato-NMDA); también, por regla general, los hallazgos genéticos se encuentran esparcidos por todo el genoma (tal como revelamos en un mapa topológico de los 3519 estudios en el asunto). La clave para este estado complejo de cosas puede estar representada por la asociación entre la perspectiva de que cada polimorfismo asociado a la esquizofrenia representa un factor de riesgo estadístico (es decir, aumentando el riesgo de inestabilidades del desarrollo), mientras que las cascadas moleculares de carácter epigenético y los factores de riesgo ambientales permanecen actuantes mediante la activación de genes en períodos críticos.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

El thinner es uno de los productos de mayor utilización en la industria de las pinturas, lubricantes y pegamentos. Su composición es variable de acuerdo con su uso y calidad. Sin embargo, la exposición crónica es una preocupación debido a que puede afectar órganos principales tales como pulmones, hígado, riñón y glándulas suprarrenales. En este estudio fue caracterizada la composición de varias muestras de thinner, disponibles comercialmente en la ciudad de Cartagena, que fueron recolectadas en diferentes almacenes y analizadas por cromatografía de gases acoplada a espectrometría de masas (GC/MS). Los resultados mostraron que no solo la composición, sino también la distribución relativa de los componentes presentes en las muestras son variables. Treinta y dos compuestos fueron detectados, entre los que se encuentran: tolueno, o-xileno, pxileno y etilbenceno, con frecuencias de aparición de 91,7, 66,7, 75,0 y 66,7 %, respectivamente. El desconocimiento del riesgo de intoxicación, generado al manipular este tipo de mezclas, puede ser la causa de muchos de los problemas de salud en personas expuestas al thinner, tanto en actividades laborales como domésticas. Una minería de datos mostró la asociación potencial entre los componentes del thinner y manifestaciones clínicas, las cuales incluyen daño renal y hepático, pérdida de cabello, alteraciones hematológicas, dermatitis, ansiedad y problemas de equilibrio, entre otras. En conclusión, el thinner posee gran variabilidad tanto en sus componentes como en la proporción relativa de los mismos. Los efectos perjudiciales en la salud por exposición directa o indirecta a estos componentes han sido ampliamente descritos en la literatura

Relevância:

80.00% 80.00%

Publicador:

Resumo:

El objetivo primero de este Proyecto fue el de crear una base de datos informática que diese cobertura a todo el ámbito universitario en las materias de correo electrónico y transferencia de ficheros vía telefónica. Se realizó este servidor basándose en el software Remote Access, pero dada su limitación a una sola línea telefónica se consideró no adaptado a las nuevas demandas del mundo de las telecomunicaciones y se rechazó. Los objetivos planteados a partir de ese momento fueron: Crear un servidor FTP que puedan utilizar los alumnos de la universidad para tomar ficheros y dar a conocer los suyos propios por toda Internet. Crear un servidor WWW que diese cabida a todas las asociaciones de la universidad, pues el espacio facilitado por ésta resulta limitado. Crear un entorno de Mundo Virtual donde los alumnos de la universidad y de otras partes del mundo se puedan conectar, facilitando el intercambio de ficheros, ideas y otros. Dar cabida a todos los proyectos vía Internet.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Este documento no está publicado

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Describir y analizar los Sistemas de Documentación Automatizada en Educación entendidos como el conjunto de centros, servicios y productos documentales, con especial atención a las Bases de Datos. Elaborar un tesauro en castellano centrado en los métodos y técnicas de la investigación en educación. Sistemas de Documentación automatizada en Educación considerados como instrumentos de la investigación o como integrantes de la infraestructura de la misma. Estudio teórico que está dividido en los siguientes apartados: conceptos generales de documentación; la cadena documental; lenguajes documentales; almacenamiento y difusión de la información; bases de datos; informática documental; conceptos generales sobre tesauros; elaboración de tesauros; bases de datos sobre educación; tesauros sobre educación; consideraciones previas a la elaboración del Tesauro de Investigación Educativa; revisión de los tesauros existentes; obtención, selección y reducción de términos; estructuración del Tesauro; partes del Tesauro y programas informáticos usados; presentación del Tesauro. Fuentes bibliográficas. Programas Informáticos. Análisis bibliográfico. Descripción y comparación de los principales Bases de Datos sobre Educación españolas como extranjeras y de los tesauros relativos a Educación. Los sistemas automáticos de documentación, posibilitan una eficaz, rápida y selectiva recuperación de la información. De las 21 Bases existentes y accesibles en línea desde España destacan 'Eric' y 'Nicen'. Hay un incremento en Bases sobre Educación Especializadas. En España se detecta un cierto retraso debido a la tardía incorporación del país a este tipo de actividad. En 1985, había 70 Bases destacando las que se dedican a Humanidades y Cultura. Existen a nivel nacional, cinco bases centradas en Educación: Bide, Leda, Redinet, Isoc, Dédalo. El Tesauro constituirá la base de los sistemas expertos que próximamente se usarán. Los tesauros de uso más frecuente en Educación son: Eric, Eudisec y el de la Unesco: OIE (éstos dos últimos poseen versión castellana pero son multilingües). El Tesauro que aquí se presenta, trata de responder a la necesidad de poseer un Tesauro en Castellano y que responda a la característica del Sistema Educativo Español y a las demandas y trabajo de la comunidad científica y Profesional de las Ciencias de la Educación. Tendencia a la proliferación de pequeñas Bases sectoriales y especializadas de fácil acceso a gran número de usuarios. El Tesauro presentado es un instrumento útil en la indización y recuperación de la información tanto para analizar las Investigaciones Educativas desde el punto de vista de la metodología y técnicas, como en el análisis de cualquier documento relativo a esta materia.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Monográfico con el título: 'Adaptación y accesibilidad de las tecnologías para el aprendizaje'. Resumen basado en el de la publicación