1000 resultados para Extracció de dades -- Automatització


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les tècniques de clustering poden ajudar a reduir la supervisió en processos d'obtenció de patrons per a Extracció d'Informació. En aquest treball, que abarca un període de 4 anys de recerca, es comença per estudiar la representació de documents més adequada per a la tasca de clustering. Per tal d'evitar els biaixos dels mètodes individuals de clustering, es consideren mètodes de clustering conjunt. S'exploren diversos mètodes de combinació supervisada, i s'hi afegeixen estratègies automàtiques per a determinar el nombre de clusters de la combinació. També es consideren mecanismes per a obtenir clusterings conjunts ponderats, així com estratègies de combinació no supervisada. Finalment, els resultats del clustering s'utilitzen en un sistema d'adquisició de patrons per a substituir els elements de supervisió humana. Totes aquestes estratègies i mètodes s'avaluen en tasques de clustering de documents i adquisició de patrons usant dades reals. Es comprova que els mots com representació de documents superen altres models per a la tasca de clustering, així com que el clustering conjunt supera les limitacions dels clusterings individuals, i que les estratègies no supervisades d'adquisició de patrons obtenen resultats competitius respecte a les estratègies supervisades.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Informe de investigación realizado a partir de una estancia en el Équipe de Recherche en Syntaxe et Sémantique de la Université de Toulouse-Le Mirail, Francia, entre julio y setiembre de 2006. En la actualidad existen diversos diccionarios de siglas en línea. Entre ellos sobresalen Acronym Finder, Abbreviations.com y Acronyma; todos ellos dedicados mayoritariamente a las siglas inglesas. Al igual que los diccionarios en papel, este tipo de diccionarios presenta problemas de desactualización por la gran cantidad de siglas que se crean a diario. Por ejemplo, en 2001, un estudio de Pustejovsky et al. mostraba que en los abstracts de Medline aparecían mensualmente cerca de 12.000 nuevas siglas. El mecanismo de actualización empleado por estos recursos es la remisión de nuevas siglas por parte de los usuarios. Sin embargo, esta técnica tiene la desventaja de que la edición de la información es muy lenta y costosa. Un ejemplo de ello es el caso de Abbreviations.com que en octubre de 2006 tenía alrededor de 100.000 siglas pendientes de edición e incorporación definitiva. Como solución a este tipo de problema, se plantea el diseño de sistemas de detección y extracción automática de siglas a partir de corpus. El proceso de detección comporta dos pasos; el primero, consiste en la identificación de las siglas dentro de un corpus y, el segundo, la desambiguación, es decir, la selección de la forma desarrollada apropiada de una sigla en un contexto dado. En la actualidad, los sistemas de detección de siglas emplean métodos basados en patrones, estadística, aprendizaje máquina, o combinaciones de ellos. En este estudio se analizan los principales sistemas de detección y desambiguación de siglas y los métodos que emplean. Cada uno se evalúa desde el punto de vista del rendimiento, medido en términos de precisión (porcentaje de siglas correctas con respecto al número total de siglas extraídas por el sistema) y exhaustividad (porcentaje de siglas correctas identificadas por el sistema con respecto al número total de siglas existente en el corpus). Como resultado, se presentan los criterios para el diseño de un futuro sistema de detección de siglas en español.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

El projecte dóna una visió global de l'entorn informàtic d'una multinacional del sector de l'energia, explica les parts que conformen el mòdul ISU del sistema SAP implantat en l'empresa i mostra detalladament l'extracció de dades per realitzar la migració d'una de les entitats del mòdul ISU, concretament, l'entitat punt de subministrament.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Con la creciente generación de resonancias magnéticas, los servicios de radiología necesitan aplicaciones que les faciliten el trabajo de acceso remoto a los datos y a las herramientas que utilicen para la extracción de datos para realizar sus diagnósticos. El objetivo de este proyecto es el de estudiar e integrar en la plataforma web del grupo de Imagen Médica del PIC llamada PICNIC (PIC NeuroImaging Center) un conjunto de aplicaciones para el estudio y procesamiento de neuroimagen con la implementación de herramientas software en la plataforma grid del PIC.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Es realitza un simulador de simulació discreta sobre el cicle de vida tancat en la producció de porcs. Per crear-lo s'utilitza el programa ExtendSim 6. Aquest simulador ens permet veure l'evolució durant cada etapa del cicle de vida del porc. D'aquí i de valors estadístics calculats es poden prendre decisions en la producció del porc. Per la seva realització s'ha creat uns blocs d'introducció i extracció de dades i uns de transició i engreix.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Projecte sobre l'extracció de dades massives de xarxes socials i els perills de publicar informació en aquestes pàgines web.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Treball de final de carrera de l'àrea de mineria de dades que té com a objectiu la implantació d'un projecte de

Relevância:

40.00% 40.00%

Publicador:

Resumo:

L'objectiu de treball ha estat mostrar les possibilitats de les aplicacions informàtiques de gestió sobre les dades amb les que treballen. Simplement mostren les dades guardades a les bases de dades d'explotació, de forma detallada o bé resumida i amb sumatoris. Sobre aquestes dades també es pot extreure coneixement.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

En els darrers anys les organitzacions han anat agafant consciència de la importància de la gestió de la seva informació. D'aquesta necessitat d'organitzar les pròpies dades d'una forma coherent i eficient per al seu anàlisi sorgeixen els magatzems de dades. El projecte "Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1" s'emmarca dins aquest context i te com a objectiu el disseny d'un magatzem de dades per a cobrir les necessitats del Institut Català d'Esports de Motor (ICEM) en la gestió de les seves dades referents a la Fórmula 1. En aquest projecte s'han executat les diferents fases necessàries per a la creació d'un nou magatzem. En primer lloc s'ha fet l'anàlisi de requeriments i de les dades disponibles. A continuació s'ha fet el disseny i la implementació física del magatzem de dades. Seguidament s'ha procedit amb l'extracció, transformació i càrrega de dades originals (ETL) i per finalitzar s'han creat els informes. Com a resultat s'han obtingut una sèrie d'informes per a ser consumits de manera immediata pels usuaris del ICEM. Aquests informes han de permetre l'anàlisi de les dades d'una forma senzilla i àgil. A més s'ha implementat un sistema d'actualització automàtic de les dades que per al manteniment de la informació del magatzem.La implementació del magatzem de dades s'ha fet sobre una base de dades Oracle 10g Express Edition i els informes s'ha dissenyat amb l'eina Oracle Discoverer. Per a l'automatització de les dades s'ha fet servir a més visual basic script i l'eina de càrrega SQL*Loader.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

L'àrea de treball en la qual se centra aquest projecte final de carrera (d'ara endavant PFC), es l'àrea de Compiladors. Aquesta àrea és present, es desenvolupa, a les assignatures "Compiladors I" i "Compiladors II" del pla d'estudis d'Enginyeria Informàtica ofert per la UOC. Òbviament, a un treball de síntesi com aquest no és suficient amb el coneixement assolit a aquestes dues assignatures i es posen en pràctica coneixements teòrics i pràctics assolits en altres assignatures com ara "Metodologia i gestió de projectes informàtics", "Enginyeria del programari orientat a l'objecte" o "Enginyeria del programari de components i sistemes distribuïts".

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Aquest Projecte Final és una prolongació d’altres Projectes Finals i d’un Projecte realitzat pel Laboratori d’Informació Geogràfica I Teledetecció per al Departament de Cadastre de l’Ajuntament de Cerdanyola del Vallès. El seu objectiu és la millora i l’ampliació de les funcionalitats d’una barra d’eines d’ArcMap anomenada GCad Cerdanyola, mitjançant VBA i les llibreries d’ArcObjects. Amb aquesta barra d’eines es podran fer seleccions alfanumèriques i cartogràfiques manualment o amb l’ajuda d’un constructor de consultes personalitzat, realitzar exportacions de les dades amb una fitxa cadastral en format Word o de la cartografia en dxf, a més d’una actualització de la cartografia.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

En aquest projecte s’han unificat les dades de l’empresa Solmania i s’han generat estadístiques i informes a diferents formats mitjançant una aplicació RIA implementada amb Adobe Flex. D’aquesta manera es pot fer un control dels paràmetres clau del negoci per ajudar a la companyia a aconseguir els objectius marcats d’una manera eficient. L’aplicatiu permet analitzar des de diversos punts de vista qualsevol tipus d’informació que genera el negoci i fer-ne comparatives de rendiment.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

El projecte té la finalitat de crear una aplicació en la plataforma Java pel departament de Documentació de l’empresa UNIT4 Ibérica, per tal de poder crear i desenvolupar les ajudes on-line dels productes que tenen actualment en el mercat. S’ha desenvolupat a les oficines que té UNIT4 Ibérica a Barberà del Vallès.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Customer Experience Management (CEM) se ha convertido en un factor clave para el éxito de las empresas. CEM gestiona todas las experiencias que un cliente tiene con un proveedor de servicios o productos. Es muy importante saber como se siente un cliente en cada contacto y entonces poder sugerir automáticamente la próxima tarea a realizar, simplificando tareas realizadas por personas. En este proyecto se desarrolla una solución para evaluar experiencias. Primero se crean servicios web que clasifican experiencias en estados emocionales dependiendo del nivel de satisfacción, interés, … Esto es realizado a través de minería de textos. Se procesa y clasifica información no estructurada (documentos de texto) que representan o describen las experiencias. Se utilizan métodos de aprendizaje supervisado. Esta parte es desarrollada con una arquitectura orientada a servicios (SOA) para asegurar el uso de estándares y que los servicios sean accesibles por cualquier aplicación. Estos servicios son desplegados en un servidor de aplicaciones. En la segunda parte se desarrolla dos aplicaciones basadas en casos reales. En esta fase Cloud computing es clave. Se utiliza una plataforma de desarrollo en línea para crear toda la aplicación incluyendo tablas, objetos, lógica de negocio e interfaces de usuario. Finalmente los servicios de clasificación son integrados a la plataforma asegurando que las experiencias son evaluadas y que las tareas de seguimiento son automáticamente creadas.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A partir de quatre sistemes operatius diferents que serveixen als departaments de Marketing, Vendes, Recursos Humans i Finances de l'empresa Globalhard i mitjançant un procés d'extracció, transformació i càrrega de les dades, construirem un magatzem de dades únic que respongui a les necessitats analítiques de l'empresa i doni suport al procés de presa de decisions.