971 resultados para BASES DE DATOS RELACIONALES
Resumo:
Debido al creciente aumento del tamaño de los datos en muchos de los actuales sistemas de información, muchos de los algoritmos de recorrido de estas estructuras pierden rendimento para realizar búsquedas en estos. Debido a que la representacion de estos datos en muchos casos se realiza mediante estructuras nodo-vertice (Grafos), en el año 2009 se creó el reto Graph500. Con anterioridad, otros retos como Top500 servían para medir el rendimiento en base a la capacidad de cálculo de los sistemas, mediante tests LINPACK. En caso de Graph500 la medicion se realiza mediante la ejecución de un algoritmo de recorrido en anchura de grafos (BFS en inglés) aplicada a Grafos. El algoritmo BFS es uno de los pilares de otros muchos algoritmos utilizados en grafos como SSSP, shortest path o Betweeness centrality. Una mejora en este ayudaría a la mejora de los otros que lo utilizan. Analisis del Problema El algoritmos BFS utilizado en los sistemas de computación de alto rendimiento (HPC en ingles) es usualmente una version para sistemas distribuidos del algoritmo secuencial original. En esta versión distribuida se inicia la ejecución realizando un particionado del grafo y posteriormente cada uno de los procesadores distribuidos computará una parte y distribuirá sus resultados a los demás sistemas. Debido a que la diferencia de velocidad entre el procesamiento en cada uno de estos nodos y la transfencia de datos por la red de interconexión es muy alta (estando en desventaja la red de interconexion) han sido bastantes las aproximaciones tomadas para reducir la perdida de rendimiento al realizar transferencias. Respecto al particionado inicial del grafo, el enfoque tradicional (llamado 1D-partitioned graph en ingles) consiste en asignar a cada nodo unos vertices fijos que él procesará. Para disminuir el tráfico de datos se propuso otro particionado (2D) en el cual la distribución se haciá en base a las aristas del grafo, en vez de a los vertices. Este particionado reducía el trafico en la red en una proporcion O(NxM) a O(log(N)). Si bien han habido otros enfoques para reducir la transferecnia como: reordemaniento inicial de los vertices para añadir localidad en los nodos, o particionados dinámicos, el enfoque que se va a proponer en este trabajo va a consistir en aplicar técnicas recientes de compression de grandes sistemas de datos como Bases de datos de alto volume o motores de búsqueda en internet para comprimir los datos de las transferencias entre nodos.---ABSTRACT---The Breadth First Search (BFS) algorithm is the foundation and building block of many higher graph-based operations such as spanning trees, shortest paths and betweenness centrality. The importance of this algorithm increases each day due to it is a key requirement for many data structures which are becoming popular nowadays. These data structures turn out to be internally graph structures. When the BFS algorithm is parallelized and the data is distributed into several processors, some research shows a performance limitation introduced by the interconnection network [31]. Hence, improvements on the area of communications may benefit the global performance in this key algorithm. In this work it is presented an alternative compression mechanism. It differs with current existing methods in that it is aware of characteristics of the data which may benefit the compression. Apart from this, we will perform a other test to see how this algorithm (in a dis- tributed scenario) benefits from traditional instruction-based optimizations. Last, we will review the current supercomputing techniques and the related work being done in the area.
Resumo:
Esta Tesis presenta un nuevo método para filtrar errores en bases de datos multidimensionales. Este método no precisa ninguna información a priori sobre la naturaleza de los errores. En concreto, los errrores no deben ser necesariamente pequeños, ni de distribución aleatoria ni tener media cero. El único requerimiento es que no estén correlados con la información limpia propia de la base de datos. Este nuevo método se basa en una extensión mejorada del método básico de reconstrucción de huecos (capaz de reconstruir la información que falta de una base de datos multidimensional en posiciones conocidas) inventado por Everson y Sirovich (1995). El método de reconstrucción de huecos mejorado ha evolucionado como un método de filtrado de errores de dos pasos: en primer lugar, (a) identifica las posiciones en la base de datos afectadas por los errores y después, (b) reconstruye la información en dichas posiciones tratando la información de éstas como información desconocida. El método resultante filtra errores O(1) de forma eficiente, tanto si son errores aleatorios como sistemáticos e incluso si su distribución en la base de datos está concentrada o esparcida por ella. Primero, se ilustra el funcionamiento delmétodo con una base de datosmodelo bidimensional, que resulta de la dicretización de una función transcendental. Posteriormente, se presentan algunos casos prácticos de aplicación del método a dos bases de datos tridimensionales aerodinámicas que contienen la distribución de presiones sobre un ala a varios ángulos de ataque. Estas bases de datos resultan de modelos numéricos calculados en CFD. ABSTRACT A method is presented to filter errors out in multidimensional databases. The method does not require any a priori information about the nature the errors. In particular, the errors need not to be small, neither random, nor exhibit zero mean. Instead, they are only required to be relatively uncorrelated to the clean information contained in the database. The method is based on an improved extension of a seminal iterative gappy reconstruction method (able to reconstruct lost information at known positions in the database) due to Everson and Sirovich (1995). The improved gappy reconstruction method is evolved as an error filtering method in two steps, since it is adapted to first (a) identify the error locations in the database and then (b) reconstruct the information in these locations by treating the associated data as gappy data. The resultingmethod filters out O(1) errors in an efficient fashion, both when these are random and when they are systematic, and also both when they concentrated and when they are spread along the database. The performance of the method is first illustrated using a two-dimensional toymodel database resulting fromdiscretizing a transcendental function and then tested on two CFD-calculated, three-dimensional aerodynamic databases containing the pressure coefficient on the surface of a wing for varying values of the angle of attack. A more general performance analysis of the method is presented with the intention of quantifying the randomness factor the method admits maintaining a correct performance and secondly, quantifying the size of error the method can detect. Lastly, some improvements of the method are proposed with their respective verification.
Resumo:
Trabajo que tiene por objetivo observar y describir el panorama de la investigación bibliométrica en la Argentina en el período comprendido entre los años 1984 y 2012, a partir del análisis de las publicaciones de autores de instituciones argentinas localizadas en buscadores web, repositorios temáticos y bases de datos regionales e internacionales. Interpreta las formas que revisten los ítems estudiados enfocando la atención en el volumen y evolución de la producción, tipo de literatura, idioma, temas y unidades de análisis. Calcula el índice de coautoría y tasas de colaboración nacional e internacional. Identifica los autores más productivos y las instituciones de afiliación más frecuentes. Determina la existencia de algunos grupos de investigación, caracterizando sus temáticas de investigación, las revistas donde publican y los congresos más frecuentes en los que participan
Resumo:
En un intento por mejorar las propuestas de la información, los medios de comunicación españoles, a través de los centros de documentación, se adaptan a los nuevos tiempos. Un recorrido por los últimos avances en materia de información y documentación permite a los lectores situarse frente a los retos y tareas para construir una buena información. Este texto, además, analiza el uso de la documentación por parte de los periodistas españoles, así como el funcionamiento de sus centros de documentación, con lo que se valora el servicio documental del medio y su influencia en la información, en una encuesta aplicada a través de la Asociación de la Prensa de Madrid. Otro de los objetivos es conocer el empleo de otras fuentes de información y bases de datos que los periodistas requieren para elaborar contenidos de calidad. Por último se pide a los periodistas que indiquen el valor que para ellos tienen las redes sociales Twitter, Facebook y LinkedIn.
Resumo:
En la actualidad, existe un concepto que está cobrando especial relevancia, el cual es conocido como IoT (Internet of Things, Internet de las Cosas) [1]. En el IoT [2] se define la interconexión digital de objetos cotidianos con internet, esto significa que no sólo “los humanos” tenemos la capacidad de conectarnos a internet, sino que caminamos hacia una nueva era donde prácticamente cualquier cosa podría ser conectada a internet, desde un reloj (smartwatch), como tenemos en la actualidad, hasta una nevera, una persiana, una sartén, etc. En este proyecto se ha querido aplicar ciertas fases del IoT, para convertir una información ambiental poco sesgada, proporcionada por una pequeña estación meteorológica, en un valor adicional a la hora de tomar decisiones basadas en las variables ambientales, para determinar, según un proceso de aprendizaje automático, la sensación que una persona percibe en relación al tiempo meteorológico en un determinado momento. Para ello utilizamos una serie de sensores que se encargan de darnos la información ambiental necesaria (como la temperatura, humedad y presión atmosférica) una fuente de procesamiento como puede ser un micro-controlador, para después poder manejarla y procesarla en la nube, de forma remota, adquiriendo así el valor añadido que se espera en el IoT. Además, en este proyecto se aplican técnicas de Inteligencia Artificial para ayudar al usuario en esa toma de decisiones, mediante un proceso de entrenamiento previo, que permite obtener información relevante para aplicarla posteriormente en el contexto meteorológico mencionado. Para manejar todos estos conceptos y elementos, se hace uso de servicios Web, bases de datos, procesamiento y aprendizaje automático, integrando todos los servicios en una misma plataforma que facilite la comunicación de todos los elementos involucrados.
Resumo:
Purpose: To determine the scientific evidence about the prevalence of accommodative and nonstrabismic binocular anomalies. Methods: We carried out a systematic review of studies published between 1986 and 2009, analysing the MEDLINE, CINAHL, FRANCIS and PsycINFO databases. We considered admitting those papers related to prevalence in paediatric and adult populations. We identified 660 articles and 10 papers met the inclusion criteria. Results: There is a wide range of prevalence, particularly for accommodative insufficiency (2 %-61.7 %) and convergence insufficiency (2.25 %-33 %). More studies are available for children (7) compared with adults (3). Most of studies examine clinical population (5 studies) with 3 assessed at schools and 1 at University with samples that vary from 65 to 2048 patients. There is great variability regarding the number of diagnostic signs ranging from 1 to 5 clinical signs. We found a relation between the number of clinical signs used and prevalence values for convergence insufficiency although this relationship cannot be confirmed for other conditions. Conclusion: There is a lack of proper epidemiological studies about the prevalence of accommodative and nonstrabismic binocular anomalies. Studies reviewed examine consecutive or selected patients in clinical settings and schools but in any case they are randomized and representative of their populations with no data for general population. The wide discrepancies in prevalence figures are due to both sample population and the lack of uniformity in diagnostic criteria so that it makes difficult to compile results. Biases and limitations of reports determine that prevalence rates offered are only estimations from selected populations.
Resumo:
A la luz de la Convergencia Europea, los títulos de grado en comunicación elaborados en España están fundamentados en las competencias requeridas para el ejercicio de cada una de las profesiones. Es necesario, pues, analizar al profesional de la Publicidad y las Relaciones Públicas, del Periodismo y de la Comunicación Audiovisual. Este trabajo pretende conocer los estudios de investigación centrados en este tema. Realiza una revisión sistemática de los artículos, libros y tesis doctorales sobre las profesiones de comunicador desde la década de los setenta hasta 2009, en las bases de datos ISOC, ISBN y TESEO. Extrae indicadores bibliométricos y sigue los criterios de evaluación mantenidos por la CNEAI (Comisión Nacional Evaluadora de la Actividad Investigadora) y la ANECA (Agencia Nacional de Evaluación de la Calidad y Acreditación) para valorar las investigaciones. Los resultados muestran que es la firma del Plan Bolonia lo que parece iniciar un ciclo de atención hacia las profesiones de comunicación. Periodismo es la profesión más estudiada. La mayoría de los estudios no cumplen con los criterios de calidad de las agencias evaluadoras. En conjunto, se observa la necesidad de aumentar la cantidad y la calidad de las investigaciones para realizar planes de estudios «basados en evidencia», así como la pertinencia de fortalecer la formación de los investigadores en la metodología de la investigación social.
Resumo:
Data mining is one of the most important analysis techniques to automatically extract knowledge from large amount of data. Nowadays, data mining is based on low-level specifications of the employed techniques typically bounded to a specific analysis platform. Therefore, data mining lacks a modelling architecture that allows analysts to consider it as a truly software-engineering process. Bearing in mind this situation, we propose a model-driven approach which is based on (i) a conceptual modelling framework for data mining, and (ii) a set of model transformations to automatically generate both the data under analysis (that is deployed via data-warehousing technology) and the analysis models for data mining (tailored to a specific platform). Thus, analysts can concentrate on understanding the analysis problem via conceptual data-mining models instead of wasting efforts on low-level programming tasks related to the underlying-platform technical details. These time consuming tasks are now entrusted to the model-transformations scaffolding. The feasibility of our approach is shown by means of a hypothetical data-mining scenario where a time series analysis is required.
Resumo:
Los Sistemas de Información Geográfica nos permiten estudiar la evolución en el tiempo de cualquier fenómeno o hecho físico que se pueda referenciar geográficamente. En el presente trabajo se realiza un estudio, mediante un Sistema de Información Geográfica, del desarrollo industrial de la Ciudad de Alcoy en el P. G. O. U. de 1957. En el tiempo de duración de este plan, que abarca un período de 32 años, con una única revisión en 1982, la ciudad ha sufrido grandes transformaciones económicas, sociales, industriales y urbanísticas. El trabajo pretende, por una parte, elaborar la cartografía de la evolución que ha sufrido la localización de la industria alcoyana y realizar un análisis en el que quede de manifiesto la política industrial llevada a cabo por las Administraciones y las consecuencias que ha tenido para el desarrollo de la ciudad. En segundo lugar, se pretende estudiar las posibilidades de una aplicación GIS como GeoMedia en la realización de dicho estudio, así como analizar el proceso para la realización del trabajo: digitalización de mapas, referenciación geográfica, utilización de mapas digitales, definición de entidades y clases de entidad, bases de datos a utilizar, consultas a realizar etc.
Resumo:
Objective: To review the scientific literature on pharmaceutical advertising aimed at health professionals in order to determine whether gender bias has decreased and the quality of information in pharmaceutical advertising has improved over time. Methods: We performed a content analysis of original articles dealing with medical drug promotion (1998-2008), according to quality criteria such as (a) the number, validity and accessibility of bibliographic references provided in pharmaceutical advertising and (b) the extent to which gender representations were consistent with the prevalence of the diseases. Databases: PUBMED, Medline, Scopus, Sociological Abstract, Eric and LILACS. Results: We reviewed 31 articles that analyzed advertising in medical journals from 1975-2005 and were published between 1998 and 2008. We found that the number of references used to support pharmaceutical advertising claims increased from 1975 but that 50% of these references were not valid. There was a tendency to depict men in paid productive roles, while women appeared inside the home or in non-occupational social contexts. Advertisements for psychotropic and cardiovascular drugs overrepresented women and men respectively. Conclusions: The use of bibliographic references increased between 1998 and 2008. However, representation of traditional male-female roles was similar in 1975 and 2005. Pharmaceutical advertisements may contribute to reinforcing the perception that certain diseases are associated with the most frequently portrayed sex.
Resumo:
Introduction: The nutritional registries are data bases through which we obtain the information to understand the nutrition of populations. Several main nutrition societies of the world have these types of registries, outstanding the NADYA (Home artificial and Ambulatory nutrition) group in Spain. The object of this study is to determine by means of a systematic review, the existent scientific production in the international data bases referred to nutritional support registries. Methods: Descriptive transversal study of the results of a critical bibliographic research done in the bioscience data bases: MEDLINE, EMBASE, The Cochrane Library, ISI (Web of Sciences), LILACS, CINHAL. Results: A total of 20 original articles related to nutritional registries were found and recovered. Eleven registries of eight countries were identified: Australia, Germany, Italy, Japan, Spain, Sweden, United Status and United Kingdom. The Price Index was of 65% and all the articles were published in the last 20 years. Conclusions: The Price Index highlights the innovativeness of this practice. The articles related to nutritional support are heterogeneous with respect to data and population, which exposes this as a limitation for a combined analysis.
Resumo:
Comunicación presentada en las VII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2002), dentro del II Taller sobre Ingeniería del Software Orientada al Web (Web Engineering) WebE'2002, El Escorial, Madrid, 19 noviembre 2002.
Resumo:
Comunicación presentada en las VIII Jornadas de Ingeniería del Software y Bases de Datos, JISBD 2003, Alicante, 12-14 noviembre 2003.
Resumo:
Comunicación presentada en las XVI Jornadas de Ingeniería del Software y Bases de Datos, JISBD 2011, A Coruña, 5-7 septiembre 2011.
Resumo:
Instalación de SQL Server Management Studio Express en un MS Windows 7 Profesional.