924 resultados para Information Retrieval, Document Databases, Digital Libraries
Resumo:
The extraction of relevant terms from texts is an extensively researched task in Text- Mining. Relevant terms have been applied in areas such as Information Retrieval or document clustering and classification. However, relevance has a rather fuzzy nature since the classification of some terms as relevant or not relevant is not consensual. For instance, while words such as "president" and "republic" are generally considered relevant by human evaluators, and words like "the" and "or" are not, terms such as "read" and "finish" gather no consensus about their semantic and informativeness. Concepts, on the other hand, have a less fuzzy nature. Therefore, instead of deciding on the relevance of a term during the extraction phase, as most extractors do, I propose to first extract, from texts, what I have called generic concepts (all concepts) and postpone the decision about relevance for downstream applications, accordingly to their needs. For instance, a keyword extractor may assume that the most relevant keywords are the most frequent concepts on the documents. Moreover, most statistical extractors are incapable of extracting single-word and multi-word expressions using the same methodology. These factors led to the development of the ConceptExtractor, a statistical and language-independent methodology which is explained in Part I of this thesis. In Part II, I will show that the automatic extraction of concepts has great applicability. For instance, for the extraction of keywords from documents, using the Tf-Idf metric only on concepts yields better results than using Tf-Idf without concepts, specially for multi-words. In addition, since concepts can be semantically related to other concepts, this allows us to build implicit document descriptors. These applications led to published work. Finally, I will present some work that, although not published yet, is briefly discussed in this document.
Resumo:
Fado was listed as UNESCO Intangible Cultural Heritage in 2011. This dissertation describes a theoretical model, as well as an automatic system, able to generate instrumental music based on the musics and vocal sounds typically associated with fado’s practice. A description of the phenomenon of fado, its musics and vocal sounds, based on ethnographic, historical sources and empirical data is presented. The data includes the creation of a digital corpus, of musical transcriptions, identified as fado, and statistical analysis via music information retrieval techniques. The second part consists in the formulation of a theory and the coding of a symbolic model, as a proof of concept, for the automatic generation of instrumental music based on the one in the corpus.
Resumo:
Due to advances in information technology (e.g., digital video cameras, ubiquitous sensors), the automatic detection of human behaviors from video is a very recent research topic. In this paper, we perform a systematic and recent literature review on this topic, from 2000 to 2014, covering a selection of 193 papers that were searched from six major scientific publishers. The selected papers were classified into three main subjects: detection techniques, datasets and applications. The detection techniques were divided into four categories (initialization, tracking, pose estimation and recognition). The list of datasets includes eight examples (e.g., Hollywood action). Finally, several application areas were identified, including human detection, abnormal activity detection, action recognition, player modeling and pedestrian detection. Our analysis provides a road map to guide future research for designing automatic visual human behavior detection systems.
Resumo:
Dissertação de Mestrado em Engenharia Informática
Resumo:
Multimedia, retrieval, multimedia-retrieval-system, multimedia query languages, weighting, preferences
Resumo:
Aquest article ofereix una visió general de les activitats en l'àrea dels museus virtuals i posa en consideració una sèrie de temes, en què s'han trobat paral·lelismes amb el camp de les biblioteques digitals.
Resumo:
Cada cop més, els editors d'avui dia actuen a nivell global per proveïr informació electrònica, i és responsabilitat de les biblioteques actuar a nivell global per expressar les seves posicions al mercat pel que fa a les polítiques de preus i altres requisits i condicions relatius a l'adquisició d'informació publicada. Aquest document actualitza les declaracions anteriors de l'ICOLC sobre el context actual de la informació electrònica, el context que desitjem per al futur, i els usos preferits per tal que els consorcis de biblioteques i les seves biblioteques membre puguin assolir els resultats desitjats. En aquesta actualització general, emfatitzem els aspectes referents a l'economia i les polítiques de preus, que han estat una preocupació destacada des de les primeres trobades de l'ICOLC el 1996 i al llarg de les Declaracions que hem fet fins ara.
Resumo:
En la presente memoria se detallan con exactitud los pasos y procesos realizados para construir una aplicación que posibilite el cruce de datos genéticos a partir de información contenida en bases de datos remotas. Desarrolla un estudio en profundidad del contenido y estructura de las bases de datos remotas del NCBI y del KEGG, documentando una minería de datos con el objetivo de extraer de ellas la información necesaria para desarrollar la aplicación de cruce de datos genéticos. Finalmente se establecen los programas, scripts y entornos gráficos que han sido implementados para la construcción y posterior puesta en marcha de la aplicación que proporciona la funcionalidad de cruce de la que es objeto este proyecto fin de carrera.
Resumo:
Aquest document explica com és aquesta web actual o sintàctica, basada en llenguatge HTML, i perquè no treu més profit de la ingent quantitat d'informació que conté. També explica d'una manera detallada quina és l'alternativa que la comunitat informàtica proposa per tal de superar aquests inconvenients.
Resumo:
Aquest projecte s'emmarca dintre la idea de la Web Semàntica. A la primera part introdueix progressivament al tema de la Web Semàntica fins arribar a establir la necessitat de tenir SGBDs. La segon part explota algun dels SGBDs estudiats per realitzar una aplicació web que permeti mostrar alguna aplicació de la Web Semàntica.
Resumo:
Aquest treball de fi de carrera es desenvolupa dins l'àrea de J2EE. Es basa en el desenvolupament d'una aplicació web destinada a gestionar els cursos que s'imparteixen en un ajuntament pels habitants del poble que ho desitjin.
Resumo:
En aquest treball es presenta una visió global del problema de la facilitat d?ús i la facilitat d?accés de les pàgines web per als cecs.
Resumo:
El departament d'Audiovisuals de TMB dedicat a l'elaboració de reportatges, a videos i a publicacions sobre totes les activitats de l'empresa es planteja la necessitat de tenir una aplicació via web on es pugui accedir d'una manera fàcil i còmoda a la base de dades dels seus productes, aquesta funcionalitat tindrà com a usuaris en una primera fase el propi departament i en una segona fase per a usuaris que accedeixin des de diferents punts accessos (Quioscs) repartits per tota la ciutat.
Resumo:
El projecte consisteix en el disseny i implementació d'una aplicació web utilitzant una de les tecnologies punteres en el desenvolupament d'aquest tipus d'aplicacions, J2EE, que compta amb un base d'instal·lacions que la poden allotjar força àmplia.
Resumo:
L'objectiu d'aquest treball és especificar, dissenyar i implementar una aplicació web que permeti l'operativa real dels serveis de gestió d'una botiga virtual d'Internet, amb el suport d'un sistema de gestió de bases de dades.