Biblioteca Digital

The need for a convergence between semi-structured data management and Information Retrieval techniques is manifest to the scientific community. In order to fulfil this growing request, W3C has recently proposed XQuery Full Text, an IR-oriented extension of XQuery. However, the issue of query optimization requires the study of important properties like query equivalence and containment; to this aim, a formal representation of document and queries is needed. The goal of this thesis is to establish such formal background. We define a data model for XML documents and propose an algebra able to represent most of XQuery Full-Text expressions. We show how an XQuery Full-Text expression can be translated into an algebraic expression and how an algebraic expression can be optimized.

Veja mais

Entre "Les mille et une nuits" et internet: la concurrence des genres et des discours dans la nouvelle littérature algérienne de langue francaise

Relevância:

20.00% 20.00%

Publicador:

Veja mais

Frame-driven Extraction of Linked Data and Ontologies from Text

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Ontology design and population -core aspects of semantic technologies- re- cently have become fields of great interest due to the increasing need of domain-specific knowledge bases that can boost the use of Semantic Web. For building such knowledge resources, the state of the art tools for ontology design require a lot of human work. Producing meaningful schemas and populating them with domain-specific data is in fact a very difficult and time-consuming task. Even more if the task consists in modelling knowledge at a web scale. The primary aim of this work is to investigate a novel and flexible method- ology for automatically learning ontology from textual data, lightening the human workload required for conceptualizing domain-specific knowledge and populating an extracted schema with real data, speeding up the whole ontology production process. Here computational linguistics plays a fundamental role, from automati- cally identifying facts from natural language and extracting frame of relations among recognized entities, to producing linked data with which extending existing knowledge bases or creating new ones. In the state of the art, automatic ontology learning systems are mainly based on plain-pipelined linguistics classifiers performing tasks such as Named Entity recognition, Entity resolution, Taxonomy and Relation extraction [11]. These approaches present some weaknesses, specially in capturing struc- tures through which the meaning of complex concepts is expressed [24]. Humans, in fact, tend to organize knowledge in well-defined patterns, which include participant entities and meaningful relations linking entities with each other. In literature, these structures have been called Semantic Frames by Fill- 6 Introduction more [20], or more recently as Knowledge Patterns [23]. Some NLP studies has recently shown the possibility of performing more accurate deep parsing with the ability of logically understanding the structure of discourse [7]. In this work, some of these technologies have been investigated and em- ployed to produce accurate ontology schemas. The long-term goal is to collect large amounts of semantically structured information from the web of crowds, through an automated process, in order to identify and investigate the cognitive patterns used by human to organize their knowledge.

Veja mais

Sviluppo di tecniche di Text Mining per la classificazione semantica di documenti

Relevância:

20.00% 20.00%

Publicador:

Veja mais

Text mining gerarchico: classificazione semantica di documenti in tassonomie di argomenti

Relevância:

20.00% 20.00%

Publicador:

Veja mais

Islamische Gelehrte zwischen Text und Praxis /// Arbeitspapiere / Institut für Ethnologie und Afrikastudien ; 16

Relevância:

20.00% 20.00%

Publicador:

Veja mais

Approssimazione di matrici ed applicazione al text mining.

Relevância:

20.00% 20.00%

Publicador:

Veja mais

La produzione drammatica dei fratelli Figueroa y Córdoba, con edizione critica di "Mentir y mudarse a un tiempo"

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Diego e José de Figueroa y Córdoba furono due fratelli drammaturghi, attivi nella seconda metà del XVII secolo, che praticarono assiduamente la scrittura in collaborazione. Nel tentativo di rivalutare questi autori ingiustamente dimenticati dalla critica odierna, il presente lavoro si propone di offrire uno studio introduttivo alle figure e al teatro dei due fratelli. Nella prima parte, si offre un profilo biografico dei fratelli Figueroa, riunendo le seppur scarse notizie che possediamo sulla loro vita, in modo da inquadrarne le personalità all’interno degli ambienti letterari dell’epoca. Ci si concentra, poi, sul corpus, proponendo una panoramica delle commedie scritte da Diego e José, dando di ciascuna una breve sinossi e un rapido inquadramento all’interno dei generi tipici del teatro aureo, e segnalando gli eventuali problemi di attribuzione. Si accenna, infine, alla collaborazione dei fratelli nella scrittura di molte delle loro commedie, avanzando alcune ipotesi sulla tecnica compositiva. La seconda parte è costituita da un repertorio bibliografico del teatro “maggiore” dei due fratelli, in cui si descrivono analiticamente tutti gli esemplari conosciuti delle comedias dei Figueroa. Ogni descrizione si completa con una lista delle biblioteche in cui l’esemplare è conservato, lista compilata attraverso la consultazione di cataloghi, cartacei e on-line, delle principali biblioteche con fondi di teatro spagnolo del Siglo de Oro. Infine, la terza parte è dedicata all’edizione critica di una delle commedie scritte in collaborazione da Diego e José: Mentir y mudarse a un tiempo, condotta usando come testo base un manoscritto probabilmente autografo. L’edizione si completa di un apparato critico, con analisi dei testimoni, stemma codicum e registro delle varianti. Precede l’edizione uno studio generale introduttivo all’opera.

Veja mais

Text Mining mediante l'utilizzo di Orange

Relevância:

20.00% 20.00%

Publicador:

Veja mais

Tecniche di text mining per l'autoorganizzazione della conoscenza

Relevância:

20.00% 20.00%

Publicador:

Resumo:

L'elaborato ha come scopo l'analisi delle tecniche di Text Mining e la loro applicazione all'interno di processi per l'auto-organizzazione della conoscenza. La prima parte della tesi si concentra sul concetto del Text Mining. Viene fornita la sua definizione, i possibili campi di utilizzo, il processo di sviluppo che lo riguarda e vengono esposte le diverse tecniche di Text Mining. Si analizzano poi alcuni tools per il Text Mining e infine vengono presentati alcuni esempi pratici di utilizzo. Il macro-argomento che viene esposto successivamente riguarda TuCSoN, una infrastruttura per la coordinazione di processi: autonomi, distribuiti e intelligenti, come ad esempio gli agenti. Si descrivono innanzi tutto le entità sulle quali il modello si basa, vengono introdotte le metodologie di interazione fra di essi e successivamente, gli strumenti di programmazione che l'infrastruttura mette a disposizione. La tesi, in un secondo momento, presenta MoK, un modello di coordinazione basato sulla biochimica studiato per l'auto-organizzazione della conoscenza. Anche per MoK, come per TuCSoN, vengono introdotte le entità alla base del modello. Avvalendosi MoK dell'infrastruttura TuCSoN, viene mostrato come le entità del primo vengano mappate su quelle del secondo. A conclusione dell'argomento viene mostrata un'applicazione per l'auto-organizzazione di news che si avvale del modello. Il capitolo successivo si occupa di analizzare i possibili utilizzi delle tecniche di Text Mining all'interno di infrastrutture per l'auto-organizzazione, come MoK. Nell'elaborato vengono poi presentati gli esperimenti effettuati sfruttando tecniche di Text Mining. Tutti gli esperimenti svolti hanno come scopo la clusterizzazione di articoli scientifici in base al loro contenuto, vengono quindi analizzati i risultati ottenuti. L'elaborato di tesi si conclude mettendo in evidenza alcune considerazioni finali su quanto svolto.

Veja mais

988 resultados para Text genres

Filtro por publicador