Indexação e pesquisa de informação com base em ontologias interligadas
Contribuinte(s) |
Silva, Nuno |
---|---|
Data(s) |
11/11/2013
11/11/2013
2011
|
Resumo |
Tecnologias da Web Semântica como RDF, OWL e SPARQL sofreram nos últimos anos um forte crescimento e aceitação. Projectos como a DBPedia e Open Street Map começam a evidenciar o verdadeiro potencial da Linked Open Data. No entanto os motores de pesquisa semânticos ainda estão atrasados neste crescendo de tecnologias semânticas. As soluções disponíveis baseiam-se mais em recursos de processamento de linguagem natural. Ferramentas poderosas da Web Semântica como ontologias, motores de inferência e linguagens de pesquisa semântica não são ainda comuns. Adicionalmente a esta realidade, existem certas dificuldades na implementação de um Motor de Pesquisa Semântico. Conforme demonstrado nesta dissertação, é necessária uma arquitectura federada de forma a aproveitar todo o potencial da Linked Open Data. No entanto um sistema federado nesse ambiente apresenta problemas de performance que devem ser resolvidos através de cooperação entre fontes de dados. O standard actual de linguagem de pesquisa na Web Semântica, o SPARQL, não oferece um mecanismo para cooperação entre fontes de dados. Esta dissertação propõe uma arquitectura federada que contém mecanismos que permitem cooperação entre fontes de dados. Aborda o problema da performance propondo um índice gerido de forma centralizada assim como mapeamentos entre os modelos de dados de cada fonte de dados. A arquitectura proposta é modular, permitindo um crescimento de repositórios e funcionalidades simples e de forma descentralizada, à semelhança da Linked Open Data e da própria World Wide Web. Esta arquitectura trabalha com pesquisas por termos em linguagem natural e também com inquéritos formais em linguagem SPARQL. No entanto os repositórios considerados contêm apenas dados em formato RDF. Esta dissertação baseia-se em múltiplas ontologias partilhadas e interligadas. Semantic Web technologies like RDF, OWL and SPARQL have suffered great growth and acceptance lately. Projects like the DBPedia and Open Street Map start to show the true potential of the Linking Open Data project. However Semantic Search engines still lag behind in this semantic technologies crescendo. The solutions available still rely on natural language processing. Powerful Semantic Web tools like ontologies, reasoners and semantic search languages are still not common. Adding to this reality, there are some difficulties in implementing a semantic search engine. As demonstrated in this dissertation, a federated architecture is necessary to take advantage of the full potential of the Linked Open Data. However a federated system in such environment has performance problems that must be solved by allowing cooperation between data sources. The current standard of semantic search, SPARQL, does not provide a mechanism for data source cooperation. This dissertation proposes a federated architecture with built-in mechanisms for cooperation between data sources. It also addresses the performance problem by proposing a centrally managed index structure and mappings between the data models of each data source. The proposed architecture is modular, allowing for repository and feature growth in a simple and decentralized way, just like the Linked Open Data and Word Wide Web. This architecture deals with query terms in natural language and with formal SPARQL queries. However the repositories considered are only of RDF data. This dissertation is based on multiple shared and interconnected ontologies. |
Identificador | |
Idioma(s) |
por |
Publicador |
Instituto Politécnico do Porto. Instituto Superior de Engenharia do Porto |
Direitos |
openAccess |
Palavras-Chave | #Web semântica #Motores de pesquisa #Ontologias #Semantic Web #Search engines #Ontologies |
Tipo |
masterThesis |