Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais


Autoria(s): Silveira, Iraci Cristina da
Contribuinte(s)

Heuser, Carlos Alberto

Data(s)

06/06/2007

2001

Resumo

Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.

Formato

application/pdf

Identificador

http://hdl.handle.net/10183/2178

000315470

Idioma(s)

por

Direitos

Open Access

Palavras-Chave #Armazenamento : Dados #Recuperacao : Informacao #Banco : Dados semi-estruturados #Extração semântica
Tipo

Dissertação