Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
Contribuinte(s) |
Heuser, Carlos Alberto |
---|---|
Data(s) |
06/06/2007
2001
|
Resumo |
Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados. |
Formato |
application/pdf |
Identificador |
http://hdl.handle.net/10183/2178 000315470 |
Idioma(s) |
por |
Direitos |
Open Access |
Palavras-Chave | #Armazenamento : Dados #Recuperacao : Informacao #Banco : Dados semi-estruturados #Extração semântica |
Tipo |
Dissertação |