Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia


Autoria(s): Silva, Ana Carla Macedo da
Contribuinte(s)

Oliveira, Jose Palazzo Moreira de

Data(s)

06/06/2007

2002

Resumo

Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.

Formato

application/pdf

Identificador

http://hdl.handle.net/10183/4279

000409584

Idioma(s)

por

Direitos

Open Access

Palavras-Chave #Recuperacao : Informacao #Descoberta : Conhecimento
Tipo

Dissertação