CADWeb: categorização automática de documentos digitais


Autoria(s): Gomes,Georgia Regina Rodrigues; Moraes Filho,Rubens de Oliveira
Data(s)

01/04/2011

Resumo

Com a evolução da tecnologia da informação e a disseminação de documentos digitais na Web, faz-se necessário criar meios que forneçam um mecanismo de organização de tais documentos, facilitando sua busca e recuperação. Em bibliotecas digitais ou repositórios de obras eletrônicas, por exemplo, existe a necessidade de uma ferramenta que possa classificar automaticamente os documentos, visto que o processo de classificação (categorização) é feito de forma manual. Esta ferramenta será de grande importância no apoio à catalogação. Este artigo apresenta o desenvolvimento de uma ferramenta que tem como objetivo principal classificar automaticamente documentos digitais em categorias preestabelecidas, nas quais cada documento pertencerá a uma ou mais categorias de acordo com seu conteúdo, tornando assim mais eficaz e rápida a classificação. Na elaboração da ferramenta foram utilizadas técnicas e algoritmos de mineração de textos, sendo definidas no estudo de caso algumas categorias e termos relacionados, tais como informática, direito e física, para validar a ferramenta.

Formato

text/html

Identificador

http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-19652011000100005

Idioma(s)

pt

Publicador

IBICT

Fonte

Ciência da Informação v.40 n.1 2011

Palavras-Chave #Tecnologia da informação #Categorização #Biblioteca digital #Mineração de texto #Documentos digitais
Tipo

journal article