Técnicas de Data e Text Mining Para Anotação de Um Arquivo Digital
| Data(s) |
2010
|
|---|---|
| Resumo |
O presente trabalho cujo Título é técnicas de Data e Text Mining para a anotação dum Arquivo Digital, tem como objectivo testar a viabilidade da utilização de técnicas de processamento automático de texto para a anotação das sessões dos debates parlamentares da Assembleia da República de Portugal. Ao longo do trabalho abordaram-se conceitos como tecnologias de descoberta do conhecimento (KDD), o processo da descoberta do conhecimento em texto, a caracterização das várias etapas do processamento de texto e a descrição de algumas ferramentas open souce para a mineração de texto. A metodologia utilizada baseou-se na experimentação de várias técnicas de processamento textual utilizando a open source R/tm. Apresentam-se, como resultados, a influência do pré-processamento, tamanho dos documentos e tamanhos dos corpora no resultado do processamento utilizando o algoritmo knnflex. Cooperação Portuguesa Universidade de Aveiro |
| Formato |
application/pdf |
| Identificador | |
| Idioma(s) |
por |
| Direitos |
info:eu-repo/semantics/openAccess |
| Palavras-Chave | #Data Mining #Text Mining #Bases de Dados Textuais #Anotação de Documentos #Descritores de Texto. |
| Tipo |
info:eu-repo/semantics/masterThesis |