Aplicando Métodos de Mineração Visual de Texto em conteúdo de Fórum de Discussão


Autoria(s): Pacheco Júnior, João Carlos
Contribuinte(s)

Universidade Estadual Paulista (UNESP)

Data(s)

23/03/2015

23/03/2015

2011

Resumo

We are included in a society where the use of the Internet became very important to our everyday life. The relationships nowadays usually happen through technological devices instead of face to face contact, for instance, Internet forums where people can discuss online. However, the global analysis is a big challenge, due to the large amount of data. This work investigates the use of visual representations to support an exploratory analysis of contents in messages from discussions forums. This analysis considers the thematic and the chronology. The target forums refer to the educational area and the analysis happens manually, i.e. by direct reading message-by-message. The proprieties of perception and cognition of the human visual system allow a person the capacity to conduct high-level tasks in information extraction from a graphical or visual representation of data. Therefore, this work was based on Visual Analytics, an area that aims create techniques that amplify these human abilities. For that reason we used software that creates a visualization of data from a forum. This software allows a forum content analysis. But, during the work, we identified the necessity to create a new tool to clean the data, because the data had a lot of unnecessary information. After cleaning the data we created a new visualization and held an analysis seeking a new knowledge. In the end we compared the new visualization with the manual analysis that had been made. Analyzing the results, it was evident the potential of visualization use, it provides a better correlation between the information, enabling the acquisition of new knowledge that was not identified in the initial analysis, providing a better use of the forum content

Estamos inseridos em uma sociedade em que o uso da internet se tornou crucial para o nosso dia a dia. Muitas das relações que ocorriam pessoalmente, hoje acontecem por meio de recursos tecnológicos como por exemplo, as discussões muito comuns através de fóruns. Mas a análise global dos dados provenientes dos fóruns se caracteriza como um grande desafio, devido à grande quantidade de dados. Este trabalho investiga o uso de representações visuais no suporte à análise exploratória do conteúdo de mensagens de fóruns de discussão considerando, além do eixo temático a cronologia das mensagens. Os fóruns alvo se referem à área educacional e, em geral, as análises realizadas nesses conteúdos acontecem de forma manual, isto é, pela leitura direta mensagem-a-mensagem. As propriedades de percepção e cognição do sistema visual conferem ao ser humano grande capacidade para a realização de tarefas de alto nível na extração de informações a partir de uma representação gráfica ou visual dos dados. Portanto, este trabalho foi fundamentado em Visual Analitycs, área que busca criar técnicas que amplifiquem estas habilidades do ser humano. Assim sendo, foi utilizado um software que cria uma visualização dos dados provenientes de um fórum, possibilitando uma análise do conteúdo discutido. Entretanto, durante o trabalho foi identificada a necessidade de implementar ferramenta de pré-filtro devido à grande quantidade de informação desnecessária para a busca de informações relevantes. Depois de realizado o pré-filtro foi gerada uma nova visualização realizada uma análise buscando novos conhecimentos e comparando com a análise manual que havia sido feita. Os resultados evidenciaram o potencial da utilização da visualização, pois fornece uma melhor correlação entre as informações possibilitando a obtenção de novos conhecimentos não identificados nas análise iniciais, proporcionando um melhor aproveitamento

Identificador

PACHECO JÚNIOR, João Carlos. Aplicando Métodos de Mineração Visual de Texto em conteúdo de Fórum de Discussão. 2011. 1 CD-ROM. Trabalho de conclusão de curso (bacharelado - Ciência da Computação) - Universidade Estadual Paulista, Faculdade de Ciências e Tecnologia, 2011.

http://hdl.handle.net/11449/120364

000707601

pachecojunior_jc_tcc_prud.pdf

Idioma(s)

por

Publicador

Universidade Estadual Paulista (UNESP)

Direitos

openAccess

Palavras-Chave #Computação #Internet #Teoria do conhecimento #Mineração de dados (Computação)
Tipo

info:eu-repo/semantics/bachelorThesis