1000 resultados para Minería de textos
Resumo:
Esta tese apresenta uma abordagem baseada em conceitos para realizar descoberta de conhecimento em textos (KDT). A proposta é identificar características de alto nível em textos na forma de conceitos, para depois realizar a mineração de padrões sobre estes conceitos. Ao invés de aplicar técnicas de mineração sobre palavras ou dados estruturados extraídos de textos, a abordagem explora conceitos identificados nos textos. A idéia é analisar o conhecimento codificado em textos num nível acima das palavras, ou seja, não analisando somente os termos e expressões presentes nos textos, mas seu significado em relação aos fenômenos da realidade (pessoas, objetos, entidades, eventos e situações do mundo real). Conceitos identificam melhor o conteúdo dos textos e servem melhor que palavras para representar os fenômenos. Assim, os conceitos agem como recursos meta-lingüísticos para análise de textos e descoberta de conhecimento. Por exemplo, no caso de textos de psiquiatria, os conceitos permitiram investigar características importantes dos pacientes, tais como sintomas, sinais e comportamentos. Isto permite explorar o conhecimento disponível em textos num nível mais próximo da realidade, minimizando o problema do vocabulário e facilitando o processo de aquisição de conhecimento. O principal objetivo desta tese é demonstrar a adequação de uma abordagem baseada em conceitos para descobrir conhecimento em textos e confirmar a hipótese de que este tipo de abordagem tem vantagens sobre abordagens baseadas em palavras. Para tanto, foram definidas estratégias para identificação dos conceitos nos textos e para mineração de padrões sobre estes conceitos. Diferentes métodos foram avaliados para estes dois processos. Ferramentas automatizadas foram empregadas para aplicar a abordagem proposta em estudos de casos. Diferentes experimentos foram realizados para demonstrar que a abordagem é viável e apresenta vantagens sobre os métodos baseados em palavras. Avaliações objetivas e subjetivas foram conduzidas para confirmar que o conhecimento descoberto era de qualidade. Também foi investigada a possibilidade de se realizar descobertas proativas, quando não se tem hipóteses iniciais. Os casos estudados apontam as várias aplicações práticas desta abordagem. Pode-se concluir que a principal aplicação da abordagem é permitir análises qualitativa e quantitativa de coleções textuais. Conceitos podem ser identificados nos textos e suas distribuições e relações podem ser analisadas para um melhor entendimento do conteúdo presente nos textos e, conseqüentemente, um melhor entendimento do conhecimento do domínio.
Resumo:
Este trabalho é sobre produção de sentidos. Seu propósito está relacionado à investigação das relações do sujeito com a linguagem na sua forma de escrita alfabética no processo de produção textual escolar. O fato de ocorrer a partir da análise de falas de crianças ao escreverem coletivamente histórias no computador possui dois objetivos; de um lado, interrogar sobre a representação do sujeito no texto e, de outro, questionar a utilização do computador nas escolas como uma nova tecnologia da escrita. Para que fosse possível dar alguma visibilidade ao processo de produção textual e não restringir-se apenas ao produto final, quer dizer à história pronta, optou-se por uma metodologia que permitisse algum tipo de acesso ao modo como a criança produzia o texto. Uma solução viável foi encontrada na gravação das situações interativas de conversação, em que cada grupo de alunos estaria produzindo sua história no computador. Esta gravação tornou-se o material a ser analisado. O referencial teórico está fundamentado na psicanálise, a partir de Jacques Lacan, na lingüística enunciativa, representada por Jaqueline Authier-Revuz e na análise de discurso inaugurada por Michel Pêcheux. Seguindo estas teorias, analisamos o sujeito da enunciação e o inconsciente enquanto discurso do Outro. A análise buscou a indicação de autonímias, onde destacam-se as “não-coincidências do dizer”, termo cunhado por Authier-Revuz para explicitar a presença do outro na constituição do discurso. A partir da análise apontamos para o sujeito como um efeito de leitura do discurso do Outro, um acontecimento que reconfigura a estrutura. Disso segue que todo discurso parte de uma escrita, pois se abre à leitura. Também apontamos para a escrita como a presentificação da diferença. Neste sentido postulamos que a autonímia é constitutiva do discurso pedagógico no que se refere à aprendizagem da língua escrita. Ela é um recurso necessário ao alfabeto. Sem a possibilidade da autonímia seria impossível o ensino da língua.. A partir destes resultados temos indícios que confirmam a hipótese de que o computador é uma nova tecnologia da escrita, assim como foram uma vez o papiro, o alfabeto, a imprensa. De certo modo a questão do sujeito e da linguagem ainda é a mesma, ou seja, diante do real o que o sujeito demanda é que ele seja representável. A forma que esta representação vai tomar depende dos discursos em questão.
Resumo:
Este trabalho está relacionado ao Ambiente Multiagente de Ensino-Aprendizagem (AME-A), no qual os agentes que o compõem preocupam-se em ensinar e/ou aprender. A ferramenta descrita neste trabalho baseia-se, em parte, na idéia do agente Promove_Interação, que tem por objetivo possibilitar que diversos aprendizes e professores se comuniquem, através da Internet e discutam assuntos determinados por um professor. Procurando auxiliar a tarefa do professor em determinar se os aprendizes estão realmente adquirindo conhecimento, desenvolveu-se uma ferramenta para analisar as interações dos aprendizes. O algoritmo desenvolvido utiliza um dicionário de palavras/frases-chaves relacionadas ao assunto em questão, referentes a tópicos que deveriam ser discutidos e/ou fazer parte das conclusões dos alunos. Ao ser ativado, o software identifica os aprendizes e suas respectivas interações e as armazena em uma base de dados; em seguida, avalia as interações de cada aprendiz, verificando a freqüência com que este utiliza as palavras-chave através de dois métodos de avaliação, baseados em algumas técnicas de KDT. O software permite também a classificação de todas as palavras/frases empregadas durante a reunião.
Resumo:
Este trabalho ocorreu em uma classe de 52 alunos, na disciplina de Psicologia, no Curso de Administração. Centrou sua análise na confecção de textos pelos alunos articulando-os à experiência do seu cotidiano, em pequenos grupos, a partir da devolutiva do processo grupal de aprendizagem como instrumental que possibilitou a maior discriminação entre conteúdos próprios dos integrantes e do grupo.Investigou também como a identificação de atitudes defensivas, no grupo e em si, contribuiu para a elevação do nível de tolerância às contradições, possibilitando uma visão questionadora da dinâmica visível e invisível, presentes em sua produção. Seu objetivo esteve ligado ao desenvolvimento de uma atitude de contenção e apoio necessária ao papel do futuro administrador.
Resumo:
A descoberta e a análise de conglomerados textuais são processos muito importantes para a estruturação, organização e a recuperação de informações, assim como para a descoberta de conhecimento. Isto porque o ser humano coleta e armazena uma quantidade muito grande de dados textuais, que necessitam ser vasculhados, estudados, conhecidos e organizados de forma a fornecerem informações que lhe dêem o conhecimento para a execução de uma tarefa que exija a tomada de uma decisão. É justamente nesse ponto que os processos de descoberta e de análise de conglomerados (clustering) se insere, pois eles auxiliam na exploração e análise dos dados, permitindo conhecer melhor seu conteúdo e inter-relações. No entanto, esse processo, por ser aplicado em textos, está sujeito a sofrer interferências decorrentes de problemas da própria linguagem e do vocabulário utilizado nos mesmos, tais como erros ortográficos, sinonímia, homonímia, variações morfológicas e similares. Esta Tese apresenta uma solução para minimizar esses problemas, que consiste na utilização de “conceitos” (estruturas capazes de representar objetos e idéias presentes nos textos) na modelagem do conteúdo dos documentos. Para tanto, são apresentados os conceitos e as áreas relacionadas com o tema, os trabalhos correlatos (revisão bibliográfica), a metodologia proposta e alguns experimentos que permitem desenvolver determinados argumentos e comprovar algumas hipóteses sobre a proposta. As conclusões principais desta Tese indicam que a técnica de conceitos possui diversas vantagens, dentre elas a utilização de uma quantidade muito menor, porém mais representativa, de descritores para os documentos, o que torna o tempo e a complexidade do seu processamento muito menor, permitindo que uma quantidade muito maior deles seja analisada. Outra vantagem está no fato de o poder de expressão de conceitos permitir que os usuários analisem os aglomerados resultantes muito mais facilmente e compreendam melhor seu conteúdo e forma. Além do método e da metodologia proposta, esta Tese possui diversas contribuições, entre elas vários trabalhos e artigos desenvolvidos em parceria com outros pesquisadores e colegas.
Resumo:
Esta dissertação, intitulada Corpos jovens como superfície de inscrição de textos culturais: recados para a educação escolar, tem por objetivo produzir uma possibilidade de análise cultural, considerando os depoimentos de doze jovens estudantes, cinco alunos e sete alunas, com idades entre 13 a 18 anos, estudantes de 8ª série de uma Escola da Rede Pública de Ensino da Grande Porto Alegre. As problematizações integrantes do processo de pesquisa estão constituídas com aportes teóricos do campo dos Estudos Culturais e de Gênero, em suas aproximações aos estudos pós-estruturalistas e foucaultianos. As informações para o processo de análise cultural foram obtidas através do procedimento investigativo denominado Grupo Focal, em seis encontros sistemáticos e semanais, sendo que a transcrição das falas constituiu o corpus de análise da pesquisa. A categorização das informações foi composta por meio do software QSR Nvivo 2.0, considerado um dos interessantes e avançados recursos para categorizações em pesquisas qualitativas. Um dos principais propósitos dessa investigação foi observar os modos como jovens, por meio de seus depoimentos, se utilizavam de seus corpos “fazendo arte”, produzindo suas aparências e estilos com enfeites e indumentárias, “inscrevendo marcas” e diferenças como possíveis recursos de resistência aos rigores, vigilâncias, controles e “homogeneização” escolares. Observouse que jovens, ao inscreverem marcas que são produzidas social e culturalmente (como piercings, tatuagens, pinturas variadas nos cabelos, acessórios e vestimentas inventados/as) em seus corpos, fazem um movimento de inserção em grupos com os quais há a possibilidade de estabelecerem aproximações e convivências, a fim de sentirem-se em tais grupos incluídos/as.
Resumo:
Esta é uma investigação sobre os erros linguísticos mais frequentes praticados por professores e alunos em textos formais. Trata-se de um estudo de caso, realizado numa escola pública com ensino básico e secundário da Região Autónoma da Madeira. Os testes dos alunos e as atas que os professores redigem das várias reuniões em que participam na escola constituem os corpora dos textos formais. Os informantes foram trinta e dois alunos, todos do 12º ano de cursos científico-humanísticos, e oitenta professores de diversos grupos disciplinares. Dado que não foi possível abranger todos os tipos de erros observados, optou-se por analisar as três áreas gramaticais em que a sua ocorrência foi mais problemática, a saber, ortografia, pontuação e coesão sintática, em detrimento de outras como a semântica, a lexicologia e a coerência textual. Este é um trabalho eminentemente prático que tem como objetivos primordiais enumerar os principais erros observados e comparar as diferenças de desempenho entre os dois grupos de informantes. Para isso, dividiu-se a análise em duas partes: a primeira é, essencialmente, descritiva e interpretativa; enquanto a segunda se baseia nos dados quantitativos para chegar a conclusões que, de outra forma, não seriam percetíveis. No final, sugerem-se algumas estratégias que poderão ajudar a diminuir a incidência do erro no meio escolar.
Resumo:
This research continues the current debate about the role of the images and the words in the architectural design persuasion, where we emphasize the increasing valuation of written documents (FORTY, 2004; MARKUS; CAMERON, 2002), the seduction for the graphical representation (DURAND, 2003) and the rhetorical effects of the graphical and textual resources (TOSTRUP, 1999). Based on these quarrels, we look for verify in the graduate final projects the relation between the design texts and images. From the PROJEDATA, database of the PROJETAR research group (UFRN), we selected the final projects of two brazilians universities, UFRN and USP, that in a first analysis, they had shown as ideal types of two distinct design presentation models, respectively: texts and drawings in separated documents, or combined in an only support. Based on Markus explanation about the function and the content of the texts, on the Durand perspective with regard to graphical representation uses and on Tostrup point of view concerning the rhetorical potential of texts and drawings, we analyze, in a set of 25 projects, how the students relate the textual and imagetical speeches. For this, we related the focus of each speech, in order to verify the possible coherence between both. We conclude that in the model of USP final project the coherence between the texts and the drawings is clearer than in the model adopted in UFRN