974 resultados para mineração de textos e conteúdo semântico
Resumo:
Esta dissertação é o resultado de dois anos de estudo e de pesquisa dedicados à formação, à estrutura e ao funcionamento da língua portuguesa. A inconformidade com o tratamento um tanto superficial que os compêndios gramaticais prescritivos, sobretudo os escolares, têm dado à classificação das conjunções coordenativas adversativas e das subordinativas adverbiais concessivas e, por conseguinte, das orações em que elas se inserem, foi a motivação e é o que justifica a escolha do tema. Essa maneira de abordar a questão tem misturado descrições sintáticas com semânticas, sem, muitas vezes, levar em consideração a aplicabilidade e a pertinência de uma ou de outra oração no discurso. Dessa forma, esta dissertação se propõe a descrever os comportamentos morfossintáticos e semântico- -pragmáticos dos períodos formados com as conjunções mas e embora à luz da semântica enunciativa, e a averiguar até que ponto a vagueza de abordagem desse tema tem refletido na formação daqueles que têm a língua portuguesa como língua materna no Brasil. Para tanto, o trabalho apresenta a seguinte estrutura: num primeiro momento, serão considerados a metodologia usada para a feitura do trabalho e os pressupostos teóricos que melhor fundamentam-no. A teoria está dividida em três momentos, a saber, o enfoque dado pela tradição gramatical, o enfoque dado pela linguística à noção de coordenação e de subordinação, e o enfoque dado pela semântica enunciativa às conjunções mas e embora. Num segundo momento, serão explanadas as análises feitas dos corpora presentes no texto: um para corroborar as ideias presentes em um dos capítulos teóricos (corpus de textos de opinião); e outro para averiguar se a superficialidade da abordagem do tema ao longo do tempo tem afetado na formação de leitores e escritores proficientes em língua portuguesa (corpus de transcrição). A análise do segundo corpus o corpus de transcrição, em que pessoas de diferentes níveis de estudo foram testadas no que tange ao conhecimento acerca da transformação de períodos compostos por coordenação adversativa em subordinação adverbial concessiva e vice-versa; além de se descobrir se não iniciariam uma frase com a conjunção adversativa mas tem capítulo à parte e revelará o que não é tão difícil de pressupor: 67,4% das frases transcritas revelam o desconhecimento que as pessoas têm acerca da diferença morfossintática e semântico-pragmática de períodos formados pelas conjunções adversativa e concessiva, mas e embora, respectivamente
Resumo:
Esta tese apresenta uma abordagem baseada em conceitos para realizar descoberta de conhecimento em textos (KDT). A proposta é identificar características de alto nível em textos na forma de conceitos, para depois realizar a mineração de padrões sobre estes conceitos. Ao invés de aplicar técnicas de mineração sobre palavras ou dados estruturados extraídos de textos, a abordagem explora conceitos identificados nos textos. A idéia é analisar o conhecimento codificado em textos num nível acima das palavras, ou seja, não analisando somente os termos e expressões presentes nos textos, mas seu significado em relação aos fenômenos da realidade (pessoas, objetos, entidades, eventos e situações do mundo real). Conceitos identificam melhor o conteúdo dos textos e servem melhor que palavras para representar os fenômenos. Assim, os conceitos agem como recursos meta-lingüísticos para análise de textos e descoberta de conhecimento. Por exemplo, no caso de textos de psiquiatria, os conceitos permitiram investigar características importantes dos pacientes, tais como sintomas, sinais e comportamentos. Isto permite explorar o conhecimento disponível em textos num nível mais próximo da realidade, minimizando o problema do vocabulário e facilitando o processo de aquisição de conhecimento. O principal objetivo desta tese é demonstrar a adequação de uma abordagem baseada em conceitos para descobrir conhecimento em textos e confirmar a hipótese de que este tipo de abordagem tem vantagens sobre abordagens baseadas em palavras. Para tanto, foram definidas estratégias para identificação dos conceitos nos textos e para mineração de padrões sobre estes conceitos. Diferentes métodos foram avaliados para estes dois processos. Ferramentas automatizadas foram empregadas para aplicar a abordagem proposta em estudos de casos. Diferentes experimentos foram realizados para demonstrar que a abordagem é viável e apresenta vantagens sobre os métodos baseados em palavras. Avaliações objetivas e subjetivas foram conduzidas para confirmar que o conhecimento descoberto era de qualidade. Também foi investigada a possibilidade de se realizar descobertas proativas, quando não se tem hipóteses iniciais. Os casos estudados apontam as várias aplicações práticas desta abordagem. Pode-se concluir que a principal aplicação da abordagem é permitir análises qualitativa e quantitativa de coleções textuais. Conceitos podem ser identificados nos textos e suas distribuições e relações podem ser analisadas para um melhor entendimento do conteúdo presente nos textos e, conseqüentemente, um melhor entendimento do conhecimento do domínio.
Resumo:
In this work, the argumentative strategies construction in university entrance examinations texts is analyzed. The study intended to present, through the analyzed occurrences in the corpus, the discursive strategies use for the argumentation construction, observing the different lexicalization forms and the effects that these strategies produced for the intended meaning construction. Aiming to analyze the modalization via texts written by candidates for the UFRN entrance examination, the relations between this category and the resources used for the argumentative guidance of the text were highlighted. Conceived as a speaker argumentative strategy to express his/her relationship with the proposition content which enunciates, the modalization is, thus, one of the linguistic expression form used for the attainment of intended meaning effects in the argumentation construction. In order to substantiate the research, the theoretical assumptions adopted were the propositions which deal with this linguistic category, guiding it to a pragmatic-semantic perspective as well as a discursive-semantic one. Hence, Neves ( 1996, 2006), Koch ( 2000, 2002), Cervoni ( 1989), Bronkart (1999) and Castilho; Morais de Castilho (1996) studies, among others founded this work. Afterwards, a contextualized analysis of the modalized statements, taking into account all the set of elements implied on the argumentation construction, was carried out. The research, which had a strict qualitative character, revealed that the candidates make use of modalization to express commitment or dissociation as regards the statement which they produce; to obtain credibility and provide more authority to their arguments, thus avoiding them of being contested; to impose their arguments as real ones and acquire acceptance of the interlocutor; to lessen the proposition content and disguise the knowledge source; to comment the enunciation and attribute the discourse to another sender; to establish a dialogic relation with the interlocutor. In addition to offering support for new investigations, the research also aims to contribute for the mother tongue teaching, emphasizing the need of a focus which provides special attention to the written language functioning and its application diversity. In this work, the argumentative strategies construction in university entrance examinations texts is analyzed. The study intended to present, through the analyzed occurrences in the corpus, the discursive strategies use for the argumentation construction, observing the different lexicalization forms and the effects that these strategies produced for the intended meaning construction. Aiming to analyze the modalization via texts written by candidates for the UFRN entrance examination, the relations between this category and the resources used for the argumentative guidance of the text were highlighted. Conceived as a speaker argumentative strategy to express his/her relationship with the proposition content which enunciates, the modalization is, thus, one of the linguistic expression form used for the attainment of intended meaning effects in the argumentation construction. In order to substantiate the research, the theoretical assumptions adopted were the propositions which deal with this linguistic category, guiding it to a pragmatic-semantic perspective as well as a discursive-semantic one. Hence, Neves ( 1996, 2006), Koch ( 2000, 2002), Cervoni ( 1989), Bronkart (1999) and Castilho; Morais de Castilho (1996) studies, among others founded this work. Afterwards, a contextualized analysis of the modalized statements, taking into account all the set of elements implied on the argumentation construction, was carried out. The research, which had a strict qualitative character, revealed that the candidates make use of modalization to express commitment or dissociation as regards the statement which they produce; to obtain credibility and provide more authority to their arguments, thus avoiding them of being contested; to impose their arguments as real ones and acquire acceptance of the interlocutor; to lessen the proposition content and disguise the knowledge source; to comment the enunciation and attribute the discourse to another sender; to establish a dialogic relation with the interlocutor. In addition to offering support for new investigations, the research also aims to contribute for the mother tongue teaching, emphasizing the need of a focus which provides special attention to the written language functioning and its application diversity
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
We are included in a society where the use of the Internet became very important to our everyday life. The relationships nowadays usually happen through technological devices instead of face to face contact, for instance, Internet forums where people can discuss online. However, the global analysis is a big challenge, due to the large amount of data. This work investigates the use of visual representations to support an exploratory analysis of contents in messages from discussions forums. This analysis considers the thematic and the chronology. The target forums refer to the educational area and the analysis happens manually, i.e. by direct reading message-by-message. The proprieties of perception and cognition of the human visual system allow a person the capacity to conduct high-level tasks in information extraction from a graphical or visual representation of data. Therefore, this work was based on Visual Analytics, an area that aims create techniques that amplify these human abilities. For that reason we used software that creates a visualization of data from a forum. This software allows a forum content analysis. But, during the work, we identified the necessity to create a new tool to clean the data, because the data had a lot of unnecessary information. After cleaning the data we created a new visualization and held an analysis seeking a new knowledge. In the end we compared the new visualization with the manual analysis that had been made. Analyzing the results, it was evident the potential of visualization use, it provides a better correlation between the information, enabling the acquisition of new knowledge that was not identified in the initial analysis, providing a better use of the forum content
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
A anotação geográfica de documentos consiste na adoção de metadados para a identificação de nomes de locais e a posição de suas ocorrências no texto. Esta informação é útil, por exemplo, para mecanismos de busca. A partir dos topônimos mencionados no texto é possível identificar o contexto espacial em que o assunto do texto está inserido, o que permite agrupar documentos que se refiram a um mesmo contexto, atribuindo ao documento um escopo geográfico. Esta Dissertação de Mestrado apresenta um novo método, batizado de Geofier, para determinação do escopo geográfico de documentos. A novidade apresentada pelo Geofier é a possibilidade da identificação do escopo geográfico de um documento por meio de classificadores de aprendizagem de máquina treinados sem o uso de um gazetteer e sem premissas quanto à língua dos textos analisados. A Wikipédia foi utilizada como fonte de um conjunto de documentos anotados geograficamente para o treinamento de uma hierarquia de Classificadores Naive Bayes e Support Vector Machines (SVMs). Uma comparação de desempenho entre o Geofier e uma reimplementação do sistema Web-a-Where foi realizada em relação à determinação do escopo geográfico dos textos da Wikipédia. A hierarquia do Geofier foi treinada e avaliada de duas formas: usando topônimos do mesmo gazetteer que o Web-a-Where e usando n-gramas extraídos dos documentos de treinamento. Como resultado, o Geofier manteve desempenho superior ao obtido pela reimplementação do Web-a-Where.
Resumo:
En este artículo presentamos un método basado en la teoría del paralelismo para la identificación y resolución de elementos extrapuestos en textos no restringidos. Esta teoría de paralelismo está basada en (Palomar 96) y se amplía con el desarrollo de técnicas de análisis parcial –en las que se estudia las partes relevantes del texto- que facilitan la resolución de los fenómenos lingüísticos. Nos basaremos en los programas Datalog extendidos (Dahl 94) (Dahl 95) como herramienta para la definición e implementación de gramáticas. Éstas no están basadas en reglas gramaticales sino en la detección de información relevante, relajando el proceso y ampliando el conjunto potencial de textos analizables.
Resumo:
Embora a quantidade de publicações que trazem à capa a denominação contos fantásticos ou, ainda, que tratem do insólito como temática tenha crescido nos últimos anos na literatura brasileira, nota-se que há muito que se definir para que se chegue a uma classificação que evite generalizações simplificadoras. Portanto, esta dissertação pretende discutir e apontar alguns elementos que, de acordo com o arcabouço teórico-metodológico de Tzvetan Todorov e de Filipe Furtado, se configuram como estratégias de construção do discurso literário de narrativas do gênero Fantástico. Para isso, foram trazidos os estudos de Sigmund Freud e de Jean Paul Sartre para problematizar os conceitos e visões que se têm do gênero e, em seguida, selecionaram-se cinco antologias que discorrem sobre a temática do insólito e, após minuciosa e atenta leitura crítico-interpretativa de cada prefácio e/ou introdução, foram confrontadas as ideias, ali expostas, com a que se adotou nesta pesquisa como norte. Em seguida, fez-se a apreciação dos contos de literatura brasileira e ficou constatado que o conteúdo das antologias selecionadas não condiz com a nomenclatura sustentada na capa dos volumes
Resumo:
Este trabalho objetiva analisar diversos aspectos do Direito Internacional Público em matéria de recursos hídricos de água doce superficiais e subterrâneos. Geração de energia, abastecimento, pesca, navegação, lazer, agricultura e indústria, são múltiplos os usos que os seres humanos fazem da água doce, mas antes disso a água é essencial para manutenção de todo e qualquer tipo de vida na Terra. São complexas e passíveis de várias análises as relações entre os Estados e as relações que se concretizam no interior dos Estados com objetivo de utilizar, controlar e preservar as fontes de água doce, a que se pretende fazer é uma análise jurídica, inserida no contexto político de expansão do capitalismo liberal. Pretende-se identificar e analisar normas jurídicas produzidas no âmbito internacional multilateral, considerando a sua forma, conteúdo e possíveis efeitos: na resolução de conflitos entre os Estados pelo controle e utilização da água doce, no estabelecimento de parâmetros para solução da crise ambiental e na superação dos problemas de acesso à água. Na primeira parte do trabalho, são identificadas as normas de Direito Internacional Público atinentes à matéria, descrevendo-se, primeiramente, a evolução histórica do Direito Internacional Fluvial até os estudos da doutrina de Direito Internacional e a Convenção de Nova York de 1997. O capítulo segundo objetiva apresentar o tema da água doce no contexto de surgimento do Direito Internacional do Meio Ambiente, de realização de conferências e criação de fóruns internacionais para a questão da água e do desenvolvimento de um direito humano à água. O capítulo terceiro propõe-se a ingressar na incipiente questão da regulamentação dos usos das águas subterrâneas, analisando os trabalhos da Comissão de Direito Internacional da Organização das Nações Unidas que culminaram com a adoção de uma Resolução sobre o Direito dos Aquíferos Transfronteiriços por parte da Assembleia Geral daquela organização. A segunda parte do trabalho objetiva analisar a aplicação das regras e princípios ensaiados nos textos de Direito Internacional aos casos concretos, confrontando-as com as soluções propostas em casos paradigmáticos de conflitos pela água, como o caso Gabcikovo-Nagymaros e o caso das Papeleras, envolvendo Argentina e Uruguai, ambos julgados pela Corte Internacional de Justiça. Na segunda parte do trabalho, também é analisado o caso do aquífero Guarani, um sistema de aquíferos interligados que se estende sob os subsolos de Argentina, Brasil, Paraguai e Uruguai, que em agosto de 2010 foi objeto de um tratado internacional assinado no âmbito do Mercosul. Por fim, a pesquisa objetiva desenvolver ideias e explicações para a existência (ou não) e a efetividade (ou a falta dela) das normas de Direito Internacional sobre recursos hídricos, considerando o conceito de soberania estatal que ora é o bode expiatório para a falta de assinaturas nos tratados ou de votos em declarações, ora é o próprio fundamento para a adoção de compromissos por parte dos Estados. Conclui-se tentando responder as seguintes questões: Existe Direito Internacional da água doce? São as normas de Direito Internacional efetivas? Para que servem essas normas de Direito Internacional, além da afirmação de sua própria existência como metas a serem atingidas?
Resumo:
Nesta dissertação, pretende-se estudar a dinamicidade lexical em textos de domínio político, veiculados pela imprensa escrita durante o período eleitoral de 2010. Para tal, selecionou-se um corpus adequado à pesquisa, fez-se o levantamento de neologismos lexicais nele ocorrentes e procedeu-se à sua descrição. Neste percurso, buscou-se demonstrar a riqueza e a vitalidade dos mecanismos de expansão lexical nos textos estudados, de modo a evidenciar que o léxico, como sistema dinâmico, configura-se como um dos subníveis linguísticos mais abertos à criatividade, revelando também crenças, valores, costumes e hábitos de uma comunidade linguística. Ademais, objetivou-se mostrar que a linguagem utilizada em contextos políticos, visto estar imersa em um ambiente de tensões e embates constantes, é marcadamente caracterizada pelo incessante nascer de novos signos, os quais, por motivações denominativas e/ou estilísticas, desvelam, não raras vezes, intenções e ideologias dos sujeitos-falantes que os criam. Por fim, elaborou-se um glossário com as novas formações encontradas, que oferece subsídios para a observação sistemática da neologia no âmbito do português brasileiro, além de traçar um perfil parcial das alterações político-culturais por que passamos no correr de 2010
Resumo:
A Floresta Nacional de Carajás é uma unidade de conservação federal localizada no sudeste da Amazônia, região Norte do Brasil. Juntamente com outras cinco áreas formam o Mosaico de Carajás com um contínuo de 1.307.000 hectares de área protegida. As principais fitofisionomias presentes no interior da unidade são a Floresta Ombrófila Densa e a Savana Metalófila. A unidade abriga a maior província mineral do mundo. A atividade de mineração promove diferentes impactos sobre a fauna principalmente através da modificação de paisagem originada pela supressão vegetal. O objetivo desse trabalho foi estudar a composição da comunidade de mamíferos de médio e grande porte através do levantamento de informações sobre a riqueza, a abundância e as diferenças entre a composição da mastofauna nas fitofisionomias de Savana Metalófila e Floresta Ombrófila Densa e suas alterações ocasionadas pelo impacto da mineração. Foram realizadas quatro campanhas em 19 trilhas que se distribuíram em áreas de Savana Metalófila e Floresta Ombrófila Densa impactadas e controle. A metodologia utilizada foi de transecção linear e armadilhamento fotográfico com um esforço total empregado de 432 km e 85.920 horas, para cada um dos métodos, respectivamente. A comunidade de mastofauna de médio e grande porte apresentou 43 espécies distribuídas em oito ordens, com um aumento de 41% de novos registros para a região. A composição da comunidade de mastofauna apresentou diferenças quanto a riqueza e a abundância das espécies nas duas fitofisionomias e quanto ao efeito do impacto da mineração. O presente trabalho trouxe avanços em relação à lista de espécies de mamíferos de médio e grande porte e aumentou o conhecimento a respeito da composição desta fauna em ambientes de floresta e de savana na Floresta Nacional de Carajás. Trouxe informações acerca dos impactos sobre a mastofauna e identificou importantes sensibilidades de algumas espécies frente à mineração, contribuindo para a busca do equilíbrio entre a mineração e a conservação.
Resumo:
A tese tem por objetivo uma análise da argumentação em colunas de opinião, fazendo um paralelo entre dois momentos de um tradicional jornal brasileiro, O Globo. Dessa forma, analisamos textos opinativos dos períodos de 1947 e 2007 um intervalo, portanto, de 60 anos. Realizamos uma comparação entre esses dois períodos, a fim de estabelecer semelhanças e contrastes no que diz respeito à construção do texto argumentativo. Ao todo, foram selecionados para esse estudo comparativo um total de cinqüenta textos vinte e cinco de 1947 e vinte e cinco de 2007. Foram elencados para essa análise três elementos a fim de verificar a argumentação do jornal nas duas épocas, a saber: a seleção vocabular a serviço da argumentação, o uso dos tempos verbais e a pontuação. Após uma análise quantitativa e qualitativa desses três elementos, também apresentamos algumas considerações acerca do ensino da argumentação na escola, com algumas sugestões de atividades para os professores de Língua Portuguesa