75 resultados para polysemy
Resumo:
It is a big challenge to guarantee the quality of discovered relevance features in text documents for describing user preferences because of the large number of terms, patterns, and noise. Most existing popular text mining and classification methods have adopted term-based approaches. However, they have all suffered from the problems of polysemy and synonymy. Over the years, people have often held the hypothesis that pattern-based methods should perform better than term- based ones in describing user preferences, but many experiments do not support this hypothesis. This research presents a promising method, Relevance Feature Discovery (RFD), for solving this challenging issue. It discovers both positive and negative patterns in text documents as high-level features in order to accurately weight low-level features (terms) based on their specificity and their distributions in the high-level features. The thesis also introduces an adaptive model (called ARFD) to enhance the exibility of using RFD in adaptive environment. ARFD automatically updates the system's knowledge based on a sliding window over new incoming feedback documents. It can efficiently decide which incoming documents can bring in new knowledge into the system. Substantial experiments using the proposed models on Reuters Corpus Volume 1 and TREC topics show that the proposed models significantly outperform both the state-of-the-art term-based methods underpinned by Okapi BM25, Rocchio or Support Vector Machine and other pattern-based methods.
Resumo:
The cross-sections of the Social Web and the Semantic Web has put folksonomy in the spot light for its potential in overcoming knowledge acquisition bottleneck and providing insight for "wisdom of the crowds". Folksonomy which comes as the results of collaborative tagging activities has provided insight into user's understanding about Web resources which might be useful for searching and organizing purposes. However, collaborative tagging vocabulary poses some challenges since tags are freely chosen by users and may exhibit synonymy and polysemy problem. In order to overcome these challenges and boost the potential of folksonomy as emergence semantics we propose to consolidate the diverse vocabulary into a consolidated entities and concepts. We propose to extract a tag ontology by ontology learning process to represent the semantics of a tagging community. This paper presents a novel approach to learn the ontology based on the widely used lexical database WordNet. We present personalization strategies to disambiguate the semantics of tags by combining the opinion of WordNet lexicographers and users’ tagging behavior together. We provide empirical evaluations by using the semantic information contained in the ontology in a tag recommendation experiment. The results show that by using the semantic relationships on the ontology the accuracy of the tag recommender has been improved.
Resumo:
Retrieving information from Twitter is always challenging due to its large volume, inconsistent writing and noise. Most existing information retrieval (IR) and text mining methods focus on term-based approach, but suffers from the problems of terms variation such as polysemy and synonymy. This problem deteriorates when such methods are applied on Twitter due to the length limit. Over the years, people have held the hypothesis that pattern-based methods should perform better than term-based methods as it provides more context, but limited studies have been conducted to support such hypothesis especially in Twitter. This paper presents an innovative framework to address the issue of performing IR in microblog. The proposed framework discover patterns in tweets as higher level feature to assign weight for low-level features (i.e. terms) based on their distributions in higher level features. We present the experiment results based on TREC11 microblog dataset and shows that our proposed approach significantly outperforms term-based methods Okapi BM25, TF-IDF and pattern based methods, using precision, recall and F measures.
A tag-based personalized item recommendation system using tensor modeling and topic model approaches
Resumo:
This research falls in the area of enhancing the quality of tag-based item recommendation systems. It aims to achieve this by employing a multi-dimensional user profile approach and by analyzing the semantic aspects of tags. Tag-based recommender systems have two characteristics that need to be carefully studied in order to build a reliable system. Firstly, the multi-dimensional correlation, called as tag assignment
Resumo:
It is a big challenge to guarantee the quality of discovered relevance features in text documents for describing user preferences because of large scale terms and data patterns. Most existing popular text mining and classification methods have adopted term-based approaches. However, they have all suffered from the problems of polysemy and synonymy. Over the years, there has been often held the hypothesis that pattern-based methods should perform better than term-based ones in describing user preferences; yet, how to effectively use large scale patterns remains a hard problem in text mining. To make a breakthrough in this challenging issue, this paper presents an innovative model for relevance feature discovery. It discovers both positive and negative patterns in text documents as higher level features and deploys them over low-level features (terms). It also classifies terms into categories and updates term weights based on their specificity and their distributions in patterns. Substantial experiments using this model on RCV1, TREC topics and Reuters-21578 show that the proposed model significantly outperforms both the state-of-the-art term-based methods and the pattern based methods.
Resumo:
Title of the Master's thesis: Análisis de la preposición hacia y establecimiento de sus equivalentes en finés (trans. Analysis of the Spanish preposition hacia and the finding of its equivalents in Finnish) Abstracts: The aim of this Master thesis is to provide a detailed analysis of the Spanish preposition hacia from a cognitive perspective and to establish its equivalents in Finnish language. In this sense, my purpose is to demonstrate the suitability of both cognitive perspectives and Contrastive Linguistics for semantic analysis. This thesis is divided into five chapters. The first chapter includes a presentation and a critical review of the monolingual lexical processing and semantic analysis of the Spanish preposition hacia in major reference works. Through this chapter it is possible to see both the inadequacies and omissions that are present in all the given definitions. In this sense, this chapter shows that these problems are not but the upper stage of an ontological (and therefore methodological) problem in the treatment of prepositions. The second chapter covers the presentation of the methodological and theoretical perspective adopted for this thesis for the monolingual analysis and definition of the Spanish preposition hacia, following mainly the guidelines established by G. Lakoff (1987) and R. Langacker (2008) in his Cognitive grammar. Taken together, and within the same paradigm, recent analytical and methodological contributions are discussed critically for the treatment of polysemy in language (cf. Tyler ja Evans 2003). In the third chapter, and in accordance with the requirements regarding the use of empirical data from corpora, is my aim to set out a monolingual original analysis of the Spanish preposition hacia in observance of the principles and the methodology spelled out in the second chapter. The main objective of this chapter is to build a full fledged semantic representation of the polysemy of this preposition in order to understand and articulate its meanings with Finnish language (and other possible languages). The fourth chapter, in accordance with the results of chapter 3, examines and describes and establishes the corresponding equivalents in Finnish for this preposition. The results obtained in this chapter are also contrasted with the current bilingual lexicographical definitions found in the most important dictionaries and grammars. Finally, in the fifth chapter of this thesis, the results of this work are discussed critically. In this way, some observations are given regarding both the ontological and theoretical assumptions as well regarding the methodological perspective adopted. I also present some notes for the construction of a general methodology for the semantic analysis of Spanish prepositions to be carried out in further investigations. El objetivo de este trabajo, que caracterizamos como una tarea de carácter comparativo-analítico, es brindar un análisis detallado de la preposición castellana hacia desde una perspectiva cognitiva en tanto y a través del establecimiento de sus equivalentes en finés. Se procura, de esta forma, demostrar la adecuación de una perspectiva cognitiva tanto para el examen como para el establecimiento y articulación de la serie de equivalentes que una partícula, en nuestro caso una preposición, encuentra en otra lengua. De esta forma, y frente a definiciones canónicas que advierten sobre la imposibilidad de una caracterización acabada del conjunto de usos de una preposición, se observa como posible, a través de la aplicación de una metodología teórica-analítica adecuada, la construcción de una definición viable tanto en un nivel jerárquico como descriptivo. La presente tesis se encuentra dividida en cinco capítulos. El primer capítulo comprende una exposición y revisión critica del tratamiento monolingüe lexicográfico y analítico que la preposición hacia ha recibido en las principales obras de referencia, donde se observa que las inadecuaciones y omisiones presentes en la totalidad de las definiciones analizadas representan tan sólo el estadio superior de una problemática de carácter ontológico y, por tanto, metodológico, en el tratamiento de las preposiciones. El capítulo segundo comprende la presentación de la perspectiva teórica metodológica adoptada en esta tesis para el análisis y definición monolingüe de la preposición hacia, teniendo por líneas directrices las propuestas realizadas por G. Lakoff , así como a los fundamentos establecidos por R. Langacker en su propuesta cognitiva para una nueva gramática. En forma conjunta y complementaria, y dentro del mismo paradigma, empleamos, discutimos críticamente y desarrollamos diferentes aportes analítico-metodológicos para el tratamiento de la polisemia en unidades lingüísticas locativas. En el capítulo tercero, y en acuerdo con las exigencias respecto a la utilización de datos empíricos obtenidos a partir de corpus textuales, se expone un análisis original monolingüe de la preposición hacia en observancia de los principios y la metodología explicitada en el capítulo segundo, teniendo por principal objetivo la construcción de una representación semántica de la polisemia de la preposición que comprenda y articule los sentidos prototípicos para ésta especificados. El capítulo cuarto, y en acuerdo con los resultados de nuestro análisis monolingual de la preposición, se examinan, describen y establecen los equivalentes correspondientes en finés para hacia; asimismo, se contrastan en este capítulo los resultados obtenidos con las definiciones lexicográficas bilingües vigentes. Se recogen en el último y quinto capítulo de esta tesis algunas observaciones tanto respecto a los postulados ontológicos y teórico-metodológicos de la perspectiva adoptada, así como algunas notas para la construcción de una metodología general para el análisis semántico preposicional.
Resumo:
The multifaceted passive present participle in Finnish This study investigates the uses of the passive present participle in Finnish. The participle occurs in a variety of syntactic environments and exhibits a rich polysemy. Former descriptions have treated it as a mainly modal element, but it has several non-modal uses as well. The present study provides an overview of its uses and meanings, with the main focus on the factors which trigger the modal reading. In addition, the study contains two case studies on modal periphrastic constructions consisting of the verb 'to be' and the present passive participle, the Obligation construction, e.g., on men-tä-vä [is go-pass-ptc], and the Possiblity construction, e.g., on pelaste-tta-v-i-ssa [is save-pass-ptc-pl-ine]. The study is based on empirical data of 9000 sentences obtained from i) large collections of transcribed material from Finnish dialects, ii) a corpus of modern Finnish newspaper texts, iii) corpora of Old Finnish texts. Both in colloquial and standard Finnish the reading of the participle is highly dependent of the context and determined by such factors as the overall syntactic environment and other co-occurring elements. One of the main findings here is that the Finnish passive present participle is not modal per se. The contextual modal reading arises whenever the state of affairs is conceptualized from the viewpoint of the implied subject of the participle, and the meaning of possibility or obligation depends mostly on whether the situation is pleasant or undesirable. In sections examining the grammaticalization of the Possibility and Obligation constructions, the perspective is diachronic. Both constructions have derived from copula constructions with the passive present participle as a predicate (adjective or adverb). These sections show how a linguistic change can be investigated on the basis of the patterns of usage in the empirical data. The Possibility construction is currently going through a restructuration to a passive verbal complex. The source of this construction is reflected in its present-day use by the fact that it heavily biased towards a small set of verbs. The Obligation construction has grammaticalized to a construction comparable to a compound tense. Patterns of use of the construction show that grammaticalization originates in specific syntactic constructions with an implication of practical necessity. Furthermore, it is shown that the Obligation construction has grammaticalized in different directions in standard and colloquial Finnish. Differing from the study on most typical phenomena investigated in the literature on grammaticalization of modality, the present study opens new perspectives and methods for discussion on these questions.
Resumo:
Maia Duguine, Susana Huidobro and Nerea Madariaga (eds.)
Resumo:
Tesis con Mención de Doctor Internacional
Resumo:
A presente pesquisa objetiva auxiliar o professor no trabalho da interpretação, articulando a academia e a escola. Buscou-se entender melhor o que é interpretação e o que pode ser ensinado ao aluno para que a pratique com mais proficiência. Partiu-se da hipótese de que não há uma metodologia precisa para o ensino de interpretação. Para testá-la, aplicou-se uma atividade de interpretação baseada na crônica Povo, de Luis Fernando Verissimo, retirada de um livro didático, às turmas de 8o ano do Ensino Fundamental e 2o ano do Ensino Médio de 4 colégios públicos do Rio de Janeiro (Cap UERJ, Cap UFRJ, CMRJ e CP II) Analisou-se como os alunos respondiam às questões propostas. Pretende-se mostrar, conforme a teoria de Orlandi (2002: 64), que interpretar não é atribuir sentidos, mas explicar como o texto produz sentidos, inclusive, sentidos que podem ser sempre outros, divergentes do esperado pelo livro didático ou pelo gabarito do professor. Imaginava-se que os resultados fossem semelhantes; toda via, o EF obteve 40% de acertos, enquanto o EM obteve 60,7%. Apesar dos resultados diferentes, foi possível realizar a atividade em duas séries tão distintas, porque a seleção do texto é de interesse de ambas. Identificaram-se a inferência, a polissemia, a metáfora e o contexto como elementos que auxiliam a interpretação, pois se fizeram presente na análise dos dados, mostrando que é possível praticá-los. Logo, apesar de não haver uma metodologia precisa e seriada para o desenvolvimento da interpretação, não significa que não haja o que se possa trabalhar. Defende-se que esses elementos podem ser aplicados em todas as séries e o que irá se diferenciar é o grau de complexidades dos textos, que mudam a cada série. É necessário trabalhar a interpretação em sala de aula com respaldo teórico, operacionalizá-la, apontando estratégias, oferecendo subsídios aos alunos. O presente trabalho busca lançar luz sobre um campo profícuo justamente por tratar de um tema complexo com várias divergências de pensamento e nomenclaturas e, ao mesmo tempo, tão relevante, porque, além de fazer parte da vida estudantil, ultrapassa os muros da escola
Resumo:
O objetivo principal deste trabalho é estudar estratégias de indeterminação de sentido em um corpus de conversas telefônicas interceptadas, considerando que a produção de sentido é um processo cognitivo dependente do contexto. Delimitamos a linguística cognitiva como a área na qual essa pesquisa se encontra inserida, para melhor compreender os fundamentos e os pressupostos norteadores da Teoria dos Modelos Cognitivos Idealizados (TMCI) e da Teoria da Mesclagem Conceptual (blending), tendo como base, principalmente, os estudos de Lakoff (1987), Fauconnier (1997) e Fauconnier e Turner (2002). No decorrer do trabalho propomo-nos responder às seguintes questões de pesquisa: a) que estratégias de indeterminação de sentido são mais frequentemente usadas nestas conversas? b) que elementos do contexto e do cotexto permitem a delimitação do sentido do item lexical em determinada conversa? c) como funcionam, no corpus, as estratégias de indeterminação de sentido e de que forma elas contribuem para sustentar determinado tipo de relação interpessoal? Para responder a estas questões de pesquisa, das 22 gravações de conversas telefônicas de atores sociais envolvidos com tráfico de armas e drogas, sequestro e extorsão, fornecidas pela Coordenadoria de Segurança e Inteligência do Ministério Público do Rio de Janeiro, selecionamos 10 conversas, em função da sua qualidade sonora, para serem transcritas e para proceder à análise qualitativa do uso da polissemia e da vagueza lexical. A partir das discussões teóricas e das análises desenvolvidas, concluímos que a polissemia representa a estratégia de indeterminação de sentido mais frequente no corpus desta pesquisa e que a mesma pode ser entendida como um processo de mesclagem conceptual, que sofre influências sociais e culturais: é a dinamicidade do pensamento e da linguagem que geram a polissemia. Concluímos também que a vagueza lexical é utilizada, no corpus, como um recurso linguístico para referência a assuntos ilícitos. Os itens lexicais analisados instanciam esquemas mentais abstratos que têm seus sentidos realizados a partir de pistas linguísticas e extralinguísticas que apontam para um processo interacional que pode ser entendido como um enquadre de transações comerciais (tráfico de drogas)
Resumo:
Esta tese de doutorado desenvolve considerações a respeito do humor verbal e o seu aproveitamento pedagógico em livros didáticos de Língua Portuguesa. Nosso interesse foi examinar o humor verbal e os mecanismos linguísticos que o provocam, para verificar de que forma foram abordados pelos livros didáticos. Antes de proceder à análise, fizemos breve exposição das principais teorias que estudaram o humor verbal (aquele provocado pelos recursos que a língua oferece). Tratamos também da relevância da escolha das palavras para o texto de humor. Abordamos como os aspectos semânticos (polissemia, homonímia, paronímia, sinonímia, antonímia), semióticos (o papel da iconicidade lexical e da linguístico-gramatical) e pragmáticos (pressupostos, inferências, entre outros) podem contribuir para a construção do(s) sentido(s) do texto humorístico. Como os fenômenos linguísticos não ocorrem isoladamente, uma vez que só se materializam em textos, examinamos em especial os gêneros de humor; os aspectos da textualidade (em especial, a coesão e a coerência) e a relação entre a leitura e o humor (como o desenvolvimento de habilidades e competências de leitura do texto de humor podem ser aplicadas a textos de natureza não humorística). Realizamos breve retrospecto da história do livro didático no Brasil para compreender de que maneira o texto de humor foi sendo incorporado a esse material didático. Analisamos nosso córpus, procurando observar como os textos humorísticos foram abordados: em sua condição de gêneros textuais ou apenas com o propósito de exemplificar ou servir de pretexto para o ensino de algum conteúdo de cunho gramatical; se o humor verbal foi aproveitado e de que forma ocorreu essa abordagem (se a expressividade dos recursos linguísticos foi salientada). O humor verbal oferece rico material sobre a língua portuguesa e pode enriquecer as aulas de língua materna, o que vem a confirmar a relevância da presente pesquisa
Resumo:
A partir do exame da formação e identificação da norma consuetudinária, consoante os pressupostos da teoria dos dois elementos, investiga-se a índole consuetudinária das intervenções humanitárias no contexto do Direito Internacional Contemporâneo, a fim de verificar se tais práticas estatais teriam se constituído em um costume internacional e, por conseguinte, se elas ampliaram o rol das exceções ao princípio da proibição do uso da força pelos Estados nas relações internacionais esculpido no artigo 2 (4) da Carta das Nações Unidas. Dada a polissemia existente para a expressão intervenção humanitária, esta pode ser compreendida como o recurso à força armada por um Estado, ou grupo de Estados, para além das suas fronteiras, conforme discricionariedade própria, ou seja, sem a autorização do CSNU, com o propósito de cessar práticas em largas escalas, persistentes e generalizadas, comissivas ou omissivas, de graves violações dos Direito Humanos e Internacional Humanitário. A partir da apuração dos elementos que conformam esse conceito estabelecido, do exame dos casos de ocorrência e das justificativas legais apresentadas pelos Estados interventores para essa prática interventiva, conjugado com a reação dos demais Estados à essa conduta, por uma considerável e persistente falta de expresso reconhecimento do caráter de direito para a intervenção humanitária, é possível afirmar que os Estados sucessivamente reafirmaram o reconhecimento do princípio da interdição do uso da força pelos Estados nas suas relações internacionais e, que nos quadros do Direito Internacional contemporâneo, a este tipo de intervenção não é um costume internacional porque carece de opinio iuris.
Resumo:
Este trabalho tem como objetivo analisar, como proposta de ensino, o humor em crônicas, tomando como corpus especificamente as de Luis Fernando Verissimo. Pretende-se demonstrar que o gênero textual crônica humorística é relevante no ensino enquanto aproximação com a língua e serve também para o entendimento de fenômenos linguísticos, semânticos e pragmáticos como a polissemia, a ambiguidade, a ironia, a metáfora, a metonímia. Partimos da relevância de se trabalhar a leitura literária na escola, defendida pelos PCN, com o propósito de promover o letramento em todas as suas etapas. Acreditamos que esse trabalho só é possível com o texto, e, portanto, este deve ser explorado em sala de aula em todas suas variedades. Os estudos sobre discurso e interação, sobre o uso dos gêneros textuais na escola, especialmente das crônicas e dos processos de leitura e interpretação das mesmas, corroboram para a nossa pesquisa. Em um segundo momento, abordamos as teorias filosófica, de Bergson; psicanalítica, de Freud; discursiva, de Possenti e cognitiva, de Salomão, como explicação da construção e do entendimento do humor e seus mecanismos de significação.
Resumo:
Este é um estudo sobre o conceito de democracia em obras do pensamento político brasileiro publicadas entre 1914 e 1945. A soberania do povo, não obstante impor-se como uma espécie de ideal universal e um dos pilares em que se assenta a legitimidade política na modernidade, longe de instaurar um consenso acerca de seus modos de realização prática, mostrou-se problemática e aberta a uma pluralidade de formatações institucionais, muitas vezes contraditórias entre si. Desse modo, em vez de um debate estruturado entre opositores e defensores da democracia, constatou-se uma forte polêmica no interior do próprio conceito, isto é, em relação aos modos pelos quais seria possível e legítimo implementar a democracia no país. A hipótese da tese é que a polissemia e as controvérsias em torno da definição do conceito remetem ao próprio processo de desincorporação do poder e dos sujeitos da soberania na modernidade: o povo e a nação. Através da análise das obras publicadas no período, buscou-se reconstituir o debate em torno das modalidades de constituição política do povo-nação e elaborar uma tipologia das diferentes respostas dadas ao problema da democracia no contexto brasileiro.