955 resultados para Inferência lexical
Resumo:
Research in emotion analysis of text suggest that emotion lexicon based features are superior to corpus based n-gram features. However the static nature of the general purpose emotion lexicons make them less suited to social media analysis, where the need to adopt to changes in vocabulary usage and context is crucial. In this paper we propose a set of methods to extract a word-emotion lexicon automatically from an emotion labelled corpus of tweets. Our results confirm that the features derived from these lexicons outperform the standard Bag-of-words features when applied to an emotion classification task. Furthermore, a comparative analysis with both manually crafted lexicons and a state-of-the-art lexicon generated using Point-Wise Mutual Information, show that the lexicons generated from the proposed methods lead to significantly better classi- fication performance.
Resumo:
Discussion forums have evolved into a dependablesource of knowledge to solvecommon problems. However, only a minorityof the posts in discussion forumsare solution posts. Identifying solutionposts from discussion forums, hence, is animportant research problem. In this paper,we present a technique for unsupervisedsolution post identification leveraginga so far unexplored textual feature, thatof lexical correlations between problemsand solutions. We use translation modelsand language models to exploit lexicalcorrelations and solution post characterrespectively. Our technique is designedto not rely much on structural featuressuch as post metadata since suchfeatures are often not uniformly availableacross forums. Our clustering-based iterativesolution identification approach basedon the EM-formulation performs favorablyin an empirical evaluation, beatingthe only unsupervised solution identificationtechnique from literature by a verylarge margin. We also show that our unsupervisedtechnique is competitive againstmethods that require supervision, outperformingone such technique comfortably.
Resumo:
We consider the problem of segmenting text documents that have a
two-part structure such as a problem part and a solution part. Documents
of this genre include incident reports that typically involve
description of events relating to a problem followed by those pertaining
to the solution that was tried. Segmenting such documents
into the component two parts would render them usable in knowledge
reuse frameworks such as Case-Based Reasoning. This segmentation
problem presents a hard case for traditional text segmentation
due to the lexical inter-relatedness of the segments. We develop
a two-part segmentation technique that can harness a corpus
of similar documents to model the behavior of the two segments
and their inter-relatedness using language models and translation
models respectively. In particular, we use separate language models
for the problem and solution segment types, whereas the interrelatedness
between segment types is modeled using an IBM Model
1 translation model. We model documents as being generated starting
from the problem part that comprises of words sampled from
the problem language model, followed by the solution part whose
words are sampled either from the solution language model or from
a translation model conditioned on the words already chosen in the
problem part. We show, through an extensive set of experiments on
real-world data, that our approach outperforms the state-of-the-art
text segmentation algorithms in the accuracy of segmentation, and
that such improved accuracy translates well to improved usability
in Case-based Reasoning systems. We also analyze the robustness
of our technique to varying amounts and types of noise and empirically
illustrate that our technique is quite noise tolerant, and
degrades gracefully with increasing amounts of noise
Resumo:
Online forums are becoming a popular way of finding useful
information on the web. Search over forums for existing discussion
threads so far is limited to keyword-based search due
to the minimal effort required on part of the users. However,
it is often not possible to capture all the relevant context in a
complex query using a small number of keywords. Examplebased
search that retrieves similar discussion threads given
one exemplary thread is an alternate approach that can help
the user provide richer context and vastly improve forum
search results. In this paper, we address the problem of
finding similar threads to a given thread. Towards this, we
propose a novel methodology to estimate similarity between
discussion threads. Our method exploits the thread structure
to decompose threads in to set of weighted overlapping
components. It then estimates pairwise thread similarities
by quantifying how well the information in the threads are
mutually contained within each other using lexical similarities
between their underlying components. We compare our
proposed methods on real datasets against state-of-the-art
thread retrieval mechanisms wherein we illustrate that our
techniques outperform others by large margins on popular
retrieval evaluation measures such as NDCG, MAP, Precision@k
and MRR. In particular, consistent improvements of
up to 10% are observed on all evaluation measures
Resumo:
A violência tem sido considerada um problema da esfera privada, mas é actualmente reconhecido como um problema de saúde pública. E por isso tem sido objecto de estudo e investigação. Neste âmbito e inserido num projecto mais alargado investigámos a violência doméstica na perspectivas das mulheres que a sofreram. Tratou-se de um estudo preliminar desenvolvido a partir de entrevistas com as mulheres que aceitaram e com um critério reputacional.Os resultados da análise lexical das 21 entrevistas expressam diferenças expressivas entre as mulheres em recuperação que estão dentro e fora das casas de abrigo
Resumo:
O trabalho de investigação documentado nesta dissertação insere-se no estudo das representações sociais da violência contra idosos. Para tanto, recorreu-se à Teoria das Representações Sociais de Serge Moscovici com o objetivo de conhecer as representações acerca da violência contra o idoso, identificando as perspectivas distintas de três grupos participantes de dois países, Portugal e EUA Realizou-se um estudo qualitativo do tipo descritivo, explorando as representações sociais acerca da violência contra idosos mas, também, de carácter comparativo já que oferece a perspectivas de três grupos distintos. Buscou-se saber dos pensamentos acerca da violência sobre o idoso nas perspectivas do próprio idoso, de famílias de idosos e profissionais da área de saúde que prestam assistência à pessoas idosas. O estudo propiciou uma discussão do fenômeno como comportamento social refletindo sobre questões epidemiológicas e psico-sociais que o caracterizam como um dos mais graves na esfera da saúde pública. As questões sócio-demográficas foram processadas através do programa estatístico SPSS e, a produção discursiva das 240 entrevistas, analisada através dos programas estatísticos ALCESTE e, IRAMUTEQ.Apesar das diferenças socio-culturais, os participantes construíram representações sociais da violência contra idosos similares, associadas à identidade social do idoso que os coloca como vítima iminente de violência. As divergências encontram-se nas expectativas de intervenção e prevenção do fenômeno; Violence against the elderly and its social representation Abstract: The research documented in this dissertation is part of a study about elderly violence, considered to be one of the most serious issues in the sphere of public health and examined here through the lens of the Theory of Social Representations. The main objective is to know the perspectives of the elderly, families and health professionals from two countries: Portugal and United States of America, on the subject of elderly violence. Using a qualitative design, this study applied both, descriptive and comparative methods interviewing 240 individuals. The demographic data were analyzed through SPSS and the lexical analysis which were performed by two software programs, ALCESTE and IRAMUTEQ. The social representations of elderly violence had similarities associating violence to the social identity of the elderly as an eventual victim despite cultural differences. Variations are identified in the expectations regarding strategies of intervention and prevention of the phenomena.
Resumo:
Introdução: Sendo a violência doméstica um processo altamente complexo e intimista, uma das melhores formas de a compreender, é dar voz aqueles que a vivem, de modo a que seja possível objetivar as experiências subjetivas. Objetivo: Compreender o sofrimento das mulheres vítimas de violência. Método e Técnicas: Foi considerada uma amostra intencional com critério reputacional de 21 mulheres que estavam em casa abrigo ou na comunidade. Os dados foram recolhidos por entrevistas feitas com audiogravação, mediante autorização das participantes. A análise foi feita com recurso a um programa informático de análise lexical – ALCESTE. Resultados: Da análise da primeira amostra emergiram 5 classes. A associação dos vocábulos deu o sentido de cada classe que nomeámos como classe 1 Eventos precipitantes com 31%; classe 2 Experiência do abuso com 17%; classe 3 Dois pés no presente e olhar no futuro com 23%; classe 4 O presente e a aprendizagem com a experiência de abuso com 20%; classe 5 Violência em geral com 9%. Da análise da amostra na comunidade emergiram 4 classes e que nomeámos como classe 1 Violência em geral com 40%; classe 2 Eventos precipitantes com 40%; classe 3 Experiência de abuso com 12%; classe 4 Apoios no processo com 8%. Conclusões: As mulheres que estão em casa abrigo têm ainda muito presente a experiência da violência vivida e todo o seu contexto, estão muito centradas nas suas vivências e o futuro apresenta-se como algo distante e pouco claro. As mulheres na comunidade têm uma visão mais abrangente do fenómeno da violência como um todo, conseguem descentrar-se das suas experiências pessoais e reconhecem a importância dos apoios no processo de construção do futuro
Resumo:
Tema e referencial teórico: Os índices de envelhecimento do país e do Alentejo retratados nos censos 2011 têm repercussões na saúde e na qualidade de vida. O que justifica a necessidade de intervir assumindo os stakeholders um papel relevante na promoção de projetos comunitários. A UÉ-ESESJD, em parceria, pôs em prática um projeto embrionário, delineado por fases e dimensões (formativa, consultiva e informativa), que visa criar condições ao envelhecimento ativo (EA). Objetivos: Avaliar a dimensão formativa do projeto a partir dos utilizadores, idosos. Descrição e procedimentos: Foi feita abordagem qualitativa com uma amostra intencional, constituída por 10 idosos, entrevistados sobre aspetos mais relevantes da formação. Respeitaram-se aspetos éticos inerentes. A entrevista por focus-grupo foi gravada e transcrita. Fez-se análise lexical dos dados textuais usando o software Alceste, que dividiu o corpus em unidades de contexto elementares (UCEs) e as representou em dendograma. Resultados: Emergiram três classes, respetivamente com 28%, 41% e 31% de UCEs. A associação dos vocábulos deu o sentido de cada classe que se nomearam: classe 1 Saúde-Atividade; classe 2 Atividade-Expectativa e classe 3 Unidade Mente-Corpo. O dendograma mostra as relações entre as classes evidenciando-se a Atividade-Expectativa. Conclusão: Verifica-se a conciliação duma expectativa que se concretiza na saúde, pela atividade com o envolvimento da unidade mente-corpo. A continuidade do projeto deve seguir uma linha de estimulação das funções mentais e físicas promotoras do EA.
Resumo:
Este trabalho tem por objecto de estudo a obra de Pedro José da Fonseca, precipuamente a obra lexicográfica - Pawum Lexicon (1762), Diccionario Portuguez, e Latino (1771), Diccionario abbreviado da fabula (1779) e o Diccionario da Lingoa Portugueza (1 793). Necessidade premente num contexto de remodelação de todo o panorama do ensino em Portugal e de modificação das estruturas e hábitos da sociedade portuguesa, a composição destas obras iria corresponder ao consumo escolar e às solicitações da prática pedagógica almejada pela reforma pombalina. No plano geral da descrição crítica destes dicionários, atribui-se especial relevância, no cotejamento com as fontes, ao aperfeiçoamento da técnica lexicográfica. Propõe-se: o esboço da biografia do autor e um breve enquadramento históricocultural da 2" metade do século XVIII; o estudo da obra literária de Pedro da Fonseca, examinando o seu pensamento linguístico; análise da técnica de composição dicionan'stica a nível macro e microestrutural e, por fim, uma reflexão em torno do "corpus" lexical português nos dicionários de Fonseca.
Resumo:
Além de alguns estudos lexicais, não existe em Portugal nenhuma tradição de análise linguística da imprensa. Entre os aspectos que oferecem especial interesse, incluem-se os títulos das notícias, em parte porque propõem uma gramática diferente da da norma discursiva, mas também devido aos jogos linguísticos, nomeadamente o emprego de linguagem metafórica, a que os redactores recorrem para incentivar a leitura dos textos. O trabalho em curso debruça-se sobre os vários níveis da realização linguística deste tipo textual, partindo de um corpus informatizado de 2.060 títulos de notícia portugueses com linguagem metafórica. Assim, no nível sintáctico, interessou-nos estudar a configuração sintáctica do título e os constituintes que nele correspondem ao veículo metafórico. No nível semântico, identificámos, seguindo um enquadramento teórico subordinado à teoria dos espaços múltiplos de Fauconnier e Turner, as metáforas conceptuais presentes no corpus. No nível fonológico, foi feito um estudo sobre padrões sonoros de aliteração, rima e jogos de palavras concomitantes com a linguagem metafórica do título. O nível gráfico debruçou-se sobre os diversos processos de destacar graficamente o veículo metafórico e suas consequências na descodificação da mensagem. Finalmente, no nível intertextual, apresentou-se uma pesquisa sobre as relações internas do título com outros componentes do co-texto noticioso e as relações externas com textos mais ou menos distantes, mas culturalmente partilhados. Os resultados da pesquisa revelaram os processos através dos quais a linguagem metafórica no título de imprensa permite a verbalização de conceitos, a condensação de significados e motiva à leitura do texto.
Resumo:
Este estudo pretende, num primeiro momento, identificar as traduções portuguesas do discurso de Cícero Pro Archia , os seus autores e o contexto histórico e cultural em que foram produzidas. As traduções inéditas encontram- -se aqui editadas e as edições impressas com mais de uma edição têm uma edição crítica. Há ainda lugar a uma reflexão sobre as possíveis edições latinas do Pro Archia consultadas pelos tradutores. O segundo momento é dedicado à análise comparativa destas traduções, que assenta quer em aspectos linguísticos e lexicais específicos quer nos processos de tradução de cada texto, relacionando-os com o contexto de produção de cada uma.
Resumo:
A modelação e análise de séries temporais de valores inteiros têm sido alvo de grande investigação e desenvolvimento nos últimos anos, com aplicações várias em diversas áreas da ciência. Nesta tese a atenção centrar-se-á no estudo na classe de modelos basedos no operador thinning binomial. Tendo como base o operador thinning binomial, esta tese focou-se na construção e estudo de modelos SETINAR(2; p(1); p(2)) e PSETINAR(2; 1; 1)T , modelos autorregressivos de valores inteiros com limiares autoinduzidos e dois regimes, admitindo que as inovações formam uma sucessão de variáveis independentes com distribuição de Poisson. Relativamente ao primeiro modelo analisado, o modelo SETINAR(2; p(1); p(2)), além do estudo das suas propriedades probabilísticas e de métodos, clássicos e bayesianos, para estimar os parâmetros, analisou-se a questão da seleção das ordens, no caso de elas serem desconhecidas. Com este objetivo consideraram-se algoritmos de Monte Carlo via cadeias de Markov, em particular o algoritmo Reversible Jump, abordando-se também o problema da seleção de modelos, usando metodologias clássica e bayesiana. Complementou-se a análise através de um estudo de simulação e uma aplicação a dois conjuntos de dados reais. O modelo PSETINAR(2; 1; 1)T proposto, é também um modelo autorregressivo com limiares autoinduzidos e dois regimes, de ordem unitária em cada um deles, mas apresentando uma estrutura periódica. Estudaram-se as suas propriedades probabilísticas, analisaram-se os problemas de inferência e predição de futuras observações e realizaram-se estudos de simulação.
Resumo:
O Projeto que apresentamos insere-se nos estudos do Mestrado em Tradução Especializada dentro da vertente da Saúde e Ciências da Vida; é por isso que, partindo de um texto/suporte que visa promover uma alimentação saudável nas escolas (manual de referência difundido pelos Ministérios da Educação e Ciência e Ministério da Saúde de Portugal), procedemos à tradução (de português para espanhol) de um conteúdo que suscita, nos nossos dias, um grande interesse socioeducativo e cultural. É preciso destacar que o facto de ter nascido e vivido na Venezuela durante doze anos permitiu-me superar com êxito os meus estudos de espanhol na Licenciatura e no referido Mestrado; mas, ao mesmo tempo, tive que me adaptar, enquanto cidadã portuguesa, ao complexo e inacabado processo de ir interiorizando estas duas línguas – português/espanhol – tão próximas e no entanto com sistemas linguísticos bem distintos. Esta evidência encontra a sua maior justificação no grande capítulo dos erros (de forma e de significado) que consegui detetar e analisar graças à ajuda da minha professora orientadora, ao longo deste meu primeiro trabalho académico (texto traduzido para espanhol). Só agora, depois da minha primeira e “ingénua” tradução desse texto/manual, sou capaz de perceber com toda nitidez a dimensão do erro na atividade tradutora, assim como das suas consequências. Além desta importante reflexão, também o facto de elaborar este projeto permitiu-me abordar um aspeto linguístico da língua espanhola que me cativa pessoalmente (no que me diz respeito): o das variantes lexicais do castelhano nos países hispanofalantes. Não duvido em apontar um outro aspeto fundamental: o esforço de ter tido que corrigir minuciosamente e com rigor esta tarefa tradutora (com os seus respetivos comentários tradutológicos) converteu-se numa fonte de múltiplas satisfações pessoais; são aquelas que têm a ver com o cultivo de valores tais como o esforço, o espírito de superação, o exercício da responsabilidade e o (re)conhecimento da honestidade intelectual, entre outros.
Resumo:
Dissertação de mest., Natural Language Processing & Human Language Technology, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2011
Resumo:
This interdisciplinary study examines the contribution that a book-review magazine makes to the cultural identity of its readers. It is the result of reflections on the cultural work of Books in Canada , on whether or not this periodical was a cultural worksite and if that is the case how it performed that cultural work. In addition, it interrogates factors that may have contributed to the magazine's demise. The study affirms that Books in Canada, a cultural enterprise from 1971 to 2008, mirrored and helped to shape book and literary culture in Canada through its circulation, through the personalities of its editors, through its front covers and through its reviewers and their reviews. Furthermore, it proposes that the demise of the enterprise was due to a combination of factors. The study begins with an introduction to book reviewing and special-interest magazines. Chapter I examines the interplay between selected visual and textual contents published in Books in Canada in its founding years. These components reflected and helped to fuel the cultural nationalism that was sweeping Canada subsequent to the 1967 World's Fair in Montreal. There were also persistent rumours and comments about the magazine that caused certain"cracks in the foundation" to appear. Chapter II compares the aims and editorial challenges of Val Clery, founder of Books in Canada , with those of Adrien Thério, founder of Lettres québécoises, and of the editors of the magazines' twentieth-anniversary issues, Paul Stuewe in the case of the former and André Vanasse in the case of the latter. Evidence in the content of the magazine, editorial and otherwise, indicated that the"contracts" that the editors made with their readers over the years were similar, to reflect and shape a cultural identity, but the result of their"projects," that is, the nature of those identities, was distinctly different. Evidently then, personal aims, preferences and political leanings of editors can have a major impact on the content of a book-review magazine and thus on the cultural work that it does. Therefore, in Chapter III, I focus on selected contents published during the tenures of two of Books in Canada 's key editors, Paul Stuewe and Olga Stein, in order to understand ways that their choices constituted a form of cultural work. The second part of this chapter moves from an analysis of the cultural work of editors to an examination of the cultural work of reviewers. Here, through a close-reading of a selection of reviews published in Books in Canada, and in other periodicals, I argue that reviewers do cultural work in the way that they negotiate their presence in a review, and in how they signal that presence through lexical choices and through the degree of intellectual interaction that they invite. Intellectual interaction is at the core of Chapter IV.This chapter consists of close readings of some of the"billboards" of the enterprise, that is, the front covers of Books in Canada , in order to show how these important components do cultural work by requiring readers to make an intellectual leap from image to text. Chapter V suggests that book reviews, the company's"bills of goods," do cultural work in much the same way as the paratexts of a book. One of my own reviews is offered as a case-study along with a number of other reviews of how central components of a book-review magazine do cultural work through the illocutionary force of their sentences. The first part of Chapter VI, the final chapter, measures the legacy of the magazine, in particular, the annual Books in Canada First Novel Award. Created in 1976, this prize is awarded to the author of the novel judged by a Books in Canada prize committee to be the best first novel in English of the year. The second part of Chapter VI sheds light on factors that may have contributed to the closure of the enterprise, including the copyright uproar that accompanied the agreement that Adrian Stein, publisher of Books in Canada and Olga Stein's husband, made in 2001 with the online book merchant, Amazon.com. Furthermore, this penultimate section of the study suggests that one of the most important factors in the magazine's demise was the decision by the Steins to exploit their position as owners, publisher, and editor of a book-review periodical, a government-subsidized one at that, to publish their own lengthy pre-trial defense of Conrad Black. The chapter then zooms back from the particular to the general with a broader consideration of the impact of technology and globalization on the book industry and on the ability of Books in Canada to survive in any form, print or digital.