8 resultados para message understanding
em Repositório Científico do Instituto Politécnico de Lisboa - Portugal
Resumo:
Dissertação apresentada à Escola Superior de Comunicação Social como parte dos requisitos para obtenção de grau de mestre em Publicidade e Marketing.
Resumo:
A organização automática de mensagens de correio electrónico é um desafio actual na área da aprendizagem automática. O número excessivo de mensagens afecta cada vez mais utilizadores, especialmente os que usam o correio electrónico como ferramenta de comunicação e trabalho. Esta tese aborda o problema da organização automática de mensagens de correio electrónico propondo uma solução que tem como objectivo a etiquetagem automática de mensagens. A etiquetagem automática é feita com recurso às pastas de correio electrónico anteriormente criadas pelos utilizadores, tratando-as como etiquetas, e à sugestão de múltiplas etiquetas para cada mensagem (top-N). São estudadas várias técnicas de aprendizagem e os vários campos que compõe uma mensagem de correio electrónico são analisados de forma a determinar a sua adequação como elementos de classificação. O foco deste trabalho recai sobre os campos textuais (o assunto e o corpo das mensagens), estudando-se diferentes formas de representação, selecção de características e algoritmos de classificação. É ainda efectuada a avaliação dos campos de participantes através de algoritmos de classificação que os representam usando o modelo vectorial ou como um grafo. Os vários campos são combinados para classificação utilizando a técnica de combinação de classificadores Votação por Maioria. Os testes são efectuados com um subconjunto de mensagens de correio electrónico da Enron e um conjunto de dados privados disponibilizados pelo Institute for Systems and Technologies of Information, Control and Communication (INSTICC). Estes conjuntos são analisados de forma a perceber as características dos dados. A avaliação do sistema é realizada através da percentagem de acerto dos classificadores. Os resultados obtidos apresentam melhorias significativas em comparação com os trabalhos relacionados.
Resumo:
O trabalho apresentado por este documento aborda os problemas que advêm da necessidade de integração de aplicações, desenvolvidas em diferentes instantes no tempo, por diferentes equipas de trabalho, que para enriquecer os processos de negócio necessitam de comunicar entre si. A integração das aplicações tem de ser feita de forma opaca para estas, sendo disponibilizada por uma peça de software genérica, robusta e sem custos para as equipas desenvolvimento, na altura da integração. Esta integração tem de permitir que as aplicações comuniquem utilizando os protocolos que desejarem. Este trabalho propõe um middleware orientado a mensagens como solução para o problema identificado. A solução apresentada por este trabalho disponibiliza a comunicação entre aplicações que utilizam diferentes protocolos, permite ainda o desacoplamento temporal, espacial e de sincronismo na comunicação das aplicações. A implementação da solução tem base num sistema publish/subscribe orientado ao conteúdo e tem de lidar com as maiores exigências computacionais que este tipo de sistema acarta, sendo que a utilização deste se justifica com o enriquecimento da semântica de subscrição de eventos. Esta implementação utiliza uma arquitectura semi-distribuída, com o objectivo de aumentar a escalabilidade do sistema. A utilização da arquitectura semi-distribuída implica que a implementação da solução tem de lidar com o encaminhamento de eventos e divulgação das subscrições, pelos vários servidores de eventos. A implementação da solução disponibiliza garantias de persistência, processamento transaccional e tolerância a falhas, assim como transformação de eventos entre os diversos protocolos. A extensibilidade da solução é conseguida à custa de um sistema de pluggins que permite a adição de suporte a novos protocolos de comunicação. Os protocolos suportados pela implementação final do trabalho são RestMS e TCP.
Resumo:
The purpose of this investigation is to explore and understand the justifications given by students to the existence of dishonest behavior and understanding the extent to which the justifications given might influence denouncing and cheating behavior. 1277 undergraduate students of two Portuguese Public Universities were surveyed about their own cheating behavior, their propensity to denounce and the ―neutralizing attitudes‖. As predicted, ―neutralizing attitudes‖ was negatively correlated with self cheating behavior and positively correlated with reporting. The likelihood of copying is greater when the purpose is ―helping a friend‖, ―when the courses are more difficult‖, ―to get higher marks/grades‖, and because ―peers accept and tend to see copying practices as normal‖. Results support the notion that context emerges as a very important influence in the decision to cheating. The environment-peer pressure and the normalized attitudes towards academic dishonesty are the main influences on the propensity to cheating.
Resumo:
A Organização Mundial da Saúde define a literacia em saúde como o conjunto de competências cognitivas e sociais e a capacidade dos indivíduos para compreenderem e usarem informação para a promoção e manutenção da saúde. A transmissão de informação sobre saúde é mais eficaz quando os seus conteúdos são especificamente desenhados para uma pessoa ou para um grupo populacional e quando a mensagem é bem delimitada, realçando os benefícios (ganhos) e os custos (perdas) associados aos comportamentos e às tomadas de decisão. Analisa-se, neste estudo, o conceito de literacia em saúde e a associação da baixa literacia em saúde aos comportamentos em saúde e aos gastos em saúde. Apresenta-se uma análise da literatura científica publicada sobre a baixa literacia em saúde e a sua implicação nos custos na saúde usando, para este objectivo, uma base de dados das ciências da saúde (MEDLINE/PubMed) e quatro plataformas científicas (DOAJ, SCOPUS, SciELO e Web of Science). A literatura científica analisada evidencia que pessoas com baixa literacia em saúde apresentam uma menor capacidade de compreensão dos conteúdos de material informativo sobre alimentos, doenças crónicas ou sobre o uso de medicamentos, por exemplo, bem como maior dificuldade em pesquisar, seleccionar, ler e assimilar a informação em saúde disponível na Internet. A baixa literacia em saúde relaciona-se, então. com a dificuldade na prevenção e na gestão de problemas de saúde, bem como com comportamentos ineficazes de saúde, i.e., com o uso inadequado de medicamentos, com o recurso excessivo aos serviços de saúde (em especial, os de urgências) ou com a ineficácia em lidar com situações de emergência. A baixa literacia está também associada a taxas de hospitalização mais altas, mas também mais longas no tempo (o que implica mais custos associados a internamento prolongado, mais exames de diagnóstico e fraca adesão à terapêutica medicamentosa), a uma diminuição da utilização de medidas preventivas e a uma fraca adesão à prescrição terapêutica. A baixa literacia acaba por afectar igualmente a comunicação (e a relação) médico-doente. Apresentam-se, como complemento, sugestões de melhoria da literacia em saúde e da comunicação médico-doente para efeitos da promoção da saúde.
Resumo:
Research on cluster analysis for categorical data continues to develop, new clustering algorithms being proposed. However, in this context, the determination of the number of clusters is rarely addressed. We propose a new approach in which clustering and the estimation of the number of clusters is done simultaneously for categorical data. We assume that the data originate from a finite mixture of multinomial distributions and use a minimum message length criterion (MML) to select the number of clusters (Wallace and Bolton, 1986). For this purpose, we implement an EM-type algorithm (Silvestre et al., 2008) based on the (Figueiredo and Jain, 2002) approach. The novelty of the approach rests on the integration of the model estimation and selection of the number of clusters in a single algorithm, rather than selecting this number based on a set of pre-estimated candidate models. The performance of our approach is compared with the use of Bayesian Information Criterion (BIC) (Schwarz, 1978) and Integrated Completed Likelihood (ICL) (Biernacki et al., 2000) using synthetic data. The obtained results illustrate the capacity of the proposed algorithm to attain the true number of cluster while outperforming BIC and ICL since it is faster, which is especially relevant when dealing with large data sets.
Resumo:
Dissertação apresentada à Escola Superior de Comunicação Social como parte dos requisitos para obtenção de grau de mestre em Publicidade e Marketing.
Resumo:
Mainland Portugal, on the southwestern edge of the European continent, is located directly north of the boundary between the Eurasian and Nubian plates. It lies in a region of slow lithospheric deformation (< 5 mm yr(-1)), which has generated some of the largest earthquakes in Europe, both intraplate (mainland) and interplate (offshore). Some offshore earthquakes are nucleated on old and cold lithospheric mantle, at depths down to 60 km. The seismicity of mainland Portugal and its adjacent offshore has been repeatedly classified as diffuse. In this paper, we analyse the instrumental earthquake catalogue for western Iberia, which covers the period between 1961 and 2013. Between 2010 and 2012, the catalogue was enriched with data from dense broad-band deployments. We show that although the plate boundary south of Portugal is diffuse, in that deformation is accommodated along several distributed faults rather than along one long linear plate boundary, the seismicity itself is not diffuse. Rather, when located using high-quality data, earthquakes collapse into well-defined clusters and lineations. We identify and characterize the most outstanding clusters and lineations of epicentres and correlate them with geophysical and tectonic features (historical seismicity, topography, geologically mapped faults, Moho depth, free-air gravity, magnetic anomalies and geotectonic units). Both onshore and offshore, clusters and lineations of earthquakes are aligned preferentially NNE-SSW and WNW-ESE. Cumulative seismic moment and epicentre density decrease from south to north, with increasing distance from the plate boundary. Only few earthquake lineations coincide with geologically mapped faults. Clusters and lineations that do not match geologically mapped faults may correspond to previously unmapped faults (e.g. blind faults), rheological boundaries or distributed fracturing inside blocks that are more brittle and therefore break more easily than neighbour blocks. The seismicity map of western Iberia presented in this article opens important questions concerning the regional seismotectonics. This work shows that the study of low-magnitude earthquakes using dense seismic deployments is a powerful tool to study lithospheric deformation in slowly deforming regions, such as western Iberia, where high-magnitude earthquakes occur with long recurrence intervals.