995 resultados para Text Corpus
Resumo:
Como “só se pode proteger aquilo que se conhece” tentaremos neste texto reflectir sobre o inventário dos mosaicos romanos, sua publicação e divulgação no Corpus nacional; mostrar como o corpus iniciado em 1992 sob a égide da Fundação Calouste Gulbenkian contribuiu para os estudos académicos e finalmente reflectir sobre o financiamento e o futuro do Corpus referindo também os mosaicos descobertos desde 2005, data do último inventário.
Resumo:
A partir de um corpus de géneros de texto publicitários, rótulos e contrarrótulos de garrafa de vinho e anúncios sobre o vinho, neste trabalho, serão analisados os enunciados injuntivos em ocorrência para averiguar as relações que se estabelecem entre marcas comerciais e consumidores, o tipo de informação veiculada e as representações linguisticamente construídas destes sujeitos. Situando-se no âmbito da Teoria do Texto e combinando patamares de análise linguística com a dimensão social, esta investigação convoca ainda o Interacionismo Sociodiscursivo que defende uma perspetiva ontogenética da linguagem, consentânea com uma abordagem discursivo-textual da Linguística. A análise dos dados indica que os domínios sociais ou as atividades envolvidas, publicitária e de produção e de comercialização do vinho, preconizam imagens do consumidor ideal de vinho no que diz respeito à prova de vinho, a um comportamento socialmente adequado e sobre as boas propriedades do vinho.
Resumo:
Actualmente, com a massificação da utilização das redes sociais, as empresas passam a sua mensagem nos seus canais de comunicação, mas os consumidores dão a sua opinião sobre ela. Argumentam, opinam, criticam (Nardi, Schiano, Gumbrecht, & Swartz, 2004). Positiva ou negativamente. Neste contexto o Text Mining surge como uma abordagem interessante para a resposta à necessidade de obter conhecimento a partir dos dados existentes. Neste trabalho utilizámos um algoritmo de Clustering hierárquico com o objectivo de descobrir temas distintos num conjunto de tweets obtidos ao longo de um determinado período de tempo para as empresas Burger King e McDonald’s. Com o intuito de compreender o sentimento associado a estes temas foi feita uma análise de sentimentos a cada tema encontrado, utilizando um algoritmo Bag-of-Words. Concluiu-se que o algoritmo de Clustering foi capaz de encontrar temas através do tweets obtidos, essencialmente ligados a produtos e serviços comercializados pelas empresas. O algoritmo de Sentiment Analysis atribuiu um sentimento a esses temas, permitindo compreender de entre os produtos/serviços identificados quais os que obtiveram uma polaridade positiva ou negativa, e deste modo sinalizar potencias situações problemáticas na estratégia das empresas, e situações positivas passíveis de identificação de decisões operacionais bem-sucedidas.
Resumo:
Esta comunicação, baseando-se num extenso corpus oral que está a ser recolhido, procurará refletir de que modo a língua realizada oralmente nos permite perceber o que realmente são e como funcionam as línguas para além da dimensão formalizada da escrita. Pretende-se demonstrar que é a linguagem em uso que melhor evidencia muitos aspetos impossíveis de perceber por uma designada do sistema. Assim, procurar-se-á verificar até que ponto a verdadeira realização linguística da oralidade respeita a noção de frase e de norma, bem assim como especificamente realiza várias dimensões lexicais e pragmáticas.
Resumo:
telligence applications for the banking industry. Searches were performed in relevant journals resulting in 219 articles published between 2002 and 2013. To analyze such a large number of manuscripts, text mining techniques were used in pursuit for relevant terms on both business intelligence and banking domains. Moreover, the latent Dirichlet allocation modeling was used in or- der to group articles in several relevant topics. The analysis was conducted using a dictionary of terms belonging to both banking and business intelli- gence domains. Such procedure allowed for the identification of relationships between terms and topics grouping articles, enabling to emerge hypotheses regarding research directions. To confirm such hypotheses, relevant articles were collected and scrutinized, allowing to validate the text mining proce- dure. The results show that credit in banking is clearly the main application trend, particularly predicting risk and thus supporting credit approval or de- nial. There is also a relevant interest in bankruptcy and fraud prediction. Customer retention seems to be associated, although weakly, with targeting, justifying bank offers to reduce churn. In addition, a large number of ar- ticles focused more on business intelligence techniques and its applications, using the banking industry just for evaluation, thus, not clearly acclaiming for benefits in the banking business. By identifying these current research topics, this study also highlights opportunities for future research.
Resumo:
Transcriptional Regulatory Networks (TRNs) are powerful tool for representing several interactions that occur within a cell. Recent studies have provided information to help researchers in the tasks of building and understanding these networks. One of the major sources of information to build TRNs is biomedical literature. However, due to the rapidly increasing number of scientific papers, it is quite difficult to analyse the large amount of papers that have been published about this subject. This fact has heightened the importance of Biomedical Text Mining approaches in this task. Also, owing to the lack of adequate standards, as the number of databases increases, several inconsistencies concerning gene and protein names and identifiers are common. In this work, we developed an integrated approach for the reconstruction of TRNs that retrieve the relevant information from important biological databases and insert it into a unique repository, named KREN. Also, we applied text mining techniques over this integrated repository to build TRNs. However, was necessary to create a dictionary of names and synonyms associated with these entities and also develop an approach that retrieves all the abstracts from the related scientific papers stored on PubMed, in order to create a corpora of data about genes. Furthermore, these tasks were integrated into @Note, a software system that allows to use some methods from the Biomedical Text Mining field, including an algorithms for Named Entity Recognition (NER), extraction of all relevant terms from publication abstracts, extraction relationships between biological entities (genes, proteins and transcription factors). And finally, extended this tool to allow the reconstruction Transcriptional Regulatory Networks through using scientific literature.
Resumo:
O objetivo deste trabalho é contribuir metodologicamente para a pesquisa no estudo das relações culturais na península ibérica, a partir do recurso a corpus elaborados com base na imprensa diária, o que denominamos corpus mediático. Ao longo das páginas seguintes, exporemos (i) em que medida entendemos o estudo primário da imprensa periódica da maior relevância investigadora para a análise das relações entre dois ou mais sistemas culturais e, do mesmo modo, (ii) como a elaboração de corpus deste género pode ser útil e fiável para a análise da(s) natureza(s) das relações objeto de estudo, principalmente através de técnicas de cômputo quantitativo.
Resumo:
Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
Resumo:
Dissertação de mestrado em Português Língua Não Materna (MPLNM) Português Língua Estrangeira (PLE) e Língua Segunda (PL2)