127 resultados para DADOS ESTATÍSTICOS
Resumo:
A temática proposta apresenta uma análise ao comportamento do utilizador enquanto cocriador de serviços e conteúdos de informação. Para tal, foi realizado um estudo à comunidade do Instituto de Estudos Superiores Militares e ao seu Repositório, alojado no Repositório Comum e agregado na plataforma dos repositórios científicos nacionais – o Repositório Científico em Acesso Aberto de Portugal (RCAAP). Assim, foi possível verificar a fraca adesão por parte da comunidade do instituto ao sistema de informação, implementado com a finalidade de preservar e disponibilizar em acesso aberto a produção científica daquela instituição. Deste modo, é exposto o desenvolvimento da investigação sobre o comportamento dos utilizadores, que teve por base o levantamento de dados estatísticos do repositório e os resultados das respostas às entrevistas a uma amostra da comunidade académica do IESM. Para contextualização teórica são abordados aspetos relativos ao atual contexto de transição influenciado pelo movimento Open Access e a dinâmicas que se estabelecem evidenciando alguns dos stakeholders que fazem parte integrante do contexto. O aprofundamento das teorias referidas, em consonância com o contexto académico onde o repositório se insere, permitiu a elaboração de um plano de marketing e um conjunto de recomendações que visam a publicitação do repositório e a sensibilização da comunidade, tanto para o seu importante papel como cocriadores de conteúdos, bem como, para a relevância destes sistemas de informação na disseminação do conhecimento científico de qualidade produzido no IESM.
Resumo:
RESUMO - Contexto: Os custos associados ao ECMO (Extracorporeal Membrane Oxygenation) não estão tão amplamente divulgados como os resultados sobre a sua efectividade. A identificação dos custos e dos cost-drivers do ECMO representam informação crucial quer para os clínicos, quer para os administradores hospitalares e, por isso, é profícuo conhecer o impacto desta terapêutica nos custos totais incorridos nas UCI. Objectivos: Analisar o impacto do ECMO no total de custos imputados a doentes com insuficiência respiratória aguda grave internados nas Unidades de Cuidados Intensivos do CHSJ. Metodologia: Desenvolveu-se uma análise de custos retrospectiva onde se consideraram os custos directos médicos associados ao internamento de 33 doentes no CHSJ com insuficiência respiratória aguda grave entre Dezembro de 2009 e Janeiro de 2012. Foram incluídos custos com material de consumo clínico (MCC), recursos humanos (RH), medicamentos, meios complementares de diagnóstico e terapêutica (MCDT) e técnicas de suporte da função renal (TSFR). Foram aplicadas quer a abordagem de análise de custos botoom-up, quer a top-down. Coligiram-se custos consultando diferentes bases de dados, nomeadamente, o processo clínico de cada doente e o SONHO. A sua valorização foi possível consultando a base de dados da farmácia/logística hospitalar do CHSJ, dados estatísticos da unidade de planeamento e controlo de gestão da UAG-UCI e consultando um estudo interno realizado no CHSJ de custeio baseado nas actividades associadas aos MCDT. Resultados: Obteve-se um custo médio por doente internado na UCI e tratado com ECMO de 56.872€ e um custo médio por dia de internamento em UCI de 1.278€. O custo médio por dia de internamento excluindo os custos exclusivos ao ECMO foi de 1.169€, verificando-se, assim, que a consideração do ECMO no processo terapêutico acresceu por dia de internamento 110€. O impacto do ECMO no total de custos em UCI foi de 10%, sendo o material de consumo clínico exclusivo ao circuito ECMO a rubrica com maior peso no total de custos exclusivos ao ECMO (aproximadamente 81%).
Resumo:
Atendendo à emergência da estatística, como área autónoma do conhecimento científico no século XIX, procuraremos avaliar a influência desta disciplina no surgimento da psiquiatria portuguesa, utilizando para isso a contribuição filosófica de Ian Hacking. Tentaremos discutir se os marcos considerados importantes por Ian Hacking ocorreram igualmente no seio da psiquiatria portuguesa. Este apuramento far-se-á tanto no que diz respeito à análise da bibliografia dos primeiros alienistas, como através da análise da documentação dos arquivos do Hospital de Rilhafoles, o primeiro asilo psiquiátrico do país. Reflectiremos sobre a existência de um eventual efeito de feedback que o pensamento estatístico possa ter operado sobre a produção científica e os relatórios daquela instituição, no sentido de influenciarem o desenvolvimento da psiquiatria portuguesa e a assistência aos alienados no país. Não sendo histórica, a teoria de Hacking situa-se dentro na mesma janela temporal escolhida para o período do nosso estudo e recai principalmente sobre o aparecimento da estatística em França, país que à data, era a mais determinante influência cultural para o nosso país. Assim, incidiremos a nossa investigação sobre a seguinte hipótese: ter-se-ão os alienistas portugueses da época, apetrechado em termos científicos, de referências estatísticas que, de acordo com o autor canadiano, já então eram usadas noutros países, sobretudo em França para, nomeadamente, aperfeiçoar os sistemas classificativos das doenças mentais que, então, davam os primeiros passos na psiquiatria europeia? Com este trabalho pretende-se, além de dar a conhecer e valorizar a importância dos dados estatísticos no funcionamento do Hospital de Rilhafoles que cessou funções em 2012, preencher uma lacuna na história da psiquiatria portuguesa do século XIX, apontando novas ferramentas o estudo da emergência de novas áreas disciplinares.
Resumo:
Qualquer assunto relacionado com a saúde é sempre um tema sensível, pela importância que tem junto da população, já que interage diretamente com o bem-estar das pessoas e, essencialmente, com a sensação de segurança que as estas pretendem ter na prestação dos cuidados básicos de saúde. Dados estatísticos mostram que a população está cada vez mais envelhecida, reforçando a importância da existência de bons centros hospitalares e de um bom Sistema Nacional de Saúde (SNS) (Plano Nacional de Saúde, 2010). Em Portugal, caso os pacientes necessitem de cuidados mais urgentes, podem recorrer ao Serviço de Urgências disponibilizado para toda a população através do SNS. No entanto, a gestão e planeamento deste serviço é complexa, dado este serviço ser frequentemente utilizado por pacientes que não necessitam de cuidados urgentes, levando a que os hospitais deixem de conseguir dar a resposta esperada, implicando a prestação por vezes um serviço de menor qualidade. Neste sentido, analisaram-se dados de um hospital do norte do país com o intuito de perceber o ponto de situação das urgências, de forma a encontrar padrões relevantes através da análise de clusters e de regras de associação. Começando pela análise de clusters, utilizaram-se apenas as variáveis que foram consideradas importantes para o problema, resultando da análise final 3 clusters. O primeiro cluster é constituído por elementos do sexo masculino de todas as idades, o segundo cluster por elementos do sexo masculino mais jovens e por elementos do sexo feminino até aos 60 anos e o terceiro cluster apenas por elementos do sexo feminino a partir dos 40 anos. No final verificaram-se muitas semelhanças entre os clusters 1 e 3, pois ambos continham os pacientes mais idosos, havendo um padrão comum no seu comportamento. No ano 2012 não houve registo de nenhuma epidemia, não havendo por isso nenhuma doença que se destacasse comparativamente às restantes. Concluiu-se também que na maior parte dos casos houve a necessidade de uma intervenção urgente (pulseira de cor Amarela), no entanto a maioria dos pacientes observados conseguiu regressar às suas habitações após as consultas nas Urgências Hospitalares, sem intervenções médicas adicionais. Relativamente às regras de associação, houve a necessidade de transformar e eliminar algumas variáveis que enviesassem o estudo. Após o processo da criação das regras de associação, percebeu-se que as regras eram muito similares entre si, apresentando uma maior confiança nas variáveis que apareceram em maior número (“Pacientes com pulseira de cor Amarela”, “distrito do Porto” ou “Alta Médica para a Residência”).
Resumo:
O presente relatório, inserido no Mestrado em Gestão do Território, Área de Especialização em Deteção Remota e Sistemas de Informação Geográfica, lecionado pelo Departamento de Geografia e Planeamento Regional da Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa, pretende descrever o trabalho desenvolvido pelo mestrando enquanto estagiário no Observatório do Tráfico de Seres Humanos (OTSH). O relatório está estruturado em três capítulos distintos. No primeiro capítulo é realizada uma abordagem teórica sobre o Tráfico de Seres Humanos e a distinção entre o mesmo com o Auxílio à Imigração Ilegal. Neste, é também feita uma pequena referência à problemática dos novos fluxos de refugiados/migrantes que, no momento da realização do mesmo, constituem uma questão bastante complexa sobretudo ao nível europeu. No segundo capítulo é realizada uma caracterização da área de estudo, assim como a descrição dos dados utilizados e a metodologia aplicada no mesmo. No terceiro capítulo são apresentados os resultados finais do estudo e a cartografia de síntese que sustenta os mesmos. Para a realização deste estudo recorreu-se a uma análise multicritério em SIG para prever a localização de áreas de maior suscetibilidade de ocorrência de novos casos relativos ao crime do tráfico de seres humanos para exploração laboral na agricultura, na região do Alentejo (distritos de Beja, Évora e Portalegre), através do recurso a dados estatísticos disponibilizados tanto pelo OTSH, como por outras entidades. A metodologia apresentada integra um SIG baseado num modelo raster com o Analytical Hierarchy Process (AHP). Através da realização deste estudo, a importância dos SIG como ferramenta no auxílio ao processo de tomada de decisão, pôde ser testada, conjuntamente com o processo metodológico AHP, através dos resultados apresentados. Com um possível desenvolvimento deste modelo analítico, pretende-se que o mesmo seja adaptável a outras regiões e em última instância, outros tipos de exploração e/ou tráfico.
Resumo:
RESUMO: A estrutura demográfica portuguesa é marcada por baixas taxas de natalidade e mortalidade, onde a população idosa representa uma fatia cada vez mais representativa, fruto de uma maior longevidade. A incidência do cancro, na sua generalidade, é maior precisamente nessa classe etária. A par de outras doenças igualmente lesivas (e.g. cardiovasculares, degenerativas) cuja incidência aumenta com a idade, o cancro merece relevo. Estudos epidemiológicos apresentam o cancro como líder mundial na mortalidade. Em países desenvolvidos, o seu peso representa 25% do número total de óbitos, percentagem essa que mais que duplica noutros países. A obesidade, a baixa ingestão de frutas e vegetais, o sedentarismo, o consumo de tabaco e a ingestão de álcool, configuram-se como cinco dos fatores de risco presentes em 30% das mortes diagnosticadas por cancro. A nível mundial e, em particular no Sul de Portugal, os cancros do estômago, recto e cólon apresentam elevadas taxas de incidência e de mortalidade. Do ponto de vista estritamente económico, o cancro é a doença que mais recursos consome enquanto que do ponto de vista físico e psicológico é uma doença que não limita o seu raio de ação ao doente. O cancro é, portanto, uma doença sempre atual e cada vez mais presente, pois reflete os hábitos e o ambiente de uma sociedade, não obstante as características intrínsecas a cada indivíduo. A adoção de metodologia estatística aplicada à modelação de dados oncológicos é, sobretudo, valiosa e pertinente quando a informação é oriunda de Registos de Cancro de Base Populacional (RCBP). A pertinência é justificada pelo fato destes registos permitirem aferir numa população específica, o risco desta sofrer e/ou vir a sofrer de uma dada neoplasia. O peso que as neoplasias do estômago, cólon e recto assumem foi um dos elementos que motivou o presente estudo que tem por objetivo analisar tendências, projeções, sobrevivências relativas e a distribuição espacial destas neoplasias. Foram considerados neste estudo todos os casos diagnosticados no período 1998-2006, pelo RCBP da região sul de Portugal (ROR-Sul). O estudo descritivo inicial das taxas de incidência e da tendência em cada uma das referidas neoplasias teve como base uma única variável temporal - o ano de diagnóstico - também designada por período. Todavia, uma metodologia que contemple apenas uma única variável temporal é limitativa. No cancro, para além do período, a idade à data do diagnóstico e a coorte de nascimento, são variáveis temporais que poderão prestar um contributo adicional na caracterização das taxas de incidência. A relevância assumida por estas variáveis temporais justificou a sua inclusão numaclasse de modelos designada por modelos Idade-Período-Coorte (Age-Period-Cohort models - APC), utilizada na modelação das taxas de incidência para as neoplasias em estudo. Os referidos modelos permitem ultrapassar o problema de relações não lineares e/ou de mudanças súbitas na tendência linear das taxas. Nos modelos APC foram consideradas a abordagem clássica e a abordagem com recurso a funções suavizadoras. A modelação das taxas foi estratificada por sexo. Foram ainda estudados os respectivos submodelos (apenas com uma ou duas variáveis temporais). Conhecido o comportamento das taxas de incidência, uma questão subsequente prende-se com a sua projeção em períodos futuros. Porém, o efeito de mudanças estruturais na população, ao qual Portugal não é alheio, altera substancialmente o número esperado de casos futuros com cancro. Estimativas da incidência de cancro a nível mundial obtidas a partir de projeções demográficas apontam para um aumento de 25% dos casos de cancro nas próximas duas décadas. Embora a projeção da incidência esteja associada a alguma incerteza, as projeções auxiliam no planeamento de políticas de saúde para a afetação de recursos e permitem a avaliação de cenários e de intervenções que tenham como objetivo a redução do impacto do cancro. O desconhecimento de projeções da taxa de incidência destas neoplasias na área abrangida pelo ROR-Sul, levou à utilização de modelos de projeção que diferem entre si quanto à sua estrutura, linearidade (ou não) dos seus coeficientes e comportamento das taxas na série histórica de dados (e.g. crescente, decrescente ou estável). Os referidos modelos pautaram-se por duas abordagens: (i)modelos lineares no que concerne ao tempo e (ii) extrapolação de efeitos temporais identificados pelos modelos APC para períodos futuros. Foi feita a projeção das taxas de incidência para os anos de 2007 a 2010 tendo em conta o género, idade e neoplasia. É ainda apresentada uma estimativa do impacto económico destas neoplasias no período de projeção. Uma questão pertinente e habitual no contexto clínico e a que o presente estudo pretende dar resposta, reside em saber qual a contribuição da neoplasia em si para a sobrevivência do doente. Nesse sentido, a mortalidade por causa específica é habitualmente utilizada para estimar a mortalidade atribuível apenas ao cancro em estudo. Porém, existem muitas situações em que a causa de morte é desconhecida e, mesmo que esta informação esteja disponível através dos certificados de óbito, não é fácil distinguir os casos em que a principal causa de morte é devida ao cancro. A sobrevivência relativa surge como uma medida objetiva que não necessita do conhecimento da causa específica da morte para o seu cálculo e dar-nos-á uma estimativa da probabilidade de sobrevivência caso o cancro em análise, num cenário hipotético, seja a única causa de morte. Desconhecida a principal causa de morte nos casos diagnosticados com cancro no registo ROR-Sul, foi determinada a sobrevivência relativa para cada uma das neoplasias em estudo, para um período de follow-up de 5 anos, tendo em conta o sexo, a idade e cada uma das regiões que constituem o registo. Foi adotada uma análise por período e as abordagens convencional e por modelos. No epílogo deste estudo, é analisada a influência da variabilidade espaço-temporal nas taxas de incidência. O longo período de latência das doenças oncológicas, a dificuldade em identificar mudanças súbitas no comportamento das taxas, populações com dimensão e riscos reduzidos, são alguns dos elementos que dificultam a análise da variação temporal das taxas. Nalguns casos, estas variações podem ser reflexo de flutuações aleatórias. O efeito da componente temporal aferida pelos modelos APC dá-nos um retrato incompleto da incidência do cancro. A etiologia desta doença, quando conhecida, está associada com alguma frequência a fatores de risco tais como condições socioeconómicas, hábitos alimentares e estilo de vida, atividade profissional, localização geográfica e componente genética. O “contributo”, dos fatores de risco é, por vezes, determinante e não deve ser ignorado. Surge, assim, a necessidade em complementar o estudo temporal das taxas com uma abordagem de cariz espacial. Assim, procurar-se-á aferir se as variações nas taxas de incidência observadas entre os concelhos inseridos na área do registo ROR-Sul poderiam ser explicadas quer pela variabilidade temporal e geográfica quer por fatores socioeconómicos ou, ainda, pelos desiguais estilos de vida. Foram utilizados os Modelos Bayesianos Hierárquicos Espaço-Temporais com o objetivo de identificar tendências espaço-temporais nas taxas de incidência bem como quantificar alguns fatores de risco ajustados à influência simultânea da região e do tempo. Os resultados obtidos pela implementação de todas estas metodologias considera-se ser uma mais valia para o conhecimento destas neoplasias em Portugal.------------ABSTRACT: mortality rates, with the elderly being an increasingly representative sector of the population, mainly due to greater longevity. The incidence of cancer, in general, is greater precisely in that age group. Alongside with other equally damaging diseases (e.g. cardiovascular,degenerative), whose incidence rates increases with age, cancer is of special note. In epidemiological studies, cancer is the global leader in mortality. In developed countries its weight represents 25% of the total number of deaths, with this percentage being doubled in other countries. Obesity, a reduce consumption of fruit and vegetables, physical inactivity, smoking and alcohol consumption, are the five risk factors present in 30% of deaths due to cancer. Globally, and in particular in the South of Portugal, the stomach, rectum and colon cancer have high incidence and mortality rates. From a strictly economic perspective, cancer is the disease that consumes more resources, while from a physical and psychological point of view, it is a disease that is not limited to the patient. Cancer is therefore na up to date disease and one of increased importance, since it reflects the habits and the environment of a society, regardless the intrinsic characteristics of each individual. The adoption of statistical methodology applied to cancer data modelling is especially valuable and relevant when the information comes from population-based cancer registries (PBCR). In such cases, these registries allow for the assessment of the risk and the suffering associated to a given neoplasm in a specific population. The weight that stomach, colon and rectum cancers assume in Portugal was one of the motivations of the present study, that focus on analyzing trends, projections, relative survival and spatial distribution of these neoplasms. The data considered in this study, are all cases diagnosed between 1998 and 2006, by the PBCR of Portugal, ROR-Sul.Only year of diagnosis, also called period, was the only time variable considered in the initial descriptive analysis of the incidence rates and trends for each of the three neoplasms considered. However, a methodology that only considers one single time variable will probably fall short on the conclusions that could be drawn from the data under study. In cancer, apart from the variable period, the age at diagnosis and the birth cohort are also temporal variables and may provide an additional contribution to the characterization of the incidence. The relevance assumed by these temporal variables justified its inclusion in a class of models called Age-Period-Cohort models (APC). This class of models was used for the analysis of the incidence rates of the three cancers under study. APC models allow to model nonlinearity and/or sudden changes in linear relationships of rate trends. Two approaches of APC models were considered: the classical and the one using smoothing functions. The models were stratified by gender and, when justified, further studies explored other sub-models where only one or two temporal variables were considered. After the analysis of the incidence rates, a subsequent goal is related to their projections in future periods. Although the effect of structural changes in the population, of which Portugal is not oblivious, may substantially change the expected number of future cancer cases, the results of these projections could help planning health policies with the proper allocation of resources, allowing for the evaluation of scenarios and interventions that aim to reduce the impact of cancer in a population. Worth noting that cancer incidence worldwide obtained from demographic projections point out to an increase of 25% of cancer cases in the next two decades. The lack of projections of incidence rates of the three cancers under study in the area covered by ROR-Sul, led us to use a variety of forecasting models that differ in the nature and structure. For example, linearity or nonlinearity in their coefficients and the trend of the incidence rates in historical data series (e.g. increasing, decreasing or stable).The models followed two approaches: (i) linear models regarding time and (ii) extrapolation of temporal effects identified by the APC models for future periods. The study provide incidence rates projections and the numbers of newly diagnosed cases for the year, 2007 to 2010, taking into account gender, age and the type of cancer. In addition, an estimate of the economic impact of these neoplasms is presented for the projection period considered. This research also try to address a relevant and common clinical question in these type of studies, regarding the contribution of the type of cancer to the patient survival. In such studies, the primary cause of death is commonly used to estimate the mortality specifically due to the cancer. However, there are many situations in which the cause of death is unknown, or, even if this information is available through the death certificates, it is not easy to distinguish the cases where the primary cause of death is the cancer. With this in mind, the relative survival is an alternative measure that does not need the knowledge of the specific cause of death to be calculated. This estimate will represent the survival probability in the hypothetical scenario of a certain cancer be the only cause of death. For the patients with unknown cause of death that were diagnosed with cancer in the ROR-Sul, the relative survival was calculated for each of the cancers under study, for a follow-up period of 5 years, considering gender, age and each one of the regions that are part the registry. A period analysis was undertaken, considering both the conventional and the model approaches. In final part of this study, we analyzed the influence of space-time variability in the incidence rates. The long latency period of oncologic diseases, the difficulty in identifying subtle changes in the rates behavior, populations of reduced size and low risk are some of the elements that can be a challenge in the analysis of temporal variations in rates, that, in some cases, can reflect simple random fluctuations. The effect of the temporal component measured by the APC models gives an incomplete picture of the cancer incidence. The etiology of this disease, when known, is frequently associated to risk factors such as socioeconomic conditions, eating habits and lifestyle, occupation, geographic location and genetic component. The "contribution"of such risk factors is sometimes decisive in the evolution of the disease and should not be ignored. Therefore, there was the need to consider an additional approach in this study, one of spatial nature, addressing the fact that changes in incidence rates observed in the ROR-Sul area, could be explained either by temporal and geographical variability or by unequal socio-economic or lifestyle factors. Thus, Bayesian hierarchical space-time models were used with the purpose of identifying space-time trends in incidence rates together with the the analysis of the effect of the risk factors considered in the study. The results obtained and the implementation of all these methodologies are considered to be an added value to the knowledge of these neoplasms in Portugal.
Resumo:
A previsão das concentrações de ozono troposférico é importante devido aos impactos deste poluente na saúde humana e na vegetação. Neste contexto, o objectivo principal deste trabalho é a previsão de ozono na região de Lisboa e Vale do Tejo, através de métodos estatísticos com base em dados horários do próprio dia, para cada estação. A previsão foi dividida entre avaliação instantânea (previsão baseada em dados momentâneos) recorrendo a árvores de regressão, e previsão horária para um período horário de previsão específico (13:00 -17:00 horas UTC) utilizando modelos de regressão linear. A Avaliação instantânea foi dividida entre análise espacial e análise meteorológica e de precursores. Foram utilizadas séries temporais de dados de 2000 a 2005. No caso da previsão horária utilizaram-se, na fase de validação, dados de 2006. Concluiu-se que, para a avaliação instantânea, a análise espacial apresenta melhores resultados do que a meteorológica. Os modelos de regressão elaborados, para a previsão horária apresentam bons resultados na fase de treino, mas os índices de performance demonstram resultados menos bons na fase de validação. No geral, estes podem ser considerados bons a explicar o comportamento do ozono, contudo menos rigorosos na previsão de excedências. Foi constatada a existência de uma tendência geral para um decréscimo do coeficiente de determinação e um aumento do erro padrão ao longo do período de previsão. Assim os coeficientes de determinação mais elevados e os erros padrão menores verificam-se às 13:00 e o contrário verifica-se às 17:00 horas UTC.
Resumo:
Nesta dissertação faz-se a apresentação dos trabalhos elaborados conducentes à realização de provas na Universidade Nova de Lisboa, Faculdade de Ciências e Tecnologia no ramo de Engenharia Electrotécnica, na especialidade de Sistemas de Informação Industriais, para obtenção do grau de Doutor. A tese defendida consiste na proposta de um enquadramento global de suporte ao processo de recolha e catalogação dos dados disponibilizados na Web por forma a permitir uma maior eficácia e melhor desempenho na sua exploração. O enquadramento global assenta nos seguintes pilares: i) uma metodologia geral; ii) uma arquitectura de referência; iii) uma metodologia específica de suporte à derivação de sistemas particulares e; iv) a operacionalização da arquitectura de referência. A metodologia geral está centrada no utilizador tendo por objectivo simplificar a recolha e catalogação dos dados electrónicos e viabilizando a personalização da Web pela construção de catálogos dinâmicos. A arquitectura de referência recorre à utilização de catálogos dinâmicos, sistemas de multiagentes inteligentes, ontologias e métodos de aprendizagem em texto, por contraste com os métodos habitualmente utilizados nos portais de recolha de dados. A metodologia específica de suporte à derivação de sistemas particulares possibilita uma aproximação sistemática à instalação da arquitectura, propondo um conjunto de passos que permitem capturar e configurar as necessidades do utilizador. Finalmente, a operacionalização da arquitectura de referência origina a construção de um protótipo composto por dois sistemas-base: o Sistema de Catalogação e o Sistema Interactivo de Apoio à Derivação de Sistemas Particulares. O Sistema de Catalogação é o sistema que permite o armazenamento e a consulta dos dados recolhidos através das pesquisas previamente efectuadas. O Sistema de Apoio à Derivação de Sistemas Particulares, permite a personalização do Sistema de Catalogação, pela definição de regras e SAD específicos, dedicados a cada caso concreto. Sumariamente, os obstáculos mais relevantes, abordados no decurso dos trabalhos, foram: • a coexistência de diversos formatos de dados na Web; • a capacidade de processamento dos dados, desde a filtragem de documentos tendo por base a sua relevância, passando pela identificação dos conceitos e sua posterior classificação; • a formalização do conhecimento com vista à adopção de uma terminologia comum; • a natureza do problema distribuído, complexo, descentralizado e com reduzida estruturação. Este documento está organizado em diversos capítulos e cada capítulo está dividido em várias secções. O primeiro capítulo apresenta a inovação e os objectivos genéricos do enquadramento global. O segundo capítulo descreve o estado da arte de um conjunto de assuntos essenciais para o desenrolar dos trabalhos. O terceiro capítulo apresenta, em detalhe, o enquadramento global e a arquitectura proposta. O quarto capítulo descreve a metodologia de derivação de sistemas particulares. O quinto capítulo apresenta o estudo de caso e os resultados obtidos que visam validar a tese defendida. Finalmente, o último capítulo apresenta as conclusões e trabalhos futuros.
Resumo:
The automatic acquisition of lexical associations from corpora is a crucial issue for Natural Language Processing. A lexical association is a recurrent combination of words that co-occur together more often than expected by chance in a given domain. In fact, lexical associations define linguistic phenomena such as idiomes, collocations or compound words. Due to the fact that the sense of a lexical association is not compositionnal, their identification is fundamental for the realization of analysis and synthesis that take into account all the subtilities of the language. In this report, we introduce a new statistically-based architecture that extracts from naturally occurring texts contiguous and non contiguous. For that purpose, three new concepts have been defined : the positional N-gram models, the Mutual Expectation and the GenLocalMaxs algorithm. Thus, the initial text is fisrtly transformed in a set of positionnal N-grams i.e ordered vectors of simple lexical units. Then, an association measure, the Mutual Expectation, evaluates the degree of cohesion of each positional N-grams based on the identification of local maximum values of Mutual Expectation. Great efforts have also been carried out to evaluate our metodology. For that purpose, we have proposed the normalisation of five well-known association measures and shown that both the Mutual Expectation and the GenLocalMaxs algorithm evidence significant improvements comparing to existent metodologies.
Resumo:
Dissertação de Tese apresentada na Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa para obtenção do grau de Mestre em Ecologia,Gestão e Modelação dos Recursos Marinhos
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Ciência e Sistemas de Informação Geográfica
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Ciência e Sistemas de Informação Geográfica
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Ciência e Sistemas de Informação Geográfica
Resumo:
Dissertação apresentada na Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa para obtenção do Grau de Mestre em Engenharia Biomédica
Resumo:
Trabalho de projecto apresentado como requisito parcial para obtenção do grau de Mestre em Estatística e Gestão de Informação