869 resultados para Identificação de outliers


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Seguros de carteiras proporcionam aos gestores limitar o risco de downside sem renunciar a movimentos de upside. Nesta dissertação, propomos um arcabouço de otimização de seguro de carteira a partir de um modelo híbrido frequentista-Bayesiano com uso de derivativos. Obtemos a distribuição conjunta de retornos regulares através de uma abordagem estatística frequentista, uma vez removidos os outliers da amostra. A distribuição conjunta dos retornos extremos, por sua vez, é modelada através de Redes Bayesianas, cuja topologia contempla os eventos que o gestor considera crítico ao desempenho da carteira. Unindo as distribuições de retornos regulares e extremos, simulamos cenários futuros para a carteira. O seguro é, então, otimizado através do algoritmo Evolução Diferencial. Mostramos uma aplicação passo a passo para uma carteira comprada em ações do Ibovespa, utilizando dados de mercado entre 2008 e 2012.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

The great interest in nonlinear system identification is mainly due to the fact that a large amount of real systems are complex and need to have their nonlinearities considered so that their models can be successfully used in applications of control, prediction, inference, among others. This work evaluates the application of Fuzzy Wavelet Neural Networks (FWNN) to identify nonlinear dynamical systems subjected to noise and outliers. Generally, these elements cause negative effects on the identification procedure, resulting in erroneous interpretations regarding the dynamical behavior of the system. The FWNN combines in a single structure the ability to deal with uncertainties of fuzzy logic, the multiresolution characteristics of wavelet theory and learning and generalization abilities of the artificial neural networks. Usually, the learning procedure of these neural networks is realized by a gradient based method, which uses the mean squared error as its cost function. This work proposes the replacement of this traditional function by an Information Theoretic Learning similarity measure, called correntropy. With the use of this similarity measure, higher order statistics can be considered during the FWNN training process. For this reason, this measure is more suitable for non-Gaussian error distributions and makes the training less sensitive to the presence of outliers. In order to evaluate this replacement, FWNN models are obtained in two identification case studies: a real nonlinear system, consisting of a multisection tank, and a simulated system based on a model of the human knee joint. The results demonstrate that the application of correntropy as the error backpropagation algorithm cost function makes the identification procedure using FWNN models more robust to outliers. However, this is only achieved if the gaussian kernel width of correntropy is properly adjusted.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper, we propose a semi-supervised approach of anomaly detection in Online Social Networks. The social network is modeled as a graph and its features are extracted to detect anomaly. A clustering algorithm is then used to group users based on these features and fuzzy logic is applied to assign degree of anomalous behavior to the users of these clusters. Empirical analysis shows effectiveness of this method.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper presents a technique for the automated removal of noise from process execution logs. Noise is the result of data quality issues such as logging errors and manifests itself in the form of infrequent process behavior. The proposed technique generates an abstract representation of an event log as an automaton capturing the direct follows relations between event labels. This automaton is then pruned from arcs with low relative frequency and used to remove from the log those events not fitting the automaton, which are identified as outliers. The technique has been extensively evaluated on top of various auto- mated process discovery algorithms using both artificial logs with different levels of noise, as well as a variety of real-life logs. The results show that the technique significantly improves the quality of the discovered process model along fitness, appropriateness and simplicity, without negative effects on generalization. Further, the technique scales well to large and complex logs.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Most information in linkage analysis for quantitative traits comes from pairs of relatives that are phenotypically most discordant or concordant. Confounding this, within-family outliers from non-genetic causes may create false positives and negatives. We investigated the influence of within-family outliers empirically, using one of the largest genome-wide linkage scans for height. The subjects were drawn from Australian twin cohorts consisting of 8447 individuals in 2861 families, providing a total of 5815 possible pairs of siblings in sibships. A variance component linkage analysis was performed, either including or excluding the within-family outliers. Using the entire dataset, the largest LOD scores were on chromosome 15q (LOD 2.3) and 11q (1.5). Excluding within-family outliers increased the LOD score for most regions, but the LOD score on chromosome 15 decreased from 2.3 to 1.2, suggesting that the outliers may create false negatives and false positives, although rare alleles of large effect may also be an explanation. Several regions suggestive of linkage to height were found after removing the outliers, including 1q23.1 (2.0), 3q22.1 (1.9) and 5q32 (2.3). We conclude that the investigation of the effect of within-family outliers, which is usually neglected, should be a standard quality control measure in linkage analysis for complex traits and may reduce the noise for the search of common variants of modest effect size as well as help identify rare variants of large effect and clinical significance. We suggest that the effect of within-family outliers deserves further investigation via theoretical and simulation studies.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The rapid growth in the field of data mining has lead to the development of various methods for outlier detection. Though detection of outliers has been well explored in the context of numerical data, dealing with categorical data is still evolving. In this paper, we propose a two-phase algorithm for detecting outliers in categorical data based on a novel definition of outliers. In the first phase, this algorithm explores a clustering of the given data, followed by the ranking phase for determining the set of most likely outliers. The proposed algorithm is expected to perform better as it can identify different types of outliers, employing two independent ranking schemes based on the attribute value frequencies and the inherent clustering structure in the given data. Unlike some existing methods, the computational complexity of this algorithm is not affected by the number of outliers to be detected. The efficacy of this algorithm is demonstrated through experiments on various public domain categorical data sets.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Área XVI - Saúde Pública, Sanitarismo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Aponta aspectos que devem ser considerados na identificação de metadados de assunto granulares para a legislação federal brasileira. O objeto de estudo foi o Sistema de Legislação Informatizada (Legin Web) disponível no Portal da Câmara dos Deputados. Os objetivos específicos foram: identificar tipos de assuntos amplamente utilizados na indexação da legislação federal brasileira e aspectos do contexto de busca de informação que interferissem na identificação dos metadados de assunto; analisar possibilidades de metadados de assunto para a legislação federal com base em padrões de metadados e modelos de organização da informação abordados na literatura; e, com isso, propor metadados de assunto para a legislação federal brasileira. A ideia é usar esses metadados para diminuir a imprecisão dos resultados das pesquisas na legislação federal, tornando o processo mais rápido e eficiente.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Analisa os mecanismos referentes ao controle das despesas obrigatórias de caráter continuado: o mecanismo de compensação, que tem suas origens no denominado "pay-as-you-go" implantado com o "Budget Enforcement Act" norte-americano, e o demonstrativo de margem de expansão. A análise da evolução histórica dessa categoria de despesas para a União evidencia que os mecanismos de compensação utilizados não permitiram o controle efetivo do aumento dessas despesas, inviabilizando o direcionamento de recursos para ações que impliquem garantia de desenvolvimento sustentável. A discussão sobre os conceitos de despesas obrigatórias de caráter continuado, dos mecanismos de compensação e dos objetivos da apresentação de um demonstrativo de estimativa de margem de expansão indica a necessidade de uma reavaliação e aprofundamento, baseados nos objetivos originais da Lei de Responsabilidade Fiscal, a fim de se ampliar a eficácia de tais mecanismos. Por fim, o trabalho propõe um novo modelo para a apresentação do demonstrativo de estimativa de margem de expansão de despesas obrigatórias de caráter continuado, que possibilite a utilização de uma terminologia adequada, a identificação de fontes e valores dos parâmetros empregados na previsão de receitas e despesas e a avaliação comparativa entre os valores estimados e aqueles realmente executados nos dois exercícios anteriores.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria de Orçamento e Fiscalização Financeira. Núcleo Poderes, Justiça, Relações Exteriores, Defesa e Despesa Pessoal

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A Bacia do Rio Iguaçu-Sarapuí integra a região hidrográfica da Baía de Guanabara. Sua área de drenagem, com cerca de 726 km2, corresponde a aproximadamente 20% do total da área de contribuição à Baía, da ordem de 4600 km2 . Os municípios abrangidos pela bacia do Rio Iguaçu são: Nova Iguaçu, Duque de Caxias, Belford Roxo, São João de Meriti, Nilópolis, Mesquita e uma pequena parte do município do Rio de Janeiro. O presente trabalho tem como objetivo utilizar metodologias destinadas à identificação das unidades de paisagem na Bacia Hidrográfica do Rio Iguaçu, baseado nos conceitos de Paisagem Integrada e utilizando como suporte tecnologias digitais de geoprocessamento. Para o desenvolvimento desta pesquisa foram utilizados dados de diferentes fontes e órgãos governamentais de planejamento que trate desta temática. Os dados ao qual o texto se refere são: bases cartográficas em diferentes escalas de abordagem, Imagens Sensoriais Landsat 7, relatórios e diagnóstico da área em estudo. A identificação das unidades de paisagem na bacia do Rio Iguaçu-Sarapuí é feita a partir da delimitação das unidades de relevo e informações sobre o uso do solo, aspectos geológicos e pedológicos. O trabalho foi baseado no apoio das tecnologias digitais de geoprocessamento que permite uma melhor correlação entre diferentes tipos de informações tanto dos aspectos físicos, geológicos como também das ações antrópicas, classificando-as quanto ao grau de intervenção. O resultado do trabalho nesta região foi a elaboração de um diagnóstico ambiental das limitações e susceptibilidade ao desenvolvimento de determinadas atividades distribuindo-as espacialmente na bacia. A utilização de um Sistema de Informação Geográfica, em especial o Arc Gis 9.2 teve uma importância relevante na elaboração da pesquisa. Uma vez que este sistema trabalha com grandes volumes de informações e na análise integrada de objetos complexos, além de permitir a elaboração de um banco de dados espacial no próprio projeto. O que o diferencia dos demais Sistema de Informação Geográfica, tornando-o uma ferramenta eficiente na gestão integrada dos recursos naturais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O propósito desta Tese foi detectar e caracterizar áreas sob alto risco para leishmaniose visceral (LV) e descrever os padrões de ocorrência e difusão da doença, entre os anos de 1993 a 1996 e 2001 a 2006, em Teresina, Piauí, por meio de métodos estatísticos para análise de dados espaciais, sistemas de informações geográficas e imagens de sensoriamento remoto. Os resultados deste estudo são apresentados na forma de três manuscritos. O primeiro usou análise de dados espaciais para identificar as áreas com maior risco de LV na área urbana de Teresina entre 2001 e 2006. Os resultados utilizando razão de kernels demonstraram que as regiões periféricas da cidade foram mais fortemente afetadas ao longo do período analisado. A análise com indicadores locais de autocorrelação espacial mostrou que, no início do período de estudo, os agregados de alta incidência de LV localizavam-se principalmente na região sul e nordeste da cidade, mas nos anos seguintes os eles apareceram também na região norte da cidade, sugerindo que o padrão de ocorrência de LV não é estático e a doença pode se espalhar ocasionalmente para outras áreas do município. O segundo estudo teve como objetivo caracterizar e predizer territórios de alto risco para ocorrência da LV em Teresina, com base em indicadores socioeconômicos e dados ambientais, obtidos por sensoriamento remoto. Os resultados da classificação orientada a objeto apontam a expansão da área urbana para a periferia da cidade, onde antes havia maior cobertura de vegetação. O modelo desenvolvido foi capaz de discriminar 15 conjuntos de setores censitário (SC) com diferentes probabilidades de conterem SC com alto risco de ocorrência de LV. O subconjunto com maior probabilidade de conter SC com alto risco de LV (92%) englobou SC com percentual de chefes de família alfabetizados menor que a mediana (≤64,2%), com maior área coberta por vegetação densa, com percentual de até 3 moradores por domicílio acima do terceiro quartil (>31,6%). O modelo apresentou, respectivamente, na amostra de treinamento e validação, sensibilidade de 79% e 54%, especificidade de 74% e 71%, acurácia global de 75% e 67% e área sob a curva ROC de 83% e 66%. O terceiro manuscrito teve como objetivo avaliar a aplicabilidade da estratégia de classificação orientada a objeto na busca de possíveis indicadores de cobertura do solo relacionados com a ocorrência da LV em meio urbano. Os índices de acurácia foram altos em ambas as imagens (>90%). Na correlação da incidência da LV com os indicadores ambientais verificou-se correlações positivas com os indicadores Vegetação densa, Vegetação rasteira e Solo exposto e negativa com os indicadores Água, Urbana densa e Urbana verde, todos estatisticamente significantes. Os resultados desta tese revelam que a ocorrência da LV na periferia de Teresina está intensamente relacionada às condições socioeconômicas inadequadas e transformações ambientais decorrentes do processo de expansão urbana, favorecendo a ocorrência do vetor (Lutzomyia longipalpis) nestas regiões.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A integração da sustentabilidade ambiental junto à responsabilidade social tem sido cada vez mais o foco de inúmeras discussões de âmbito mundial. Assim com a expansão deste conceito, a valorização do colaborador e a preservação do meio ambiente ganham importância como instrumento de gestão, não apenas para aderir à legislação, mas também para aprimorar a qualidade, a competitividade e as reivindicações da comunidade. Deste modo, os indicadores, como ferramenta de apoio, buscam atender as observâncias através de informações que mensuram e apontam à postura socioambiental a expectativas empresariais. Neste contexto, este estudo aponta a necessidade da proposição de indicadores globais que integrados e sistêmicos auxiliem no gerenciamento empresarial cujos resultados primem pelo desenvolvimento de maneira convergente à sustentabilidade nas diversas áreas que compõem a indústria de fornecimento de insumos para o refino de petróleo. Com a utilização de questionário sobre relevância e disponibilidade dos dados sobre os indicadores e através da metodologia da Soma ponderada foi organizada uma priorização entre os indicadores levantados na empresa, contíguo à proposição de indicadores de responsabilidade social. Em seguida, foram elaborados os respectivos indicadores globais: sustentabilidade ambiental e desempenho ambiental. Destarte, são recomendadas maiores pesquisas para o desenvolvimento contínuo dos indicadores globais, além da implantação de indicadores de responsabilidade social, a fim de contribuir ao posicionamento teórico e avaliação das atuações práticas

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Nesta dissertação, foi utilizada a técnica SIFT (Scale Invariant Feature Transform) para o reconhecimento de imagens da área dos olhos (região periorbital). Foi implementada uma classificação das imagens em subgrupos internos ao banco de dados, utilizando-se das informações estatísticas provenientes dos padrões invariantes produzidos pela técnica SIFT. Procedeu-se a uma busca categorizada pelo banco de dados, ao invés da procura de um determinado padrão apresentado, através da comparação deste com cada padrão presente no banco de dados. A tais padrões foi aplicada uma abordagem estatística, através da geração da matriz de covariâncias dos padrões gerados, sendo esta utilizada para a categorização, tendo por base uma rede neural híbrida. A rede neural classifica e categoriza o banco de dados de imagens, criando uma topologia de busca. Foram obtidos resultados corretos de classificação de 76,3% pela rede neural híbrida, sendo que um algoritmo auxiliar determina uma hierarquia de busca, onde, ocorrendo uma errônea classificação, a busca segue em grupos de pesquisas mais prováveis.