46 resultados para bagging


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Brazilian peach production is insufficient for domestic supply. Aiming to increase production in the state of Minas Gerais, 16 new peach tree varieties were introduced in the Serra da Mantiqueira region and their fruit were analyzed for sugar, total phenol and total carotenoid contents by colorimetric methods, and for organic acid content by high-performance liquid chromatography. In addition, we examined the effect of fruit bagging on the levels of such constituents. To do so, the fruit of half the trees of each variety were bagged. The levels of sugars, phenols, carotenoids and organic acids are genotypic characteristics and significantly differed among varieties. Despite being a good form of fruit protection, providing better aspect and reducing the need for pesticides, bagging leads to lower contents of components such as sugars, phenols and organic acids in most varieties. However, it cannot be stated that this practice interferes with sensory characteristics. Knowledge of the chemical constituents of these new varieties allows determining those ideal for fresh consumption (e.g., "Maciel", "Diamante", "T. Beauty", "Ouromel 2" and "C.1056", among others) and those more suitable for industrial processing (e.g., "A. Gold", "C.1122" and "C.1050"), as well as those which serve both purposes.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Intuitively, we expect that averaging --- or bagging --- different regressors with low correlation should smooth their behavior and be somewhat similar to regularization. In this note we make this intuition precise. Using an almost classical definition of stability, we prove that a certain form of averaging provides generalization bounds with a rate of convergence of the same order as Tikhonov regularization --- similar to fashionable RKHS-based learning algorithms.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Estimation of a population size by means of capture-recapture techniques is an important problem occurring in many areas of life and social sciences. We consider the frequencies of frequencies situation, where a count variable is used to summarize how often a unit has been identified in the target population of interest. The distribution of this count variable is zero-truncated since zero identifications do not occur in the sample. As an application we consider the surveillance of scrapie in Great Britain. In this case study holdings with scrapie that are not identified (zero counts) do not enter the surveillance database. The count variable of interest is the number of scrapie cases per holding. For count distributions a common model is the Poisson distribution and, to adjust for potential heterogeneity, a discrete mixture of Poisson distributions is used. Mixtures of Poissons usually provide an excellent fit as will be demonstrated in the application of interest. However, as it has been recently demonstrated, mixtures also suffer under the so-called boundary problem, resulting in overestimation of population size. It is suggested here to select the mixture model on the basis of the Bayesian Information Criterion. This strategy is further refined by employing a bagging procedure leading to a series of estimates of population size. Using the median of this series, highly influential size estimates are avoided. In limited simulation studies it is shown that the procedure leads to estimates with remarkable small bias.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Credit scoring modelling comprises one of the leading formal tools for supporting the granting of credit. Its core objective consists of the generation of a score by means of which potential clients can be listed in the order of the probability of default. A critical factor is whether a credit scoring model is accurate enough in order to provide correct classification of the client as a good or bad payer. In this context the concept of bootstraping aggregating (bagging) arises. The basic idea is to generate multiple classifiers by obtaining the predicted values from the fitted models to several replicated datasets and then combining them into a single predictive classification in order to improve the classification accuracy. In this paper we propose a new bagging-type variant procedure, which we call poly-bagging, consisting of combining predictors over a succession of resamplings. The study is derived by credit scoring modelling. The proposed poly-bagging procedure was applied to some different artificial datasets and to a real granting of credit dataset up to three successions of resamplings. We observed better classification accuracy for the two-bagged and the three-bagged models for all considered setups. These results lead to a strong indication that the poly-bagging approach may promote improvement on the modelling performance measures, while keeping a flexible and straightforward bagging-type structure easy to implement. (C) 2011 Elsevier Ltd. All rights reserved.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Fraud is a global problem that has required more attention due to an accentuated expansion of modern technology and communication. When statistical techniques are used to detect fraud, whether a fraud detection model is accurate enough in order to provide correct classification of the case as a fraudulent or legitimate is a critical factor. In this context, the concept of bootstrap aggregating (bagging) arises. The basic idea is to generate multiple classifiers by obtaining the predicted values from the adjusted models to several replicated datasets and then combining them into a single predictive classification in order to improve the classification accuracy. In this paper, for the first time, we aim to present a pioneer study of the performance of the discrete and continuous k-dependence probabilistic networks within the context of bagging predictors classification. Via a large simulation study and various real datasets, we discovered that the probabilistic networks are a strong modeling option with high predictive capacity and with a high increment using the bagging procedure when compared to traditional techniques. (C) 2012 Elsevier Ltd. All rights reserved.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Diabetes patients might suffer from an unhealthy life, long-term treatment and chronic complicated diseases. The decreasing hospitalization rate is a crucial problem for health care centers. This study combines the bagging method with base classifier decision tree and costs-sensitive analysis for diabetes patients' classification purpose. Real patients' data collected from a regional hospital in Thailand were analyzed. The relevance factors were selected and used to construct base classifier decision tree models to classify diabetes and non-diabetes patients. The bagging method was then applied to improve accuracy. Finally, asymmetric classification cost matrices were used to give more alternative models for diabetes data analysis.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

PURPOSE: To evaluate the sensitivity and specificity of machine learning classifiers (MLCs) for glaucoma diagnosis using Spectral Domain OCT (SD-OCT) and standard automated perimetry (SAP). METHODS: Observational cross-sectional study. Sixty two glaucoma patients and 48 healthy individuals were included. All patients underwent a complete ophthalmologic examination, achromatic standard automated perimetry (SAP) and retinal nerve fiber layer (RNFL) imaging with SD-OCT (Cirrus HD-OCT; Carl Zeiss Meditec Inc., Dublin, California). Receiver operating characteristic (ROC) curves were obtained for all SD-OCT parameters and global indices of SAP. Subsequently, the following MLCs were tested using parameters from the SD-OCT and SAP: Bagging (BAG), Naive-Bayes (NB), Multilayer Perceptron (MLP), Radial Basis Function (RBF), Random Forest (RAN), Ensemble Selection (ENS), Classification Tree (CTREE), Ada Boost M1(ADA),Support Vector Machine Linear (SVML) and Support Vector Machine Gaussian (SVMG). Areas under the receiver operating characteristic curves (aROC) obtained for isolated SAP and OCT parameters were compared with MLCs using OCT+SAP data. RESULTS: Combining OCT and SAP data, MLCs' aROCs varied from 0.777(CTREE) to 0.946 (RAN).The best OCT+SAP aROC obtained with RAN (0.946) was significantly larger the best single OCT parameter (p<0.05), but was not significantly different from the aROC obtained with the best single SAP parameter (p=0.19). CONCLUSION: Machine learning classifiers trained on OCT and SAP data can successfully discriminate between healthy and glaucomatous eyes. The combination of OCT and SAP measurements improved the diagnostic accuracy compared with OCT data alone.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A broca-pequena-do-fruto, Neoleucinodes elegantalis (Guenée) (Lepidoptera: Crambidae) é uma praga de grande importância na cultura do tomateiro. Desta forma, métodos de manejo que auxiliem no controle dessa praga e que reduzam a aplicação de agrotóxicos devem ser estudados. O objetivo do presente trabalho foi avaliar métodos alternativos de manejo da broca-pequena-do-fruto, como: o controle biológico, através da utilização de parasitoides do gênero Trichogramma e nematoides entompatogênicos (Heterorhabditis indica e Sterneneima carpocapsae); o controle físico, por meio do ensacamento de cachos de tomate com o tecido-não-tecido (TNT); e o controle químico através do estudo da atividade inseticida de plantas como a pimenta, o fumo, o alho e a mamona nas fases embrionárias, larval, pupal e adulta. Desta forma, por meio das análises foi possível verificar que a espécie e/ou linhagem de Trichogramma que mais se destacou foi T. galloi (Tg1) com características biológicas favoráveis ao manejo de N. elegantalis. Para os nematoides entomopatogênicos, S. carpocapsae, foi o mais efetivo, causando uma mortalidade de 82,93% a uma concentração de 65 juvenis infectivos por pré-pupa da broca-pequena-do-fruto. Através do ensacamento dos frutos, foi possível verificar a redução na oviposição da praga em frutos do tomateiro para quase zero com sacolas de TNT com fundo fechado, não ocorrendo alteração no peso, pH e graus brix do fruto, enquanto que no controle químico através de inseticidas botânicos foi possível verificar o destaque do extrato aquoso de fumo, reduzindo a oviposição, entrada e saída das lagartas nos frutos; causando mortalidade na fase embrionária, lagarta, pré-pupa e pupa da broca-pequena-do-fruto.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Trabalho de Projeto para obtenção do grau de Mestre em Engenharia Civil Estruturas

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Trabalho de Projeto para obtenção do grau de Mestre em Engenharia Civil na Área de Especialização de Estruturas

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Esta dissertação apresenta um estudo sobre a garantia de fornecimento de energia elétrica por parte dos produtores em regime especial com tecnologia cogeração e o impacto que estes traduzem na fase de planeamento da rede. Este trabalho foi realizado na Energias de Portugal - Distribuição (EDP-D) na direção de planeamento da rede (DPL). Para este estudo foi utilizado o caso de uma subestação com dezoito produtores em regime especial agregados à sua rede, em que dezasseis desses produtores são cogeração. A proposta de estudo para o caso concreto, passa pela análise das condições de funcionamento da subestação e apurar se a mesma necessita de alguma reformulação, tendo em vista as cargas a satisfazer atuais e possível incremento de carga futura. Considerando que a subestação está inserida num ambiente industrial e atendendo que existem diversos produtores de energia elétrica nas imediações da subestação. Para a resolução da garantia do fornecimento de energia por parte da cogeração, estudou-se a possibilidade de prever a energia produzida por estes produtores, através dos seguintes modelos de previsão: árvore de regressão, árvore de regressão com aplicação bagging e uma rede neuronal (unidirecional). Com a implementação destes modelos pretende-se estimar qual a potência que se pode esperar na garantia de abastecimento da carga, prevenindo maior solicitação de potência por parte da subestação. A metodologia utilizada baseia-se em simulações computacionais.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Dissertation submitted in partial fulfillment of the requirements for the Degree of Master of Science in Geospatial Technologies.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Data Mining surge, hoje em dia, como uma ferramenta importante e crucial para o sucesso de um negócio. O considerável volume de dados que atualmente se encontra disponível, por si só, não traz valor acrescentado. No entanto, as ferramentas de Data Mining, capazes de transformar dados e mais dados em conhecimento, vêm colmatar esta lacuna, constituindo, assim, um trunfo que ninguém quer perder. O presente trabalho foca-se na utilização das técnicas de Data Mining no âmbito da atividade bancária, mais concretamente na sua atividade de telemarketing. Neste trabalho são aplicados catorze algoritmos a uma base de dados proveniente do call center de um banco português, resultante de uma campanha para a angariação de clientes para depósitos a prazo com taxas de juro favoráveis. Os catorze algoritmos aplicados no caso prático deste projeto podem ser agrupados em sete grupos: Árvores de Decisão, Redes Neuronais, Support Vector Machine, Voted Perceptron, métodos Ensemble, aprendizagem Bayesiana e Regressões. De forma a beneficiar, ainda mais, do que a área de Data Mining tem para oferecer, este trabalho incide ainda sobre o redimensionamento da base de dados em questão, através da aplicação de duas estratégias de seleção de atributos: Best First e Genetic Search. Um dos objetivos deste trabalho prende-se com a comparação dos resultados obtidos com os resultados presentes no estudo dos autores Sérgio Moro, Raul Laureano e Paulo Cortez (Sérgio Moro, Laureano, & Cortez, 2011). Adicionalmente, pretende-se identificar as variáveis mais relevantes aquando da identificação do potencial cliente deste produto financeiro. Como principais conclusões, depreende-se que os resultados obtidos são comparáveis com os resultados publicados pelos autores mencionados, sendo os mesmos de qualidade e consistentes. O algoritmo Bagging é o que apresenta melhores resultados e a variável referente à duração da chamada telefónica é a que mais influencia o sucesso de campanhas similares.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este trabalho versa sobre a análise de rentabilidade através da margem de contribuição e tem por objectivo evidenciar como a margem de contribuição pode ser utilizada pelos gestores, na rentabilidade dos clientes, dos produtos, dos canais de distribuição e dos segmentos de mercado em que as empresas operam. O estudo está assente num referencial teórico que faz incursões nos principais conceitos conexos ao tema principal nomeadamente: análise custo – volume – resultado, métodos apuramento dos resultados na óptica da absorção e da contribuição, e a curva ABC. Na aplicação prática, procurámos utilizar alguns instrumentos de gestão nomeadamente o ponto de equilíbrio, apuramento dos resultados por segmentos de clientes, negócios e territórios de comercialização e a aplicação da curva de experiência ABC. O caso de estudo incide sobre a empresa nacional de moagem (Moave S.A) e restringe-se ao plano de produção e embalagem através do pequeno ensaque. O processo de colecta de dados foi obtido directamente das informações fornecidas pela Direcção da empresa, nomeadamente os produtos a serem embalados, a estrutura de custos, o plano de produção, a capacidade máxima da máquina e o calendário de trabalho diário e mensal. Os resultados evidenciaram que a utilização da margem de contribuição como ferramenta de gestão, constitui um importante instrumento de análise e avaliação da rentabilidade dos produtos, dos clientes, dos canais de distribuição bem como dos territórios de comercialização. This work focuses on the analysis of profitability through contribution margin and aims to highlight the contribution margin can be used by managers, in the profitability of customers, products, distribution channels and market segments in which companies operate. The study is based on the referential theoretical that makes inroads in key concepts related to the main topic, namely: cost analysis – volume – result, methods of clearance results in optical absorption and contribution, and ABC. In practice, we try to use some management tools in the balance, such as breakeven point, clearance of results by segments of customers, business and marketing territories and the application of experience curve ABC. The case study focuses on the national milling company (Moave s.a), and restricts itself to plan production and packaging through small bagging. The process of collecting data was obtained directly from the information provided by the management of the undertaking, in particular the products to be packed, the cost structure, the production plan, the maximum capacity of the machine and the daily work schedule and monthly. The results showed that the use of the contribution margin as a management tool constitutes an important instrument of analysis and assessment of the profitability of products, customers, distribution channels and marketing territories.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

This paper investigates the use of ensemble of predictors in order to improve the performance of spatial prediction methods. Support vector regression (SVR), a popular method from the field of statistical machine learning, is used. Several instances of SVR are combined using different data sampling schemes (bagging and boosting). Bagging shows good performance, and proves to be more computationally efficient than training a single SVR model while reducing error. Boosting, however, does not improve results on this specific problem.