984 resultados para regression algorithm


Relevância:

20.00% 20.00%

Publicador:

Resumo:

The CTC algorithm, Consolidated Tree Construction algorithm, is a machine learning paradigm that was designed to solve a class imbalance problem, a fraud detection problem in the area of car insurance [1] where, besides, an explanation about the classification made was required. The algorithm is based on a decision tree construction algorithm, in this case the well-known C4.5, but it extracts knowledge from data using a set of samples instead of a single one as C4.5 does. In contrast to other methodologies based on several samples to build a classifier, such as bagging, the CTC builds a single tree and as a consequence, it obtains comprehensible classifiers. The main motivation of this implementation is to make public and available an implementation of the CTC algorithm. With this purpose we have implemented the algorithm within the well-known WEKA data mining environment http://www.cs.waikato.ac.nz/ml/weka/). WEKA is an open source project that contains a collection of machine learning algorithms written in Java for data mining tasks. J48 is the implementation of C4.5 algorithm within the WEKA package. We called J48Consolidated to the implementation of CTC algorithm based on the J48 Java class.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The relationship between length (L) and weight (W) was estimated for 80 species belonging to 50 families of marine fishes from the shelf and upper slope of southern Brazil (lat. 28°S - 34°S). Sample sizes (n) for different species ranged from 11 to 14 741 specimens collected from commercial landings and research surveys. The fit of the equations (W=aLb) with a and b parameters estimated from regular and functional regression (of log-transformed weight and length data) as well as from a non-linear iterative process using the quasi-Newton algorithm were compared. The non-linear method gave the most accurate estimates in terms of residual sum of squares. Differences were less than 2.3% for n>500 compared with predictive regressions and 1.5% compared with functional regressions. No difference was observed between both predictive and functional regressions. Determination coefficients (r2) increased with sample size, and the highest r2 were obtained for 50

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Background: Intratumor heterogeneity may be responsible of the unpredictable aggressive clinical behavior that some clear cell renal cell carcinomas display. This clinical uncertainty may be caused by insufficient sampling, leaving out of histological analysis foci of high grade tumor areas. Although molecular approaches are providing important information on renal intratumor heterogeneity, a focus on this topic from the practicing pathologist' perspective is still pending. Methods: Four distant tumor areas of 40 organ-confined clear cell renal cell carcinomas were selected for histopathological and immunohistochemical evaluation. Tumor size, cell type (clear/granular), Fuhrman's grade, Staging, as well as immunostaining with Snail, ZEB1, Twist, Vimentin, E-cadherin, beta-catenin, PTEN, p-Akt, p110 alpha, and SETD2, were analyzed for intratumor heterogeneity using a classification and regression tree algorithm. Results: Cell type and Fuhrman's grade were heterogeneous in 12.5 and 60 % of the tumors, respectively. If cell type was homogeneous (clear cell) then the tumors were low-grade in 88.57 % of cases. Immunostaining heterogeneity was significant in the series and oscillated between 15 % for p110a and 80 % for Snail. When Snail immunostaining was homogeneous the tumor was histologically homogeneous in 100 % of cases. If Snail was heterogeneous, the tumor was heterogeneous in 75 % of the cases. Average tumor diameter was 4.3 cm. Tumors larger than 3.7 cm were heterogeneous for Vimentin immunostaining in 72.5 % of cases. Tumors displaying negative immunostaining for both ZEB1 and Twist were low grade in 100 % of the cases. Conclusions: Intratumor heterogeneity is a common event in clear cell renal cell carcinoma, which can be monitored by immunohistochemistry in routine practice. Snail seems to be particularly useful in the identification of intratumor heterogeneity. The suitability of current sampling protocols in renal cancer is discussed.

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O biodiesel tem sido amplamente utilizado como uma fonte de energia renovável, que contribui para a diminuição de demanda por diesel mineral. Portanto, existem várias propriedades que devem ser monitoradas, a fim de produzir e distribuir biodiesel com a qualidade exigida. Neste trabalho, as propriedades físicas do biodiesel, tais como massa específica, índice de refração e ponto de entupimento de filtro a frio foram medidas e associadas a espectrometria no infravermelho próximo (NIR) e espectrometria no infravermelho médio (Mid-IR) utilizando ferramentas quimiométricas. Os métodos de regressão por mínimos quadrados parciais (PLS), regressão de mínimos quadrados parciais por intervalos (iPLS), e regressão por máquinas de vetor de suporte (SVM) com seleção de variáveis por Algoritmo Genético (GA) foram utilizadas para modelar as propriedades mencionadas. As amostras de biodiesel foram sintetizadas a partir de diferentes fontes, tais como canola, girassol, milho e soja. Amostras adicionais de biodiesel foram adquiridas de um fornecedor da região sul do Brasil. Em primeiro lugar, o pré-processamento de correção de linha de base foi usado para normalizar os dados espectrais de NIR, seguidos de outros tipos de pré-processamentos que foram aplicados, tais como centralização dos dados na média, 1 derivada e variação de padrão normal. O melhor resultado para a previsão do ponto de entupimento de filtro a frio foi utilizando os espectros de Mid-IR e o método de regressão GA-SVM, com alto coeficiente de determinação da previsão, R2Pred=0,96 e baixo valor da Raiz Quadrada do Erro Médio Quadrático da previsão, RMSEP (C)= 0,6. Para o modelo de previsão da massa específica, o melhor resultado foi obtido utilizando os espectros de Mid-IR e regressão por PLS, com R2Pred=0,98 e RMSEP (g/cm3)= 0,0002. Quanto ao modelo de previsão para o índice de refração, o melhor resultado foi obtido utilizando os espectros de Mid-IR e regressão por PLS, com excelente R2Pred=0,98 e RMSEP= 0,0001. Para esses conjuntos de dados, o PLS e o SVM demonstraram sua robustez, apresentando-se como ferramentas úteis para a previsão das propriedades do biodiesel estudadas

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Processos de produção precisam ser avaliados continuamente para que funcionem de modo mais eficaz e eficiente possível. Um conjunto de ferramentas utilizado para tal finalidade é denominado controle estatístico de processos (CEP). Através de ferramentas do CEP, o monitoramento pode ser realizado periodicamente. A ferramenta mais importante do CEP é o gráfico de controle. Nesta tese, foca-se no monitoramento de uma variável resposta, por meio dos parâmetros ou coeficientes de um modelo de regressão linear simples. Propõe-se gráficos de controle χ2 adaptativos para o monitoramento dos coeficientes do modelo de regressão linear simples. Mais especificamente, são desenvolvidos sete gráficos de controle χ2 adaptativos para o monitoramento de perfis lineares, a saber: gráfico com tamanho de amostra variável; intervalo de amostragem variável; limites de controle e de advertência variáveis; tamanho de amostra e intervalo de amostragem variáveis; tamanho de amostra e limites variáveis; intervalo de amostragem e limites variáveis e por fim, com todos os parâmetros de projeto variáveis. Medidas de desempenho dos gráficos propostos foram obtidas através de propriedades de cadeia de Markov, tanto para a situação zero-state como para a steady-state, verificando-se uma diminuição do tempo médio até um sinal no caso de desvios pequenos a moderados nos coeficientes do modelo de regressão do processo de produção. Os gráficos propostos foram aplicados a um exemplo de um processo de fabricação de semicondutores. Além disso, uma análise de sensibilidade dos mesmos é feita em função de desvios de diferentes magnitudes nos parâmetros do processo, a saber, no intercepto e na inclinação, comparando-se o desempenho entre os gráficos desenvolvidos e também com o gráfico χ2 com parâmetros fixos. Os gráficos propostos nesta tese são adequados para vários tipos de aplicações. Neste trabalho também foi considerado características de qualidade as quais são representadas por um modelo de regressão não-linear. Para o modelo de regressão não-linear considerado, a proposta é utilizar um método que divide o perfil não-linear em partes lineares, mais especificamente, um algoritmo para este fim, proposto na literatura, foi utilizado. Desta forma, foi possível validar a técnica proposta, mostrando que a mesma é robusta no sentido que permite tipos diferentes de perfis não-lineares. Aproxima-se, portanto um perfil não-linear por perfis lineares por partes, o que proporciona o monitoramento de cada perfil linear por gráficos de controle, como os gráficos de controle desenvolvidos nesta tese. Ademais apresenta-se a metodologia de decompor um perfil não-linear em partes lineares de forma detalhada e completa, abrindo espaço para ampla utilização.