1000 resultados para Regressão não paramétrica
Resumo:
Objetivou-se avaliar a melhor modelagem para as variâncias genética aditiva, de ambiente permanente e residual da produção de leite no dia do controle (PLDC) de caprinos. Utilizaram-se modelos de regressão aleatória sobre polinômios ortogonais de Legendre com diferentes ordens de ajuste e variância residual heterogênea. Consideraram-se como efeitos fixos os efeitos de grupo de contemporâneos, a idade da cabra ao parto (co-variável) e a regressão fixa da PLDC sobre polinômios de Legendre, para modelar a trajetória média da população; e, como efeitos aleatórios, os efeitos genético aditivo e de ambiente permanente. O modelo com quatro classes de variâncias residuais foi o que proporcionou melhor ajuste. Os valores do logaritmo da função de verossimilhança, de AIC e BIC apontaram para seleção de modelos com ordens mais altas (cinco para o efeito genético e sete para o efeito de ambiente permanente). Entretanto, os autovalores associados às matrizes de co-variâncias entre os coeficientes de regressão indicaram a possibilidade de redução da dimensionalidade. As altas ordens de ajuste proporcionaram estimativas de variâncias genéticas e correlações genéticas e de ambiente permanente que não condizem com o fenômeno biológico estudado. O modelo de quinta ordem para a variância genética aditiva e de sétima ordem para o ambiente permanente foi indicado. Entretanto, um modelo mais parcimonioso, de quarta ordem para o efeito genético aditivo e de sexta ordem para o efeito de ambiente permanente, foi suficiente para ajustar as variâncias nos dados.
Resumo:
Utilizaram-se 17.767 registros de peso de 4.210 cordeiros da raça Santa Inês com o objetivo de comparar modelos de regressão aleatória com diferentes estruturas para modelar a variância residual em estudos genéticos da curva de crescimento. Os efeitos fixos incluídos na análise foram: grupo contemporâneo e idade da ovelha no parto. As regressões fixas e aleatórias foram ajustadas por meio de polinômios de Legendre de ordens 4 e 3, respectivamente. A variância residual foi ajustada por meio de classes heterogêneas e por funções de variância empregando polinômios ordinários e de Legendre de ordens 2 a 8. O modelo considerando homogeneidade de variâncias residuais mostrou-se inadequado. de acordo com os critérios utilizados, a variância residual contendo sete classes heterogêneas proporcionou melhor ajuste, embora um mais parcimonioso, com cinco classes, pudesse ser utilizado sem perdas na qualidade de ajuste da variância nos dados. O ajuste de funções de variância com qualquer ordem foi melhor que o obtido por meio de classes. O polinômio ordinário de ordem 6 proporcionou melhor ajuste entre as estruturas testadas. A modelagem do resíduo interferiu nas estimativas de variâncias e parâmetros genéticos. Além da alteração da classificação dos reprodutores, a magnitude dos valores genéticos preditos apresenta variações significativas, de acordo com o ajuste da variância residual empregado.
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Sistema de detecção e isolamento de falhas em sistemas dinâmicos baseado em identificação paramétrica
Resumo:
The present research aims at contributing to the area of detection and diagnosis of failure through the proposal of a new system architecture of detection and isolation of failures (FDI, Fault Detection and Isolation). The proposed architecture presents innovations related to the way the physical values monitored are linked to the FDI system and, as a consequence, the way the failures are detected, isolated and classified. A search for mathematical tools able to satisfy the objectives of the proposed architecture has pointed at the use of the Kalman Filter and its derivatives EKF (Extended Kalman Filter) and UKF (Unscented Kalman Filter). The use of the first one is efficient when the monitored process presents a linear relation among its physical values to be monitored and its out-put. The other two are proficient in case this dynamics is no-linear. After that, a short comparative of features and abilities in the context of failure detection concludes that the UFK system is a better alternative than the EKF one to compose the architecture of the FDI system proposed in case of processes of no-linear dynamics. The results shown in the end of the research refer to the linear and no-linear industrial processes. The efficiency of the proposed architecture may be observed since it has been applied to simulated and real processes. To conclude, the contributions of this thesis are found in the end of the text
Resumo:
The problems of combinatory optimization have involved a large number of researchers in search of approximative solutions for them, since it is generally accepted that they are unsolvable in polynomial time. Initially, these solutions were focused on heuristics. Currently, metaheuristics are used more for this task, especially those based on evolutionary algorithms. The two main contributions of this work are: the creation of what is called an -Operon- heuristic, for the construction of the information chains necessary for the implementation of transgenetic (evolutionary) algorithms, mainly using statistical methodology - the Cluster Analysis and the Principal Component Analysis; and the utilization of statistical analyses that are adequate for the evaluation of the performance of the algorithms that are developed to solve these problems. The aim of the Operon is to construct good quality dynamic information chains to promote an -intelligent- search in the space of solutions. The Traveling Salesman Problem (TSP) is intended for applications based on a transgenetic algorithmic known as ProtoG. A strategy is also proposed for the renovation of part of the chromosome population indicated by adopting a minimum limit in the coefficient of variation of the adequation function of the individuals, with calculations based on the population. Statistical methodology is used for the evaluation of the performance of four algorithms, as follows: the proposed ProtoG, two memetic algorithms and a Simulated Annealing algorithm. Three performance analyses of these algorithms are proposed. The first is accomplished through the Logistic Regression, based on the probability of finding an optimal solution for a TSP instance by the algorithm being tested. The second is accomplished through Survival Analysis, based on a probability of the time observed for its execution until an optimal solution is achieved. The third is accomplished by means of a non-parametric Analysis of Variance, considering the Percent Error of the Solution (PES) obtained by the percentage in which the solution found exceeds the best solution available in the literature. Six experiments have been conducted applied to sixty-one instances of Euclidean TSP with sizes of up to 1,655 cities. The first two experiments deal with the adjustments of four parameters used in the ProtoG algorithm in an attempt to improve its performance. The last four have been undertaken to evaluate the performance of the ProtoG in comparison to the three algorithms adopted. For these sixty-one instances, it has been concluded on the grounds of statistical tests that there is evidence that the ProtoG performs better than these three algorithms in fifty instances. In addition, for the thirty-six instances considered in the last three trials in which the performance of the algorithms was evaluated through PES, it was observed that the PES average obtained with the ProtoG was less than 1% in almost half of these instances, having reached the greatest average for one instance of 1,173 cities, with an PES average equal to 3.52%. Therefore, the ProtoG can be considered a competitive algorithm for solving the TSP, since it is not rare in the literature find PESs averages greater than 10% to be reported for instances of this size.
Resumo:
Modelos de regressão aleatória foram utilizados neste estudo para estimar parâmetros genéticos da produção de leite no dia do controle (PLDC) em caprinos leiteiros da raça Alpina, por meio da metodologia Bayesiana. As estimativas geradas foram comparadas às obtidas com análise de regressão aleatória, utilizando-se o REML. As herdabilidades encontradas pela análise Bayesiana variaram de 0,18 a 0,37, enquanto, pelo REML, variaram de 0,09 a 0,32. As correlações genéticas entre dias de controle próximos se aproximaram da unidade, decrescendo gradualmente conforme a distância entre os dias de controle aumentou. Os resultados obtidos indicam que: a estrutura de covariâncias da PLDC em caprinos ao longo da lactação pode ser modelada adequadamente por meio da regressão aleatória; a predição de ganhos genéticos e a seleção de animais geneticamente superiores é viável ao longo de toda a trajetória da lactação; os resultados gerados pelas análises de regressão aleatória utilizando-se a Amostragem de Gibbs e o REML foram semelhantes, embora as estimativas das variâncias genéticas e das herdabilidades tenham sido levemente superiores na análise Bayesiana, utilizando-se a Amostragem de Gibbs.
Resumo:
Um total de 19.770 pesos corporais de bovinos Guzerá, do nascimento aos 365 dias de idade, pertencentes ao banco de dados da Associação Brasileira dos Criadores de Zebu (ABCZ) foi analisado com os objetivos de comparar diferentes estruturas de variâncias residuais, considerando 1, 18, 28 e 53 classes residuais e funções de variância de ordens quadrática a quíntica; e estimar funções de co-variância de diferentes ordens para os efeitos genético aditivo direto, genético materno, de ambiente permanente de animal e de mãe e parâmetros genéticos para os pesos corporais usando modelos de regressão aleatória. Os efeitos aleatórios foram modelados por regressões polinomiais em escala de Legendre com ordens variando de linear a quártica. Os modelos foram comparados pelo teste de razão de verossimilhança e pelos critérios de Informação de Akaike e de Informação Bayesiano de Schwarz. O modelo com 18 classes heterogêneas foi o que melhor se ajustou às variâncias residuais, de acordo com os testes estatísticos, porém, o modelo com função de variância de quinta ordem também mostrou-se apropriado. Os valores de herdabilidade direta estimados foram maiores que os encontrados na literatura, variando de 0,04 a 0,53, mas seguiram a mesma tendência dos estimados pelas análises unicaracterísticas. A seleção para peso em qualquer idade melhoraria o peso em todas as idades no intervalo estudado.
Resumo:
The main goal of Regression Test (RT) is to reuse the test suite of the latest version of a software in its current version, in order to maximize the value of the tests already developed and ensure that old features continue working after the new changes. Even with reuse, it is common that not all tests need to be executed again. Because of that, it is encouraged to use Regression Tests Selection (RTS) techniques, which aims to select from all tests, only those that reveal faults, this reduces costs and makes this an interesting practice for the testing teams. Several recent research works evaluate the quality of the selections performed by RTS techniques, identifying which one presents the best results, measured by metrics such as inclusion and precision. The RTS techniques should seek in the System Under Test (SUT) for tests that reveal faults. However, because this is a problem without a viable solution, they alternatively seek for tests that reveal changes, where faults may occur. Nevertheless, these changes may modify the execution flow of the algorithm itself, leading some tests no longer exercise the same stretch. In this context, this dissertation investigates whether changes performed in a SUT would affect the quality of the selection of tests performed by an RTS, if so, which features the changes present which cause errors, leading the RTS to include or exclude tests wrongly. For this purpose, a tool was developed using the Java language to automate the measurement of inclusion and precision averages achieved by a regression test selection technique for a particular feature of change. In order to validate this tool, an empirical study was conducted to evaluate the RTS technique Pythia, based on textual differencing, on a large web information system, analyzing the feature of types of tasks performed to evolve the SUT
Resumo:
OBJETIVO: avaliar a utilidade da curva de regressão normal da gonadotrofina coriônica humana (hCG) no diagnóstico precoce de neoplasia trofoblástica gestacional pós-molar (NTG). MÉTODOS: estudo longitudinal, incluindo 105 pacientes com mola hidatiforme completa (MHC) acompanhadas no Centro de Doenças Trofoblásticas de Botucatu, entre 1998 e 2005. Os títulos da hCG sérica foram mensurados quinzenalmente em todas as pacientes. Curvas individuais de regressão da hCG das 105 pacientes foram estabelecidas. A comparação entre a curva de regressão normal estabelecida em nosso serviço com as curvas individuais da hCG foi usada no rastreamento e diagnóstico (platô/ascensão) de NTG. O número de semanas pós-esvaziamento quando a hCG excedeu o limite normal foi comparado com o número semanas em que a hCG apresentou platô/ascensão. RESULTADOS: das 105 pacientes com MHC, 80 apresentaram remissão espontânea (RE) e 25 desenvolveram NTG. Das 80 pacientes com RE, 7 (8,7%) apresentaram, inicialmente, dosagem da hCG acima do normal, mas, no devido tempo, alcançaram a remissão. Todas as 25 pacientes com NTG apresentaram desvio da curva normal da hCG em 3,8±2,5 semanas e mostraram platô ou ascensão em 8,4±2,9 semanas (p<0,001). CONCLUSÕES: a curva de regressão normal da hCG pós-molar pode ser útil para diagnóstico de NTG.
Resumo:
In this work we study the Hidden Markov Models with finite as well as general state space. In the finite case, the forward and backward algorithms are considered and the probability of a given observed sequence is computed. Next, we use the EM algorithm to estimate the model parameters. In the general case, the kernel estimators are used and to built a sequence of estimators that converge in L1-norm to the density function of the observable process
Resumo:
OBJETIVO: Analisar o padrão de citocinas pró- e antiinflamatórias e da resposta de fase aguda (RFA) como marcadores de resposta ao tratamento da tuberculose pulmonar. MÉTODOS: Determinação dos níveis de interferon-gama (IFN-γ), tumor necrosis factor-alpha (TNF-α, fator de necrose tumoral-alfa), interleucina-10 (IL-10) e transforming growth factor-beta (TGF-β, fator transformador de crescimento-beta), pelo método ELISA, em sobrenadante de cultura de células mononucleares do sangue periférico e monócitos, assim como dos níveis de proteínas totais, albumina, globulinas, alfa-1-glicoproteína ácida (AGA), proteína C reativa (PCR) e velocidade de hemossedimentação (VHS) em 28 doentes com tuberculose pulmonar, em três tempos: antes (T0), aos três meses (T3) e aos seis meses (T6) de tratamento, em relação aos controles saudáveis, em um único tempo. RESULTADOS: Os pacientes apresentaram valores maiores de citocinas e RFA que os controles em T0, com diminuição em T3 e diminuição (TNF-α, IL-10, TGF-β, AGA e VHS) ou normalização (IFN-γ e PCR) em T6. CONCLUSÕES: PCR, AGA e VHS são possíveis marcadores para auxiliar no diagnóstico de tuberculose pulmonar e na indicação de tratamento de indivíduos com baciloscopia negativa; PCR (T0 > T3 > T6 = referência) pode também ser marcador de resposta ao tratamento. Antes do tratamento, o perfil Th0 (IFN-γ, IL-10, TNF-α e TGF-β), indutor de e protetor contra inflamação, prevaleceu nos pacientes; em T6, prevaleceu o perfil Th2 (IL-10, TNF-α e TGF-β), protetor contra efeito nocivo pró-inflamatório do TNF-α ainda presente. O comportamento do IFN-γ (T0 > T3 > T6 = controle) sugere sua utilização como marcador de resposta ao tratamento.
Resumo:
Objetivos: construir a curva de regressão do b-hCG pós-mola hidatiforme completa (MHC) com remissão espontânea e comparar com a curva de regressão pós-MHC com tumor trofoblástico gestacional (TTG). Análise comparativa da curva de regressão do b-hCG das portadoras de MHC, acompanhadas no Serviço, com a curva de regressão observada por outros autores1-3. Métodos: foi realizada avaliação clínica e laboratorial (dosagem sérica de b-hCG), na admissão e no segmento pós-molar, de todas as pacientes com MHC, atendidas entre 1990 e 1998 no Hospital das Clínicas de Botucatu - Unesp. O resultado da determinação seriada do b-hCG foi analisado em curvas log de regressão. A evolução da curva de regressão do b-hCG foi analisada e comparada em MHC com remissão espontânea e MHC com TTG numa curva log de regressão, com intervalo de confiança de 95%. A curva log de regressão do grupo de remissão espontânea foi comparada com curvas consideradas padrão1,2. Foram construídas curvas log individuais de todas as pacientes e classificadas de acordo com os quatro tipos de curva (I, II, III e IV), propostos para o seguimento pós-molar³. Resultados: 61 pacientes com MHC tiveram seguimento pós-molar completo, 50 (82%) apresentaram remissão espontânea e 11 (18%) desenvolveram TTG. No grupo de pacientes com MHC e remissão espontânea, o tempo para alcançar a normalização dos níveis do b-hCG, após o esvaziamento molar, foi até 20 semanas. As pacientes que desenvolveram TTG apresentaram desvio precoce da curva de regressão normal do b-hCG, 4 a 6 semanas após o esvaziamento molar. Nestas pacientes, a quimioterapia foi introduzida em média na 9ª semana pós-esvaziamento molar. Conclusões: a curva de regressão do b-hCG pós-MHC com remissão espontânea apresentou declínio log exponencial, semelhante ao observado por outros autores1,2, e diferente das MHC com TTG. Foram identificados três tipos de curvas de regressão do b-hCG, semelhantes aos de Goldstein³, I, II e IV, e outros dois tipos diferentes de regressão do b-hCG: V (regressão normal) e VI (regressão anormal).
Resumo:
This paper presents an application of AMMI models - Additive Main effects and Multiplicative Interaction model - for a thorough study about the effect of the interaction between genotype and environment in multi-environments experiments with balanced data. Two methods of crossed validation are presented and the improvement of these methods through the correction of eigenvalues, being these rearranged by the isotonic regression. A comparative study between these methods is made, with real data. The results show that the EASTMENT & KRZANOWSKI (1982) method selects a more parsimonious model and when this method is improved with the correction of the eigenvalues, the number of components are not modified. GABRIEL (2002) method selects a huge number of terms to hold back in the model, and when this method is improved by the correction of eigenvalue, the number of terms diminishes. Therefore, the improvement of these methods through the correction of eigenvalues brings a great benefit from the practical point of view for the analyst of data proceeding from multi-ambient, since the selection of numbers of multiplicative terms represents a profit of the number of blocks (or repetitions), when the model AMMI is used, instead of the complete model.
Resumo:
Objetivou-se comparar modelos de regressão aleatória com diferentes estruturas de variância residual, a fim de se buscar a melhor modelagem para a característica tamanho da leitegada ao nascer (TLN). Utilizaram-se 1.701 registros de TLN, que foram analisados por meio de modelo animal, unicaracterística, de regressão aleatória. As regressões fixa e aleatórias foram representadas por funções contínuas sobre a ordem de parto, ajustadas por polinômios ortogonais de Legendre de ordem 3. Para averiguar a melhor modelagem para a variância residual, considerou-se a heterogeneidade de variância por meio de 1 a 7 classes de variância residual. O modelo geral de análise incluiu grupo de contemporâneo como efeito fixo; os coeficientes de regressão fixa para modelar a trajetória média da população; os coeficientes de regressão aleatória do efeito genético aditivo-direto, do comum-de-leitegada e do de ambiente permanente de animal; e o efeito aleatório residual. O teste da razão de verossimilhança, o critério de informação de Akaike e o critério de informação bayesiano de Schwarz apontaram o modelo que considerou homogeneidade de variância como o que proporcionou melhor ajuste aos dados utilizados. As herdabilidades obtidas foram próximas a zero (0,002 a 0,006). O efeito de ambiente permanente foi crescente da 1ª (0,06) à 5ª (0,28) ordem, mas decrescente desse ponto até a 7ª ordem (0,18). O comum-de-leitegada apresentou valores baixos (0,01 a 0,02). A utilização de homogeneidade de variância residual foi mais adequada para modelar as variâncias associadas à característica tamanho da leitegada ao nascer nesse conjunto de dado.