117 resultados para Penalized likelihood


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Calculations of local influence curvatures and leverage have been well developed when the parameters are unrestricted. In this article, we discuss the assessment of local influence and leverage under linear equality parameter constraints with extensions to inequality constraints. Using a penalized quadratic function we express the normal curvature of local influence for arbitrary perturbation schemes and the generalized leverage matrix in interpretable forms, which depend on restricted and unrestricted components. The results are quite general and can be applied in various statistical models. In particular, we derive the normal curvature under three useful perturbation schemes for generalized linear models. Four illustrative examples are analyzed by the methodology developed in the article.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Although the asymptotic distributions of the likelihood ratio for testing hypotheses of null variance components in linear mixed models derived by Stram and Lee [1994. Variance components testing in longitudinal mixed effects model. Biometrics 50, 1171-1177] are valid, their proof is based on the work of Self and Liang [1987. Asymptotic properties of maximum likelihood estimators and likelihood tests under nonstandard conditions. J. Amer. Statist. Assoc. 82, 605-610] which requires identically distributed random variables, an assumption not always valid in longitudinal data problems. We use the less restrictive results of Vu and Zhou [1997. Generalization of likelihood ratio tests under nonstandard conditions. Ann. Statist. 25, 897-916] to prove that the proposed mixture of chi-squared distributions is the actual asymptotic distribution of such likelihood ratios used as test statistics for null variance components in models with one or two random effects. We also consider a limited simulation study to evaluate the appropriateness of the asymptotic distribution of such likelihood ratios in moderately sized samples. (C) 2008 Elsevier B.V. All rights reserved.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Likelihood ratio tests can be substantially size distorted in small- and moderate-sized samples. In this paper, we apply Skovgaard`s [Skovgaard, I.M., 2001. Likelihood asymptotics. Scandinavian journal of Statistics 28, 3-321] adjusted likelihood ratio statistic to exponential family nonlinear models. We show that the adjustment term has a simple compact form that can be easily implemented from standard statistical software. The adjusted statistic is approximately distributed as X(2) with high degree of accuracy. It is applicable in wide generality since it allows both the parameter of interest and the nuisance parameter to be vector-valued. Unlike the modified profile likelihood ratio statistic obtained from Cox and Reid [Cox, D.R., Reid, N., 1987. Parameter orthogonality and approximate conditional inference. journal of the Royal Statistical Society B49, 1-39], the adjusted statistic proposed here does not require an orthogonal parameterization. Numerical comparison of likelihood-based tests of varying dispersion favors the test we propose and a Bartlett-corrected version of the modified profile likelihood ratio test recently obtained by Cysneiros and Ferrari [Cysneiros, A.H.M.A., Ferrari, S.L.P., 2006. An improved likelihood ratio test for varying dispersion in exponential family nonlinear models. Statistics and Probability Letters 76 (3), 255-265]. (C) 2008 Elsevier B.V. All rights reserved.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

We give a general matrix formula for computing the second-order skewness of maximum likelihood estimators. The formula was firstly presented in a tensorial version by Bowman and Shenton (1998). Our matrix formulation has numerical advantages, since it requires only simple operations on matrices and vectors. We apply the second-order skewness formula to a normal model with a generalized parametrization and to an ARMA model. (c) 2010 Elsevier B.V. All rights reserved.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

We analyse the finite-sample behaviour of two second-order bias-corrected alternatives to the maximum-likelihood estimator of the parameters in a multivariate normal regression model with general parametrization proposed by Patriota and Lemonte [A. G. Patriota and A. J. Lemonte, Bias correction in a multivariate regression model with genereal parameterization, Stat. Prob. Lett. 79 (2009), pp. 1655-1662]. The two finite-sample corrections we consider are the conventional second-order bias-corrected estimator and the bootstrap bias correction. We present the numerical results comparing the performance of these estimators. Our results reveal that analytical bias correction outperforms numerical bias corrections obtained from bootstrapping schemes.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

We propose a likelihood ratio test ( LRT) with Bartlett correction in order to identify Granger causality between sets of time series gene expression data. The performance of the proposed test is compared to a previously published bootstrapbased approach. LRT is shown to be significantly faster and statistically powerful even within non- Normal distributions. An R package named gGranger containing an implementation for both Granger causality identification tests is also provided.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Dados de bovinos compostos foram analisados para avaliar o efeito da epistasia nos modelos de avaliação genética. As características analisadas foram os pesos aos 205 (P205) e 390 dias (P390) e perímetro escrotal aos 390 dias (PE390). As análises foram realizadas pela metodologia de máxima verossimilhança considerando-se dois modelos: o modelo 1 incluiu como covariáveis os efeitos aditivos diretos e maternos, e os não aditivos das heterozigoses para os efeitos diretos e para o materno total, e o modelo 2 considerou também o efeito direto de epistasia. Para comparação dos modelos, foram utilizados o critério de informação de Akaike (AIC) e o critério de informação Bayesiano de Schwartz (BIC), e o teste de razão de verossimilhança. A inclusão da epistasia no modelo de avaliação genética pouco alterou as estimativas de componentes de (co)variâncias genéticas aditivas e, consequentemente, as herdabilidades. O teste de verossimilhança e o critério de Akaike sugeriram que o modelo 2, que inclui a epistasia, apresentou maior aderência aos dados para todas as características analisadas. O critério BIC indicou este modelo como o melhor apenas para P205. Para análise genética dessa população, o modelo que considerou o efeito de epistasia foi o mais adequado.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O presente trabalho avaliou a variabilidade amostral dos parâmetros da distribuição gama, relativos a séries mensais de precipitação pluvial, nas regiões de Campinas-SP e Pelotas-RS, que têm dados para os períodos de 1890-2006 e 1890-2005, respectivamente. Assim, os espaços amostrais considerados foram de 58, 39 e 29 anos para Campinas e 58 e 29 anos para Pelotas. As análises foram feitas usando o teste da razão da máxima verossimilhança. Os resultados apontaram significativas alterações amostrais. Não houve indicações de tendências contínuas (redução ou aumento) no regime mensal de precipitação pluvial na região de Campinas-SP. Em contrapartida, esse teste indicou, para a localidade de Pelotas-RS, tendência de elevação no regime desse elemento meteorológico ocorrida entre as amostras relativas aos anos de 1948 a 1976 e 1977 a 2005.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A novel karyotype with 2n = 50, FN = 48, was described for specimens of Thaptomys collected at Una, State of Bahia, Brazil, which are morphologically indistinguishable from Thaptomys nigrita, 2n = 52, FN = 52, found in other localities. It was hence proposed that the 2n = 50 karyotype could belong to a distinct species, cryptic of Thaptomys nigrita, once chromosomal rearrangements observed, along with the geographic distance, might represent a reproductive barrier between both forms. Phylogenetic analyses using maximum parsimony and maximum likelihood based on partial cytochrome b sequences with 1077 bp were performed, attempting to establish the relationships among the individuals with distinct karyotypes along the geographic distribution of the genus; the sample comprised 18 karyotyped specimens of Thaptomys, encompassing 15 haplotypes, from eight different localities of the Atlantic Rainforest. The intra-generic relationships corroborated the distinct diploid numbers, once both phylogenetic reconstructions recovered two monophyletic lineages, a northeastern clade grouping the 2n = 50 and a southeastern clade with three subclades, grouping the 2n = 52 karyotype. The sequence divergence observed between their individuals ranged from 1.9% to 3.5%.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

We present a computer program developed for estimating penetrance rates in autosomal dominant diseases by means of family kinship and phenotype information contained within the pedigrees. The program also determines the exact 95% credibility interval for the penetrance estimate. Both executable (PenCalc for Windows) and web versions (PenCalcWeb) of the software are available. The web version enables further calculations, such as heterozygosity probabilities and assessment of offspring risks for all individuals in the pedigrees. Both programs can be accessed and down-loaded freely at the home-page address http://www.ib.usp.br/~otto/software.htm.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this work we study the problem of modeling identification of a population employing a discrete dynamic model based on the Richards growth model. The population is subjected to interventions due to consumption, such as hunting or farming animals. The model identification allows us to estimate the probability or the average time for a population number to reach a certain level. The parameter inference for these models are obtained with the use of the likelihood profile technique as developed in this paper. The identification method here developed can be applied to evaluate the productivity of animal husbandry or to evaluate the risk of extinction of autochthon populations. It is applied to data of the Brazilian beef cattle herd population, and the the population number to reach a certain goal level is investigated.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A modelagem da estrutura de dependência espacial pela abordagem da geoestatística é fundamental para a definição de parâmetros que definem esta estrutura, e que são utilizados na interpolação de valores em locais não amostrados pela técnica de krigagem. Entretanto, a estimação de parâmetros pode ser muito afetada pela presença de observações atípicas nos dados amostrados. O desenvolvimento deste trabalho teve por objetivo utilizar técnicas de diagnóstico de influência local em modelos espaciais lineares gaussianos, utilizados em geoestatística, para avaliar a sensibilidade dos estimadores de máxima verossimilhança e máxima verossimilhança restrita na presença de dados discrepantes. Estudos com dados experimentais mostraram que tanto a presença de valores atípicos como de valores considerados influentes, pela análise de diagnóstico, pode exercer forte influência nos mapas temáticos, alterando, assim, a estrutura de dependência espacial. As aplicações de técnicas de diagnóstico de influência local devem fazer parte de toda análise geoestatística a fim de garantir que as informações contidas nos mapas temáticos tenham maior qualidade e possam ser utilizadas com maior segurança pelo agricultor.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

OBJETIVO: Analisar o consumo de frutas, verduras e legumes em mulheres, segundo fatores sócio-demográficos, econômicos e comportamentais. MÉTODOS: A amostra foi constituída de 311 mulheres de três áreas de estudo, do município de Cotia, na área metropolitana de São Paulo, selecionadas por amostragem por conglomerado em dois estágios. O consumo de frutas, verduras e legumes foi avaliado por questionário de freqüência alimentar. Os diferenciais de consumo foram estudados por análise multivariada de regressão logística. RESULTADOS: A chance de baixo consumo de frutas foi maior nas mulheres do bairro pobre, com baixa escolaridade, donas de casa e desempregadas, com baixa renda familiar e tabagistas. Os diferenciais de consumo de verduras foram associados mais à cultura alimentar do que à pobreza: as mais jovens apresentaram chances sensivelmente maiores de baixo consumo de verduras. O tabagismo e o sedentarismo associaram-se ao baixo consumo. Os legumes foram associados tanto ao nível socioeconômico, quanto à cultura alimentar. Foram pouco consumidos pelas mulheres mais jovens e, de um modo geral, por aquelas de pouca escolaridade e baixa renda familiar. Também, o etilismo e o sedentarismo aumentaram as chances de baixo consumo desses alimentos. CONCLUSÃO: O consumo de frutas, verduras e legumes apresentou diferenciais relacionados ao nível socioeconômico, à cultura alimentar e aos hábitos comportamentais.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Com objetivo de estimar parâmetros genéticos e estudar a utilização de diferentes efeitos em avaliações genéticas para idade ao primeiro parto (IPP) por diferentes modelos, foram utilizados registros de IPP de animais da raça Nelore, nascidos entre os anos de 1990 e 2005. Foram considerados os seguintes modelos (M): M1, incluindo o efeito fixo de GC1 (constituído pelos animais nascidos na mesma fazenda e ano), além da covariável, peso aos 365 dias de idade (efeito linear e quadrático), totalizando 24.263 registros de IPP; M2, considerando os efeitos fixos de GC1, ano e estação de parição, totalizando 59.792 registros de IPP e M3, incluindo os efeitos fixos de GC2 (agrupando os animais nascidos na mesma fazenda, ano e que conceberam no mesmo manejo reprodutivo), ano e estação de parição, totalizando 59.792 registros de IPP. As estimativas dos componentes de variância e herdabilidade e os valores genéticos (VG) foram obtidos pelo método da máxima verossimilhança restrita, com a inclusão da matriz de parentesco disponível. As diferenças esperadas na progênie (DEPs) foram obtidas dividindo os VG por dois. Após a obtenção desses resultados, foram realizadas correlações entre os VG e o ranqueamento das DEPs dos reprodutores para IPP, utilizando-se o procedimento PROC CORR (SAS, 2003). Ao se considerar o ano e a estação de parto nos modelos de análise (M2 e M3), esses produziram um maior R², indicando que tais modelos conseguiram explicar, em maior grau, as diferenças existentes entre os animais para IPP. As herdabilidades estimadas foram de baixa magnitude (0,14 e 0,15). As correlações entre os VG obtidas por diferentes modelos foram 0,73 (M1 x M2); 0,91 (M2 x M3) e 0,66 (M1 x M3).

Relevância:

10.00% 10.00%

Publicador:

Resumo:

OBJETIVO: Estimar o efeito da taxa de cobertura de linhas telefônicas residenciais em potenciais vícios de informação em inquéritos epidemiológicos. MÉTODOS: Foram utilizadas as bases de dados da Pesquisa Nacional por Amostra de Domicílios no período de 1998 a 2003 para a estimativa das taxas de cobertura de linhas telefônicas residenciais nas cinco regiões geográficas brasileiras. Utilizou-se a regressão logística múltipla para identificar os fatores associados à posse de linha telefônica fixa. O impacto do vício nos intervalos com 95% de confiança foi avaliado em função da precisão alcançada em cada situação. RESULTADOS: Nas regiões metropolitanas Sudeste, Sul e Centro-Oeste com 70% e mais de cobertura, os vícios associados foram considerados desprezíveis. Nas demais regiões, os vícios relativos estavam acima do limite aceitável (0,4), indicando possíveis erros nas inferências construídas sob intervalo com 95% de confiança. A chance de acesso à linha telefônica residencial foi maior para população com cor da pele branca e maior escolaridade. CONCLUSÕES: Os achados mostram que o uso de cadastro de linhas telefônicas residenciais é indicado para a realização de inquéritos epidemiológicos apenas para estados com cobertura acima de 70%. Metodologias específicas para o tratamento de estimativas obtidas em localidades com taxas inferiores, precisam ser estudadas e divulgadas