1000 resultados para regressão penalizada


Relevância:

60.00% 60.00%

Publicador:

Resumo:

RESUMO O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this work a fast method for the determination of the total sugar levels in samples of raw coffee was developed using the near infrared spectroscopy technique and multivariate regression. The sugar levels were initially obtained using gravimety as the reference method. Later on, the regression models were built from the near infrared spectra of the coffee samples. The original spectra were pre-treated according to the Kubelka-Munk transformation and multiplicative signal correction. The proposed analytical method made possible the direct determination of the total sugar levels in the samples with an error lower by 8% with respect to the conventional methodology.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The main objective of this work was to evaluate the linear regression between spectral response and soybean yield in regional scale. In this study were monitored 36 municipalities from the west region of the states of Parana using five images of Landsat 5/TM during 2004/05 season. The spectral response was converted in physical values, apparent and surface reflectances, by radiometric transformation and atmospheric corrections and both used to calculate NDVI and GVI vegetation indices. Those ones were compared by multiple and simple regression with government official yield values (IBGE). Diagnostic processing method to identify influents values or collinearity was applied to the data too. The results showed that the mean surface reflectance value from all images was more correlated with yield than individual dates. Further, the multiple regressions using all dates and both vegetation indices gave better results than simple regression.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

BACKGROUND: Changes in heart rate during rest-exercise transition can be characterized by the application of mathematical calculations, such as deltas 0-10 and 0-30 seconds to infer on the parasympathetic nervous system and linear regression and delta applied to data range from 60 to 240 seconds to infer on the sympathetic nervous system. The objective of this study was to test the hypothesis that young and middle-aged subjects have different heart rate responses in exercise of moderate and intense intensity, with different mathematical calculations. METHODS: Seven middle-aged men and ten young men apparently healthy were subject to constant load tests (intense and moderate) in cycle ergometer. The heart rate data were submitted to analysis of deltas (0-10, 0-30 and 60-240 seconds) and simple linear regression (60-240 seconds). The parameters obtained from simple linear regression analysis were: intercept and slope angle. We used the Shapiro-Wilk test to check the distribution of data and the t test for unpaired comparisons between groups. The level of statistical significance was 5%. RESULTS: The value of the intercept and delta 0-10 seconds was lower in middle age in two loads tested and the inclination angle was lower in moderate exercise in middle age. CONCLUSION: The young subjects present greater magnitude of vagal withdrawal in the initial stage of the HR response during constant load exercise and higher speed of adjustment of sympathetic response in moderate exercise.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

OBJETIVO: Analisar o consumo de frutas, legumes e verduras (FLV) de adolescentes e identificar fatores associados. MÉTODOS: Estudo transversal de base populacional com amostra representativa de 812 adolescentes de ambos os sexos de São Paulo, SP, em 2003. O consumo alimentar foi medido pelo recordatório alimentar de 24 horas. O consumo de FLV foi descrito em percentis e para investigar a associação entre a ingestão de FLV e variáveis explanatórias; foram utilizados modelos de regressão quantílica. RESULTADOS: Dos adolescentes entrevistados, 6,4% consumiram a recomendação mínima de 400 g/dia de FLV e 22% não consumiram nenhum tipo de FLV. Nos modelos de regressão quantílica, ajustados pelo consumo energético, faixa etária e sexo, a renda domiciliar per capita e a escolaridade do chefe de família associaram-se positivamente ao consumo de FLV, enquanto o hábito de fumar associou-se negativamente. Renda associou-se significativamente aos menores percentis de ingestão (p20 ao p55); tabagismo aos percentis intermediários (p45 ao p75) e escolaridade do chefe de família aos percentis finais de consumo de FLV (p70 ao p95). CONCLUSÕES: O consumo de FLV por adolescentes paulistanos mostrou-se abaixo das recomendações do Ministério da Saúde e é influenciado pela renda domiciliar per capita, pela escolaridade do chefe de família e pelo hábito de fumar.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Considerou-se o ajustamento de equações de regressão não-linear e o teste da razão de verossimilhança, com aproximações pelas estatísticas qui-quadrado e F, para testar as hipóteses de igualdade de qualquer subconjunto de parâmetros e de identidade dos modelos para dados com repetições provenientes de experimento com delineamento em blocos completos casualizados. Concluiu-se que as duas aproximações podem ser utilizadas, mas a aproximação pela estatística F deve ser preferida, principalmente para pequenas amostras.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Em fevereiro de 2009, o Ministério do Meio Ambiente criou a Resolução CONAMA 406, que determina que, a partir do segundo Plano Operacional Anual (POA), só será aceito, pelo órgão ambiental competente, o cálculo do volume de árvores em pé, mediante equação de volume, desenvolvida especificamente para o Plano de Manejo Florestal Sustentável (PMFS). Em função disso, necessita-se especificar um modelo estatístico para estimar o volume comercial das árvores. Neste trabalho, ajustou-se o modelo estatístico às informações coletadas em povoamento de floresta Ombrófila densa, localizada no município de Paragominas, Estado do Pará, com o objetivo de selecionar o de melhor ajuste e precisão. A amostra foi composta de 234 árvores, distribuídas em sete classes diamétricas, com amplitudes de 12 cm, no intervalo de 49 até 127 cm. Obteve-se o volume real, medindo-se as circunferências nas secções, a cada 2 m, determinando-se o CAP e a altura comercial real. A seleção para a escolha do melhor modelo teve como referência o valor da estatística F, o mais alto coeficiente de determinação (R²), o menor erro padrão da estimativa em percentagem (Syx%) e a análise de resíduos, por meio do Desvio Médio Porcentual (DMP). Com base nas estatísticas mencionadas, concluiu-se que o melhor entre os modelos tradicionais, a ser empregado na área, foi o proposto por Schumacher-Hall. Finalmente, concluiu-se que o modelo alternativo, com variável dummy, é melhor e deve ser o adotado em florestas nativas da Amazônia.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar a estabilidade e a adaptabilidade de oito genótipos de cenoura (três cultivares e cinco populações), em 17 ambientes, nas regiões nordeste, centro-oeste, sudeste e sul do Brasil, nos anos agrícolas 2009/10, 2010/11 e 2011/12. Os experimentos foram conduzidos entre novembro e janeiro de cada ano, conforme o calendário agrícola dos produtores. A parcela experimental foi composta de área igual a 1,0 m², em delineamento de blocos ao acaso, com três repetições. Os tratos culturais foram similares aos usados pelos produtores. Na colheita, as raízes comercializáveis foram quantificadas e os valores transformados para t ha-1. Realizouse a análise de variância e, posteriormente, a análise de fatores e a análise de regressão bissegmentada, visando ao estudo de estabilidade e adaptabilidade. Nenhum genótipo apresentou adaptabilidade ampla. A análise de fatores conseguiu agrupar menos de 50% dos ambientes avaliados. O genótipo ideal não foi encontrado pela análise de regressão. O cultivar 'BRS Planalto' foi o mais adaptado, pelo método da regressão bissegmentada, enquanto, pela análise de fatores, 'Brasília', CNPH-600 e CNPH-589 mostraram-se mais adaptados. Os resultados obtidos por essas metodologias demonstram a dificuldade de recomendação de um cultivar para todas as regiões produtoras e que programas regionalizados devem ser iniciados. A utilização dos dois métodos associados permite a tomada de decisões mais segura acerca do comportamento dos genótipos de cenoura.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este estudo visou responder à questão: quais são os fatores associados aos níveis de eficiência na alocação de recursos públicos? Tendo como norteador o referencial teórico dos tópicos relativos à eficiência na alocação do recurso público e fatores determinantes da eficiência na alocação do recurso público, este estudo se baseou em análises estatísticas tendo como universo os 853 municípios do estado de Minas Gerais, porém só foram analisados 831, os quais continham a totalidade dos dados necessários. Como um dos principais resultados, destaca-se a criação do índice de eficiência municipal. Além disso, verificou-se que municípios que possuem piores condições socioeconômicas têm sua gestão pública influenciada por uma gama maior de variáveis exógenas. Assim, nota-se ser premente a criação de mecanismos que minimizem os efeitos daquelas variáveis cuja influência sobre a gestão pública e sua eficiência se deu de forma negativa. Por outro lado, deve-se buscar maximizar a influência daquelas cuja associação ao índice de eficiência municipal se deu de forma positiva.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Do problema do ajuste de uma regressão linear, quando a distribuição da variável dependente tem duplo truncamento, utilizando a função de máxima verossimilhança e um processo iterativo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Os avanços tecnológicos e científicos, na área da saúde, têm vindo a aliar áreas como a Medicina e a Matemática, cabendo à ciência adequar de forma mais eficaz os meios de investigação, diagnóstico, monitorização e terapêutica. Os métodos desenvolvidos e os estudos apresentados nesta dissertação resultam da necessidade de encontrar respostas e soluções para os diferentes desafios identificados na área da anestesia. A índole destes problemas conduz, necessariamente, à aplicação, adaptação e conjugação de diferentes métodos e modelos das diversas áreas da matemática. A capacidade para induzir a anestesia em pacientes, de forma segura e confiável, conduz a uma enorme variedade de situações que devem ser levadas em conta, exigindo, por isso, intensivos estudos. Assim, métodos e modelos de previsão, que permitam uma melhor personalização da dosagem a administrar ao paciente e por monitorizar, o efeito induzido pela administração de cada fármaco, com sinais mais fiáveis, são fundamentais para a investigação e progresso neste campo. Neste contexto, com o objetivo de clarificar a utilização em estudos na área da anestesia de um ajustado tratamento estatístico, proponho-me abordar diferentes análises estatísticas para desenvolver um modelo de previsão sobre a resposta cerebral a dois fármacos durante sedação. Dados obtidos de voluntários serão utilizados para estudar a interação farmacodinâmica entre dois fármacos anestésicos. Numa primeira fase são explorados modelos de regressão lineares que permitam modelar o efeito dos fármacos no sinal cerebral BIS (índice bispectral do EEG – indicador da profundidade de anestesia); ou seja estimar o efeito que as concentrações de fármacos têm na depressão do eletroencefalograma (avaliada pelo BIS). Na segunda fase deste trabalho, pretende-se a identificação de diferentes interações com Análise de Clusters bem como a validação do respetivo modelo com Análise Discriminante, identificando grupos homogéneos na amostra obtida através das técnicas de agrupamento. O número de grupos existentes na amostra foi, numa fase exploratória, obtido pelas técnicas de agrupamento hierárquicas, e a caracterização dos grupos identificados foi obtida pelas técnicas de agrupamento k-means. A reprodutibilidade dos modelos de agrupamento obtidos foi testada através da análise discriminante. As principais conclusões apontam que o teste de significância da equação de Regressão Linear indicou que o modelo é altamente significativo. As variáveis propofol e remifentanil influenciam significativamente o BIS e o modelo melhora com a inclusão do remifentanil. Este trabalho demonstra ainda ser possível construir um modelo que permite agrupar as concentrações dos fármacos, com base no efeito no sinal cerebral BIS, com o apoio de técnicas de agrupamento e discriminantes. Os resultados desmontram claramente a interacção farmacodinâmica dos dois fármacos, quando analisamos o Cluster 1 e o Cluster 3. Para concentrações semelhantes de propofol o efeito no BIS é claramente diferente dependendo da grandeza da concentração de remifentanil. Em suma, o estudo demostra claramente, que quando o remifentanil é administrado com o propofol (um hipnótico) o efeito deste último é potenciado, levando o sinal BIS a valores bastante baixos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Exemplifica-se a aplicação de análise multivariada, por estratificação e com regressão logística, utilizando dados de um estudo caso-controle sobre câncer de esôfago. Oitenta e cinco casos e 292 controles foram classificados segundo sexo, idade e os hábitos de beber e de fumar. As estimativas por ponto dos odds ratios foram semelhantes, sendo as duas técnicas consideradas complementares.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

OBJETIVO: Apresentar uma aplicação da regressão logística para estimar razões de prevalência ou risco relativo, e o uso do método delta para a estimativa de intervalos de confiança. MÉTODOS: Utilizou-se o método delta, visto que esta técnica é adequada para estimar variâncias de funções não lineares de variáveis aleatórias, do tipo razão de proporções. O método baseia-se na expansão da função em série de Taylor, provendo uma aproximação para o cálculo das variâncias. Para estimar as razões de proporções e as respectivas variâncias, que permitem a estimação dos intervalos de confiança, desenvolveu-se programa utilizando-se o módulo matricial do SAS. A aplicação prática do modelo proposto é feita utilizando-se dados de um estudo transversal com uma amostra de 611 mulheres, para testar a hipótese de que a falta de compartilhamento do trabalho doméstico associa-se com altos escores de sintomas psicológicos medidos através de um questionário validado. As razões de prevalência calculadas através da regressão logística, e os intervalos de confiança estimados pelo método delta foram comparadas com os resultados obtidos pela técnica de Mantel-Haenszel. RESULTADOS: As estimativas pontuais das razões de prevalência brutas, cruas ou ajustadas, obtidas através da regressão logística, foram semelhantes às encontradas na análise tabular. Também os limites dos intervalos de confianças para as razões de prevalência através do método delta foram praticamente iguais em relação aos encontrados através da técnica de Mantel-Haenszel. CONCLUSÕES: Os resultados apóiam o uso do método delta para estimar intervalos de confiança para razões de proporção. Esse método deve ser visto como uma alternativa para situações em que o efeito em estudo (variável dependente) não é raro, situação onde a "odds ratio" se afasta das medidas epidemiológicas caracterizadas como razão de proporções.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

OBJETIVO: Desenvolver e comparar dois modelos matemáticos, um deles baseado em regressão logística e o outro em teoria de conjuntos fuzzy, para definir a indicação para a realização do exame cintilográfico a partir de resultados dos exames laboratoriais. MÉTODOS: Foram identificados 194 pacientes que tiveram cálcio e paratormônio séricos medidos a partir da base de registros de cintilografia de paratiróides realizadas em laboratório de diagnóstico de São Paulo, no período de janeiro de 2000 a dezembro de 2004. O modelo de regressão logística foi desenvolvido utilizando-se o software SPSS e o modelo fuzzy, o Matlab. A performance dos modelos foi comparada utilizando-se curvas ROC. RESULTADOS: Os modelos apresentaram diferenças estatisticamente significantes (p=0,026) nos seus desempenhos. A área sob a curva ROC do modelo de regressão logística foi de 0,862 (IC 95%: 0,811-0,913) e do modelo de lógica fuzzy foi 0,887 (IC 95%: 0,840-0,933). Este último destacou-se como particularmente útil porque, ao contrário do modelo logístico, mostrou capacidade de utilizar informações de paratormônio em intervalo em que os valores de cálcio mostraram-se pouco discriminantes. CONCLUSÕES: O modelo matemático baseado em teoria de conjuntos fuzzy pareceu ser mais adequado do que o baseado em regressão logística como método para decisão da realização de cintilografia das paratiróides. Todavia, sendo resultado de um exercício metodológico, inferências sobre o comportamento do objeto podem ser impróprias, dada a não representatividade populacional dos dados.