5 resultados para LASSO Bayesiano

em FAUBA DIGITAL: Repositorio institucional científico y académico de la Facultad de Agronomia de la Universidad de Buenos Aires


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Históricamente, los modelos de no-ejercicio para predecir el consumo máximo de oxígeno (VO2max) han sido construidos mediante regresión lineal frecuentista, usando técnicas estándar de selección de modelos. Sin embargo, existe incertidumbre acerca de la estructura estadística en el proceso de selección del modelo. En este estudio se propuso construir un modelo de no-ejercicio para predecir el VO2max en deportistas orientados al rendimiento, considerando la incertidumbre de modelo a través del Promedio Bayesiano de Modelos (BMA). Un objetivo adicional fue comparar la performance predictiva del BMA con las de los modelos derivados de varias técnicas frecuentistas usuales de selección de variables. Con tal fin, se implementó un submuestreo aleatorio estratificado repetido. Los datos incluyeron observaciones de la variable respuesta (en L·min-1), así como registros de Género, Deporte, Edad, Peso, Talla e Índice de masa corporal (BMI) (Edad = 22.1 ± 4.9 años, media ± SD; n = 272). Se propuso una clasificación de deportes con el objetivo de incluirla dentro del proceso de construcción del modelo: Combate, Juego, Resistencia 1 y Resistencia 2. El enfoque BMA se implementó en base a dos métodos: Occam's window y Composición de Modelo mediante el método de Monte Carlo con Cadenas de Markov (MC²). Se observaron discrepancias en la selección de variables entre los procedimientos frecuentistas. Ambos métodos de BMA produjeron resultados muy similares. Los modelos que incluyeron Género y las variables dummies para Resistencia 1 y Resistencia 2 acumularon virtualmente toda la probabilidad de modelo a posteriori. El Peso fue el predictor continuo con la más alta probabilidad de inclusión a posteriori (menor a 0.8). Las combinaciones de variables que involucraron predictores con un alto nivel de multicolinealidad fueron desacreditadas. Los modelos con sustancial contribución para el BMA presentaron un ajuste apreciable (R² ajustado menor a 0.8). Entre los modelos seleccionados por estrategias frecuentistas, el obtenido mediante el método de regresión por pasos (Stepwise regression method) con alfa igual a 0.05 fue el más respaldado por los datos, en términos de probabilidad de modelo a posteriori. En concordancia con la literatura, el BMA tuvo mejor performance predictiva de los datos fuera de la muestra que los modelos seleccionados por técnicas frecuentistas, medida por la cobertura del intervalo de predicción de 90 por ciento. La clasificación de deportes reveló resultados consistentes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Los modelos 'modelos animales con efectos maternos' (MAM) son modelos lineales mixtos que se utilizan para ajustar registros de caracteres bajo la influencia de efectos maternos. Uno de los desafíos más importantes en el marco de los MAM es la estimación de los parámetros de dispersión o 'componentes de (co) varianza' (CVC). En esta tesis se introducen desde una perspectiva bayesiana contribuciones teóricas y metodológicas con relación a la estimación de CVC para MAM sujetos a estructuras de covarianza novedosas. En primer lugar, se describe una implementación del análisis bayesiano jerárquico vía el algoritmo del muestreo de Gibbs. Luego, se considera una especificación conjugada diferente para la distribución a priori de la matriz de covarianza genética, basada en la distribución Wishart invertida generalizada, y se presenta una estrategia para determinar los correspondientes hiperparámetros. Esta estrategia fue comparada contra otras especificaciones a priori mediante un estudio de simulación estocástica, y produjo estimaciones precisas de los parámetros genéticos, con menores errores estándares y mejor tasa de convergencia. En segundo lugar, se presenta una formulación alternativa del MAM que incluye un parámetro de correlación ambiental entre pares de observaciones madre-progenie, y se desarrolla un procedimiento de estimación basado en un algoritmo de muestreo por grilla. El procedimiento fue programado y ejecutado exitosamente, y se obtuvo la primera estimación del parámetro de correlación con datos de campo para peso al destete en bovinos de carne. Por último, se considera el problema de la estimación de CVC en una población multirracial, donde en general es necesario especificar una estructura de covarianza heterogénea para los valores de cría. En particular, se demuestra que el modelo basado en la descomposición de la matriz de covarianza genética es equivalente al que deriva de la teoría genética cuantitativa. Además, se extiende el modelo para incluir efectos maternos y se describe la implementación de un análisis bayesiano jerárquico con el objetivo de estimar los CVC. El procedimiento fue implementado con éxito en datos experimentales de peso al destete y se obtuvieron por primera vez estimaciones para el conjunto completo de CVC.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Los modelos 'modelos animales con efectos maternos' (MAM)son modelos lineales mixtos que se utilizan para ajustar registros de caracteres bajo la influencia de efectos maternos. Uno de los desafíos más importantes en el marco de los MAM es la estimación de los parámetros de dispersión o 'componentes de (co)varianza' (CVC). En esta tesis se introducen desde una perspectiva bayesiana contribuciones teóricas y metodológicas con relación a la estimación de CVC para MAM sujetos a estructuras de covarianza novedosas. En primer lugar, se describe una implementación del análisis bayesiano jerárquico vía el algoritmo del muestreo de Gibbs. Luego, se considera una especificación conjugada diferente para la distribución a priori de la matriz de covarianza genética, basada en la distribución Wishart invertida generalizada, y se presenta una estrategia para determinar los correspondientes hiperparámetros. Esta estrategia fue comparada contra otras especificaciones a priori mediante un estudio de simulación estocástica, y produjo estimaciones precisas de los parámetros genéticos, con menores errores estándares y mejor tasa de convergencia. En segundo lugar, se presenta una formulación alternativa del MAM que incluye un parámetro de correlación ambiental entre pares de observaciones madre-progenie, y se desarrolla un procedimiento de estimación basado en un algoritmo de muestreo por grilla. El procedimiento fue programado y ejecutado exitosamente, y se obtuvo la primera estimación del parámetro de correlación con datos de campo para peso al destete en bovinos de carne. Por último, se considera el problema de la estimación de CVC en una población multirracial, donde en general es necesario especificar una estructura de covarianza heterogénea para los valores de cría. En particular, se demuestra que el modelo basado en la descomposición de la matriz de covarianza genética es equivalente al que deriva de la teoría genética cuantitativa. Además, se extiende el modelo para incluir efectos maternos y se describe la implementación de un análisis bayesiano jerárquico con el objetivo de estimar los CVC. El procedimiento fue implementado con éxito en datos experimentales de peso al destete y se obtuvieron por primera vez estimaciones para el conjunto completo de CVC.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La estimación de parámetros genéticos en bovinos lecheros requiere ajustar modelos estadísticos para datos longitudinales (modelos de regresión aleatoria y/o medidas repetidas). Es esencial en regresión aleatoria determinar el orden correcto de los polinomios que describen los coeficientes aleatorios en el tiempo. Tradicionalmente, esta tarea se desarrolló empleando criterios de selección como AIC o BIC, que no siempre logran dilucidar claramente el modelo apropiado. Esta tesis introduce el criterio PAL para la selección del orden del polinomio en modelos de regresión aleatoria, empleando una penalización adaptativa de la función de verosimilitud. Comparativamente, PAL presentó un desempeño superior a AIC y BIC, y su aplicación a datos de producción produjo un modelo parsimonioso, con buena bondad de ajuste y habilidad de predicción. Se abordó además el problema de estimar parámetros genéticos bajo un modelo de medidas repetidas para caracteres que muestran distribución asimétrica. Para evitar desvíos del supuesto de normalidad de los errores, se presentó un modelo alternativo basado en asumir una distribución Normal asimétrica. Se implementó un enfoque bayesiano con muestreo de Gibbs en datos de intervalos entre partos. Incluyendo un parámetro adicional, se obtuvieron estimaciones más precisas de los parámetros genéticos. Estos desarrollos metodológicos estuvieron motivados por los desafíos que enfrenta actualmente el programa de mejoramiento genético de la raza Holstein en Colombia. Entre ellos, figura también el impacto de introducir toros extranjeros provenientes del programa de selección genómica norteamericana. En este marco, se estimó el progreso genético esperado en la población comercial colombiana. Los cálculos reflejaron que utilizar toros genómicos jóvenes se traducirá en una respuesta genética acelerada y en una disminución de la diferencia genética entre el hato comercial y el núcleo del cual provienen.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La estimación de parámetros genéticos en bovinos lecheros requiere ajustar modelos estadísticos para datos longitudinales (modelos de regresión aleatoria y/o medidas repetidas). Es esencial en regresión aleatoria determinar el orden correcto de los polinomios que describen los coeficientes aleatorios en el tiempo. Tradicionalmente, esta tarea se desarrolló empleando criterios de selección como AIC o BIC, que no siempre logran dilucidar claramente el modelo apropiado. Esta tesis introduce el criterio PAL para la selección del orden del polinomio en modelos de regresión aleatoria, empleando una penalización adaptativa de la función de verosimilitud. Comparativamente, PAL presentó un desempeño superior a AIC y BIC, y su aplicación a datos de producción produjo un modelo parsimonioso, con buena bondad de ajuste y habilidad de predicción. Se abordó además el problema de estimar parámetros genéticos bajo un modelo de medidas repetidas para caracteres que muestran distribución asimétrica. Para evitar desvíos del supuesto de normalidad de los errores, se presentó un modelo alternativo basado en asumir una distribución Normal asimétrica. Se implementó un enfoque bayesiano con muestreo de Gibbs en datos de intervalos entre partos. Incluyendo un parámetro adicional, se obtuvieron estimaciones más precisas de los parámetros genéticos. Estos desarrollos metodológicos estuvieron motivados por los desafíos que enfrenta actualmente el programa de mejoramiento genético de la raza Holstein en Colombia. Entre ellos, figura también el impacto de introducir toros extranjeros provenientes del programa de selección genómica norteamericana. En este marco, se estimó el progreso genético esperado en la población comercial colombiana. Los cálculos reflejaron que utilizar toros genómicos jóvenes se traducirá en una respuesta genética acelerada y en una disminución de la diferencia genética entre el hato comercial y el núcleo del cual provienen.