930 resultados para Modelos de regressão aleatória
Resumo:
Os principais desafios relacionados ao problema de classificação de enzimas em banco de dados de estruturas de proteínas são: 1) o ruído presente nos dados; 2) o grande número de variáveis; 3) o número não-balanceado de membros por classe. Para abordar esses desafios, apresenta-se uma metodologia para seleção de parâmetros, que combina recursos de matemática (ex: Transformada Discreta do Cosseno) e da estatística (ex:.g., correlação de variáveis e amostragem com reposição). A metodologia foi validada considerando-se os três principais métodos de classificação da literatura, a saber; árvore de decisão, classificação Bayesiana e redes neurais. Os experimentos demonstram que essa metodologia é simples, eficiente e alcança resultados semelhantes àqueles obtidos pelas principais técnicas para seleção de parâmetros na literatura.Termos para indexação classificação de enzimas,predição de função de proteínas, estruturas de proteínas, banco de dados de proteínas, seleção de parâmetros, métodos para classsificação de dados.
Resumo:
O objetivo deste trabalho é validar modelos geoestatísticos aplicados a agroclimatologia através do teste de normalidade de Filliben em resíduos ortonormais com dados de precipitação média anual para o Estado de São Paulo.
Resumo:
Considerações básicas: A amostragem; A confecção de grades; O produto. Esquema do processo do modelo numérico de terreno do Spring.
Resumo:
Objetivos da construção de modelos matemáticos para cana-de-açúcar. Modelo, definição e classificaçào. Metodologia da modelagem matemática. Modelos matemáticos e software de simulação descritos para a cana-de açúcar.
Resumo:
O objetivo deste trabalho é apresentar os índices de desempenho mais utilizados e o critério de informação de Akaike, que contribuem para a escolha do melhor modelo matemático para a representação de estudos espaciais.
Resumo:
A presente publicação descreve alguns modelos capazes de simular o comportamento e o destino de agrotóxicos e outros contaminantes, e destaca como esses modelos podem ser mais efetivos quando agrega-se, a eles, a capacidade de lidar com a dimensão espacial.
Resumo:
Tese de Doutoramento apresentada à Universidade Fernando Pessoa como parte dos requisitos para obtenção do grau de Doutror em Ciências da Terra.
Resumo:
34 hojas : ilustraciones, fotografías
Resumo:
17 fotografías, dieciséis en tono de grises.
Resumo:
24 fotografías a color.
Resumo:
Históricamente, los modelos de no-ejercicio para predecir el consumo máximo de oxígeno (VO2max) han sido construidos mediante regresión lineal frecuentista, usando técnicas estándar de selección de modelos. Sin embargo, existe incertidumbre acerca de la estructura estadística en el proceso de selección del modelo. En este estudio se propuso construir un modelo de no-ejercicio para predecir el VO2max en deportistas orientados al rendimiento, considerando la incertidumbre de modelo a través del Promedio Bayesiano de Modelos (BMA). Un objetivo adicional fue comparar la performance predictiva del BMA con las de los modelos derivados de varias técnicas frecuentistas usuales de selección de variables. Con tal fin, se implementó un submuestreo aleatorio estratificado repetido. Los datos incluyeron observaciones de la variable respuesta (en L·min-1), así como registros de Género, Deporte, Edad, Peso, Talla e Índice de masa corporal (BMI) (Edad = 22.1 ± 4.9 años, media ± SD; n = 272). Se propuso una clasificación de deportes con el objetivo de incluirla dentro del proceso de construcción del modelo: Combate, Juego, Resistencia 1 y Resistencia 2. El enfoque BMA se implementó en base a dos métodos: Occam's window y Composición de Modelo mediante el método de Monte Carlo con Cadenas de Markov (MC²). Se observaron discrepancias en la selección de variables entre los procedimientos frecuentistas. Ambos métodos de BMA produjeron resultados muy similares. Los modelos que incluyeron Género y las variables dummies para Resistencia 1 y Resistencia 2 acumularon virtualmente toda la probabilidad de modelo a posteriori. El Peso fue el predictor continuo con la más alta probabilidad de inclusión a posteriori (menor a 0.8). Las combinaciones de variables que involucraron predictores con un alto nivel de multicolinealidad fueron desacreditadas. Los modelos con sustancial contribución para el BMA presentaron un ajuste apreciable (R² ajustado menor a 0.8). Entre los modelos seleccionados por estrategias frecuentistas, el obtenido mediante el método de regresión por pasos (Stepwise regression method) con alfa igual a 0.05 fue el más respaldado por los datos, en términos de probabilidad de modelo a posteriori. En concordancia con la literatura, el BMA tuvo mejor performance predictiva de los datos fuera de la muestra que los modelos seleccionados por técnicas frecuentistas, medida por la cobertura del intervalo de predicción de 90 por ciento. La clasificación de deportes reveló resultados consistentes.
Resumo:
Los modelos 'modelos animales con efectos maternos' (MAM) son modelos lineales mixtos que se utilizan para ajustar registros de caracteres bajo la influencia de efectos maternos. Uno de los desafíos más importantes en el marco de los MAM es la estimación de los parámetros de dispersión o 'componentes de (co) varianza' (CVC). En esta tesis se introducen desde una perspectiva bayesiana contribuciones teóricas y metodológicas con relación a la estimación de CVC para MAM sujetos a estructuras de covarianza novedosas. En primer lugar, se describe una implementación del análisis bayesiano jerárquico vía el algoritmo del muestreo de Gibbs. Luego, se considera una especificación conjugada diferente para la distribución a priori de la matriz de covarianza genética, basada en la distribución Wishart invertida generalizada, y se presenta una estrategia para determinar los correspondientes hiperparámetros. Esta estrategia fue comparada contra otras especificaciones a priori mediante un estudio de simulación estocástica, y produjo estimaciones precisas de los parámetros genéticos, con menores errores estándares y mejor tasa de convergencia. En segundo lugar, se presenta una formulación alternativa del MAM que incluye un parámetro de correlación ambiental entre pares de observaciones madre-progenie, y se desarrolla un procedimiento de estimación basado en un algoritmo de muestreo por grilla. El procedimiento fue programado y ejecutado exitosamente, y se obtuvo la primera estimación del parámetro de correlación con datos de campo para peso al destete en bovinos de carne. Por último, se considera el problema de la estimación de CVC en una población multirracial, donde en general es necesario especificar una estructura de covarianza heterogénea para los valores de cría. En particular, se demuestra que el modelo basado en la descomposición de la matriz de covarianza genética es equivalente al que deriva de la teoría genética cuantitativa. Además, se extiende el modelo para incluir efectos maternos y se describe la implementación de un análisis bayesiano jerárquico con el objetivo de estimar los CVC. El procedimiento fue implementado con éxito en datos experimentales de peso al destete y se obtuvieron por primera vez estimaciones para el conjunto completo de CVC.
Resumo:
La evaluación genética para caracteres de crecimiento pre - destete requiere ajustar modelos animales con efectos maternos (MAM). Tanto la estimación paramétrica de la variabilidad como la evaluación genética mediante MAM son realizadas empleando datos de campo, muchos de los cuales no poseen información completa para todas las variables explicativas maternas. Es común no contar con la identificación de madres (biológicas y/o receptoras), de abuelas maternas y, consecuentemente, de la edad de la madre (EM). Este problema es bien marcado en razas compuestas como Brangus y Braford que tienen políticas para registrar animales de pedigrí "abierto". Además, no existe un consenso sobre cuál es el mejor modelo de predicción, y existen interrogantes sobre la magnitud de los componentes de (co) varianza genético-aditivos y ambientales del modelo de evaluación. La primera investigación de esta tesis consistió en la estimación, mediante métodos bayesianos de los parámetros de dispersión en MAMs con distintas estructuras de (co) varianza, para datos de peso al destete de animales Angus de pedigrí. El análisis se caracterizó por la originalidad en los muestreos de las distribuciones marginales posteriores de las covarianzas genéticas aditivas y de la correlación entre los efectos ambientales maternos permanentes de una vaca y sus hijas también madres. Con el objeto de especificar correctamente la fracción aditiva de las (co) varianzas cuando se desconocen las madres y/o abuelas maternas de los animales con datos, en otro capítulo se desarrollaron MAMs equivalentes que no requieren alargar los vectores de los valores de cría con madres o abuelas fantasmas. Finalmente, se desarrolló un modelo mixto que atenúa el sesgo por error de medición clásico en el efecto EM, e introduce splines penalizadas y una estructura de (co) variación autoregresiva de orden 1 para suavizar las covarianzas residuales Este modelo es apropiado para ajustar datos de animales nacidos por transplante embrionario con madres receptoras desconocidas
Resumo:
La Pampa Arenosa ha sido escenario de cambios en el uso del territorio que respondieron principalmente al aumento de las precipitaciones a partir de la década del 70. La evaluación de las tierras es una etapa crítica en la planificación del uso sustentable. Por este motivo, se analizaron distintos sistemas de evaluación de tierras y se desarrollaron modelos expertos que consideren los factores ambientales heredados y las variaciones climáticas, para el sector de dunas longitudinales de la Pampa Arenosa en la Provincia de Buenos Aires, a escala 1: 50.000, considerando a los partidos de Nueve de Julio, Carlos Casares, Pehuajó y Trenque Lauquen. Las tierras fueron clasificadas por Capacidad de Uso, Indice de Productividad (IP) y se generaron sistemas expertos, utilizando el programa ALES, para los tipos de utilización de las tierras (TUTs) : maíz, soja y trigo. La homogeneidad de las series climáticas de precipitaciones se determinó mediante el test de Rachas. La aplicación del test de Pettitt permitió identificar la existencia de un cambio abrupto en las precipitaciones y el este de Mann Kendall mostró una tendencia creciente en relación a la precipitación anual. Las tierras con severas (clase III) y muy severas limitaciones (clase IV), fueron las más frecuentes ocupando el 42,6 por ciento y 29,8 por ciento respectivamente del área. Se comprobó que el IP de las tierras se incrementó con el aumento de las precipitaciones, alcanzando su máxima expresión climática en el período posterior al cambio abrupto. Las tierras de moderada capacidad productiva con valores de IP entre 65-51 ocuparon la mayor superficie de área de estudio. Los modelos expertos según los TUTs presentaron una aptitud de uso de las tierras variable, condicionada por la capacidad de retención hídrica de los suelos. Los modelos expertos fueron sensibles a las variaciones climáticas y el cambio abrupto en las precipitaciones.
Resumo:
La productividad primaria neta aérea (PPNA) y la biomasa y la calidad forrajeras son clave en los sistemas pastoriles. Dada su variación espacial y temporal, contar con descripciones de dicha variación y con herramientas de monitorización facilita y perfecciona su manejo. Los sensores remotos permiten estimar frecuente y detalladamente la PPNA pero no la biomasa y la calidad. El objetivo de esta tesis es mejorar el conocimiento sobre la PPNA y las posibilidades de monitorización de los recursos forrajeros en general y los de la Pampa Deprimida en particular. Primero, se presentan patrones de variación de la PPNA de los principales recursos forrajeros y modelos de prospección de la PPNA primaveral para distintas unidades de vegetación. Segundo, se presentan modelos de estimación de la biomasa y calidad forrajera basados en sensores remotos y generados mediante ensayos en condiciones controladas y a campo. La variación espacial de la PPNA fue explicada por la precipitación a escala regional, los suelos a escala subregional y los suelos y el pastoreo a escala local. Entre recursos, las pasturas de loma tuvieron mayor PPNA que los pastizales de bajo; dicha diferencia aumentó con la precipitación media. Entre escalas, la variación espacial fue mayor a escala regional y la temporal fue mayor a escala local. La PPNA primaveral se relacionó con variables ambientales de meses previos diferentes según los pastizales estuvieran dominados por especies invernales o estivales, y según las pasturas fueran de suelos profundos o someros. Las estimaciones de la biomasa y calidad forrajera fueron satisfactorias en general, aunque imprecisas bajo ciertas condiciones experimentales como sequía, fertilización, y presencia de biomasa senescente, que requirieron modelos específicos. La estimación de la biomasa total a campo mediante un modelo basado en estimaciones independientes de la biomasa fotosintética y la no fotosintética resultó precisa a lo largo de un año. Los resultados aportan información acerca de los controles ambientales de la PPNA en pastizales subhúmedos y representan un avance en la estimación de la biomasa y calidad forrajera mediante sensores remotos