1000 resultados para Seleção de variáveis
Resumo:
O objetivo deste trabalho foi selecionar as variáveis de manejo do camarão marinho Litopenaeus vannamei que mais influenciaram nas variáveis-respostas ao cultivo (produção, produtividade, peso final e taxa de sobrevivência), em modelos matemáticos. O banco de dados foi composto por 83 cultivos, realizados no período de 2003 a 2005, obtidos de uma fazenda comercial localizada no litoral sul de Pernambuco. Para estimar os parâmetros dos modelos, utilizou-se a técnica dos mínimos quadrados. A seleção das variáveis foi realizada com o processo "backward elimination" associado ao método de transformação de Box e Cox. A adequação das equações e os pressupostos de normalidade e homocedasticidade, para os erros, foram analisadas com base na análise de variância e análise de resíduo. É possível relacionar essas variáveis e estabelecer predições com as equações.
Resumo:
Genetic algorithm was used for variable selection in simultaneous determination of mixtures of glucose, maltose and fructose by mid infrared spectroscopy. Different models, using partial least squares (PLS) and multiple linear regression (MLR) with and without data pre-processing, were used. Based on the results obtained, it was verified that a simpler model (multiple linear regression with variable selection by genetic algorithm) produces results comparable to more complex methods (partial least squares). The relative errors obtained for the best model was around 3% for the sugar determination, which is acceptable for this kind of determination.
Resumo:
This paper describes an experimental design technique, known as variables search, developed to expose the critical variables and screen out the irrelevant ones. It is easy to learn and use and clearly dissociates the main and interactions effects from each other. An example of air separation process by pressure swing adsorption was used to demonstrate how the variables search technique works. The phases of identification of the critical variables is shown, step by step,.
Resumo:
The process of building mathematical models in quantitative structure-activity relationship (QSAR) studies is generally limited by the size of the dataset used to select variables from. For huge datasets, the task of selecting a given number of variables that produces the best linear model can be enormous, if not unfeasible. In this case, some methods can be used to separate good parameter combinations from the bad ones. In this paper three methodologies are analyzed: systematic search, genetic algorithm and chemometric methods. These methods have been exposed and discussed through practical examples.
Resumo:
Pós-graduação em Engenharia Elétrica - FEIS
Resumo:
Trata do problema da seleção de Sistemas Integrados, ou ERP (Enterprise Resource Systems), investigando o processo especificamente sob o ponto de vista da Análise de Decisões. Procura analisar a associação entre a satisfação tanto com o Sistema Integrado selecionado quanto com a forma em que foi estruturado o próprio processo de seleção, com variáveis especificamente selecionadas para tal, representativas, entre outros, de grupos de critérios de decisão e características específicas do processo de seleção, relacionadas, estas últimas, a questões como o tratamento dado ao fator risco e ao possível caráter coletivo da decisão. Questiona a possibilidade de modelagem do processo de seleção de Sistemas Integrados, a partir da proposta normativa oferecida pela Teoria da Utilidade, e da suposta existência de um gap ou distância entre esta proposta e a prática naquele processo de seleção. Propõe um modelo mental genérico que procura explicar o modo como os agentes decisórios abordam o problema de seleção de sistemas integrados. Apresenta e propõe um modelo dinâmico que justificaria a existência do gap acima mencionado a partir da incapacidade do modelo mental genérico em apreender toda a complexidade inerente ao problema de seleção de sistemas integrados.
Resumo:
Este estudo tem como objetivo geral identificar no conjunto de medidas e testes do Projeto Esporte Brasil (PROESP-BR) indicadores de desempenho esportivo que permitam desenvolver parâmetros e metodologias para a detecção de possíveis talentos esportivos para o handebol, para o voleibol e para o basquetebol. A amostra é composta de 313 jovens indivíduos, estratificados conforme o nível de rendimento esportivo (atletas ou escolares), modalidade esportiva e sexo. O procedimento estatístico utilizado foi a Análise da Função Discriminante. Na comparação entre atletas e escolares, foram encontradas diferenças estatisticamente significativas em todos os indicadores, com exceção da variável flexibilidade nas comparações: entre basquetebolistas e escolares do sexo masculino, e handebolistas e escolares do sexo masculino. Os indicadores de seleção estabeleceram-se da seguinte maneira: no Basquete Masculino, destacaram-se como indicadores de seleção, as variáveis: força explosiva de membros superiores, massa corporal, envergadura, estatura, força explosiva de membros inferiores, velocidade e agilidade; no Basquete Feminino: força explosiva de membros superiores, força explosiva de membros inferiores, velocidade, agilidade, envergadura, estatura e força-resistência abdominal; no Handebol Masculino: força explosiva de membros superiores, velocidade, força explosiva de membros inferiores, agilidade, massa corporal, estatura e envergadura; no Handebol Feminino: força explosiva de membros inferiores, velocidade, agilidade, força explosiva de membros superiores e envergadura; no Voleibol Masculino: força explosiva de membros superiores, força explosiva de membros inferiores, massa corporal, envergadura, estatura, velocidade e agilidade; e no Voleibol Feminino: força explosiva de membros inferiores, agilidade, envergadura, estatura, força explosiva de membros superiores, velocidade, força-resistência abdominal e massa corporal. O conjunto de indicadores do PROESP-BR apresentou um grande poder discriminatório entre jovens escolares e jovens atletas, classificando os casos com grande precisão e com altos percentuais de acerto. Foram encontrados 3 jovens escolares com perfil de atletas de handebol (1 do sexo masculino e 2 dos sexo feminino).
Resumo:
The aim of this study was to evaluate the potential of near-infrared reflectance spectroscopy (NIRS) as a rapid and non-destructive method to determine the soluble solid content (SSC), pH and titratable acidity of intact plums. Samples of plum with a total solids content ranging from 5.7 to 15%, pH from 2.72 to 3.84 and titratable acidity from 0.88 a 3.6% were collected from supermarkets in Natal-Brazil, and NIR spectra were acquired in the 714 2500 nm range. A comparison of several multivariate calibration techniques with respect to several pre-processing data and variable selection algorithms, such as interval Partial Least Squares (iPLS), genetic algorithm (GA), successive projections algorithm (SPA) and ordered predictors selection (OPS), was performed. Validation models for SSC, pH and titratable acidity had a coefficient of correlation (R) of 0.95 0.90 and 0.80, as well as a root mean square error of prediction (RMSEP) of 0.45ºBrix, 0.07 and 0.40%, respectively. From these results, it can be concluded that NIR spectroscopy can be used as a non-destructive alternative for measuring the SSC, pH and titratable acidity in plums
Quantificação de açúcares com uma língua eletrónica: calibração multivariada com seleção de sensores
Resumo:
Este trabalho incide na análise dos açúcares majoritários nos alimentos (glucose, frutose e sacarose) com uma língua eletrónica potenciométrica através de calibração multivariada com seleção de sensores. A análise destes compostos permite contribuir para a avaliação do impacto dos açúcares na saúde e seu efeito fisiológico, além de permitir relacionar atributos sensoriais e atuar no controlo de qualidade e autenticidade dos alimentos. Embora existam diversas metodologias analíticas usadas rotineiramente na identificação e quantificação dos açúcares nos alimentos, em geral, estes métodos apresentam diversas desvantagens, tais como lentidão das análises, consumo elevado de reagentes químicos e necessidade de pré-tratamentos destrutivos das amostras. Por isso se decidiu aplicar uma língua eletrónica potenciométrica, construída com sensores poliméricos selecionados considerando as sensibilidades aos açucares obtidas em trabalhos anteriores, na análise dos açúcares nos alimentos, visando estabelecer uma metodologia analítica e procedimentos matemáticos para quantificação destes compostos. Para este propósito foram realizadas análises em soluções padrão de misturas ternárias dos açúcares em diferentes níveis de concentração e em soluções de dissoluções de amostras de mel, que foram previamente analisadas em HPLC para se determinar as concentrações de referência dos açúcares. Foi então feita uma análise exploratória dos dados visando-se remover sensores ou observações discordantes através da realização de uma análise de componentes principais. Em seguida, foram construídos modelos de regressão linear múltipla com seleção de variáveis usando o algoritmo stepwise e foi verificado que embora fosse possível estabelecer uma boa relação entre as respostas dos sensores e as concentrações dos açúcares, os modelos não apresentavam desempenho de previsão satisfatório em dados de grupo de teste. Dessa forma, visando contornar este problema, novas abordagens foram testadas através da construção e otimização dos parâmetros de um algoritmo genético para seleção de variáveis que pudesse ser aplicado às diversas ferramentas de regressão, entre elas a regressão pelo método dos mínimos quadrados parciais. Foram obtidos bons resultados de previsão para os modelos obtidos com o método dos mínimos quadrados parciais aliado ao algoritmo genético, tanto para as soluções padrão quanto para as soluções de mel, com R²ajustado acima de 0,99 e RMSE inferior a 0,5 obtidos da relação linear entre os valores previstos e experimentais usando dados dos grupos de teste. O sistema de multi-sensores construído se mostrou uma ferramenta adequada para a análise dos iii açúcares, quando presentes em concentrações maioritárias, e alternativa a métodos instrumentais de referência, como o HPLC, por reduzir o tempo da análise e o valor monetário da análise, bem como, ter um preparo mínimo das amostras e eliminar produtos finais poluentes.
Resumo:
OBJETIVOS: Identificar e medir a magnitude do risco de desnutrição associada a fatores determinantes da capacidade materna de cuidado infantil: estrutura familiar, escolaridade, trabalho, saúde física e saúde mental maternas. MÉTODOS: Delineou-se um estudo de casos e controles. Foram selecionados 101 casos (crianças com peso/idade abaixo do percentil 5) e 200 controles (crianças com peso/idade acima do percentil 25) mediante inquéritos antropométricos realizados durante três "Dias Nacionais de Vacinação", em 1996 e 1997. Os dados foram obtidos em entrevistas realizadas nos domicílios com as mães das crianças. Para detectar o efeito-líquido de cada fator em estudo, realizou-se análise de regressão logística multivariada e hierarquizada. Tais fatores e as possíveis variáveis de controle foram agrupados em blocos, ordenados segundo a precedência com que influiriam sobre o estado nutricional infantil. Adotaram-se p<0,20 para seleção das variáveis de controle (mediante análise univariada) e p<0,05 para identificação de associação estatisticamente significativa entre fatores de estudo e desnutrição infantil. RESULTADOS: Foram identificados como fatores de risco de desnutrição: (a) estrutura familiar adversa indicada pela ausência de companheiro ("odds ratio" [OR] = 2,2; IC95%, 1,1-4,5); (b) internação materna durante a gravidez (OR=3,5; IC95%, 1,6-7,7); (c) precária saúde mental materna expressa pela presença de três a quatro sintomas de depressão (OR=3,1; IC95%, 0,9-10,3); (d) fatores de estresse familiar, no caso, indícios de alcoolismo em pelo menos um membro da família (OR=2,1; IC95%, 1,2-3,9). A idade da criança no início/retorno da mãe ao trabalho também se associou de modo independente à presença de desnutrição, porém os efeitos variaram: retorno precoce (criança com menos de quatro meses) não significou risco ou proteção; volta da mãe ao trabalho quando a criança tinha entre quatro meses e 12 meses constituiu fator de proteção. CONCLUSÕES: Evidenciou-se que fatores potencialmente definidores da capacidade materna de cuidado exercem efeito independente sobre o estado nutricional infantil.
Resumo:
OBJETIVO: Analisar os fatores associados ao uso de substâncias estimulantes por caminhoneiros para se manterem acordados. MÉTODOS: Survey com 854 motoristas em oito locais de concentração de caminhoneiros (sete postos de gasolina e um posto aduaneiro em região de fronteira) em cinco municípios do Rio Grande do Sul, em 2006. O desfecho "uso de rebite" foi categorizado em "sim" ou "não". Foi realizada análise de regressão de Poisson com variância robusta para a seleção de variáveis do modelo, que foi composto por níveis socioeconômicos, demográficos, de informações sobre a profissão e sobre o consumo de álcool. RESULTADOS: O consumo de rebite para se manter acordado foi declarado por 12,4% dos caminhoneiros de forma isolada ou em combinação com outras substâncias (café, guaraná em pó, energéticos, cocaína aspirada). O rebite foi a substância mais citada por aqueles que consumiam algo para ficar acordados. A ingestão de bebidas alcoólicas foi prática de mais de 70% dos entrevistados, dos quais 45,1% relataram consumo pelo menos uma vez por semana. O uso de rebite esteve associado às faixas etárias mais jovens, ao aumento da renda, à maior duração das viagens e ao consumo de álcool. DISCUSSÃO: O aumento da remuneração dos caminhoneiros implica aumento da carga de trabalho. Isso produz desgaste físico e emocional, levando-os a buscar solução temporária no consumo de substâncias estimulantes. A redução do consumo abusivo de álcool e do uso ilícito de substâncias como anfetaminas por motoristas profissionais depende não só de políticas voltadas para a prevenção e tratamento de drogas, mas de políticas intersetoriais articuladas que garantam melhores condições de trabalho e de saúde aos caminhoneiros.
Resumo:
As redes neuronais artificiais (RNA) têm sido apontadas como uma boa ferramenta de gestão da digestão anaeróbia, e o presente trabalho procurou explorar as funcionalidades de um aplicativo informático de criação de RNA, analisando a sua capacidade para modelar e otimizar os processos anaeróbios. O trabalho inseriu-se num estudo mais amplo, desenvolvido pelo grupo Águas de Portugal, no qual se pretendeu obter uma visão mais alargada e robusta da aplicabilidade deste tipo de ferramentas em digestores anaeróbios de diferentes instalações. O caso de estudo foi a ETAR do Seixal, pertencente à SIMARSUL, e o software utilizado foi o NeuralTools®. O desenvolvimento do estudo iniciou-se com a preparação dos dados referentes à ETAR do Seixal, tendo-se considerado esta como sendo a etapa determinante. A partir da caracterização das variáveis e de uma análise de correlações entre elas, foi possível selecionar 20 variáveis a integrar nos ensaios de treino e de teste, cujos principais objetivos se prenderam com a identificação da RNA com maior capacidade para prever o biogás produzido e a seleção das variáveis mais adequadas para a modelação dos processos anaeróbios. O treino e teste de redes envolveu a realização de 266 ensaios, a partir dos quais se identificaram as cinco melhores redes para previsão. A melhor RNA foi criada a partir dos dados de tempo de retenção hidráulico, pH, temperatura, ácidos gordos voláteis e alcalinidade total do digestor, e permitiu obter boas previsões do biogás produzido. Os resultados alcançados com esta rede ficaram, contudo, aquém dos valores de referência de uma previsão considerada “muito boa” e o reduzido número de casos usados para treinar a rede afigura-se como a principal causa. A escassez de dados constituiu, de resto, a principal limitação ao longo do estudo, permitindo realçar a importância da monitorização na gestão da digestão anaeróbia.
Resumo:
Uma das propriedades físicas importantes para o manejo e estudo da qualidade física dos solos é sua resistência à penetração, uma vez que esta propriedade se apresenta relacionada a diversos atributos do solo indicadores do grau de compactação. O objetivo deste trabalho foi estimar a resistência mecânica do solo à penetração de um Latossolo Vermelho eutroférrico sob cultura perene, em três condições de umidade gravimétrica, a partir da densidade, umidade, teor de argila (Arg) e matéria orgânica do solo. A resistência mecânica do solo à penetração foi avaliada mediante o uso do penetrômetro de impacto, e os dados obtidos em impactos dm-1 foram convertidos em resistência dinâmica (MPa). No momento da determinação da resistência mecânica do solo, foram coletadas 30 amostras por profundidade: 0-0,10; 0,1-0,3; 0,3-0,5 m, para determinação de três diferentes teores de umidade gravimétrica (Ug) (Ug1 < 0,20 kg kg-1 , 0,20 < Ug2 < 0,30 kg kg-1 e Ug3 > 0,30 kg kg-1 ), composição granulométrica, teor de matéria orgânica (MO) e densidade do solo (Ds). Foram aplicados testes de distribuição normal para seleção das variáveis participantes dos modelos, por meio do teste W. Em seguida, foram realizadas análises de correlação simples entre as variáveis e análise de regressão múltipla por Stepwise. Para obtenção dos modelos, realizou-se uma análise com quatro variáveis independentes, representadas por: X1 = Ug, X2 = Ds, X3 = MO, X4 = Arg, e a variável dependente (Y), caracterizada pela resistência do solo à penetração (RP). Após obtenção dos modelos finais, testaram-se os efeitos de multicolinearidade por meio do VIF (Fator de Incremento de Variância), sendo os valores de VIF menores que 10 indicativos de que o efeito da multicolineridade não influencia os resultados da regressão. Foi utilizado o nível de significância do valor F da variável de 15 % de probabilidade para a inclusão e exclusão de variáveis no modelo. Os resultados permitiram concluir que as equações que melhor estimaram a resistência do solo à penetração foram: para Ug < 0,20 kg kg-1 : RPE = 1,12 + 2,04Ds + 0,17MO (R² = 0,92); para (0,20 < Ug < 0,30 kg kg-1): RPE = 2,93 - 17,85Ug + 2,98Ds (R² = 0,95); para Ug > 0,30 kg kg-1: RPE = 3,20 - 13,78Ug + 4,43Ds (R² = 0,97). Em todas as situações estudadas, os coeficientes de variação variaram de altos (situação UG1) a muito altos (situação UG2 e Ug3), caracterizando alta variabilidade espacial da RP; logo, a utilização dos modelos selecionados deve ser feita com cautela, pois ocorre importante dispersão de pontos estimados por meio dos modelos, em relação aos valores medidos.
Resumo:
A aplicação de técnicas espectroscópicas que utilizam a radiação infravermelha (NIRS-Near Infrared Spectroscopy e DRIFTS-Diffuse Reflectance Fourier Transformed Spectroscopy) na análise inorgânica do solo tem sido proposta desde a década de 1970, mas até os dias atuais são raros os métodos implementados rotineiramente no Brasil. Isso deve-se à dificuldade em construir modelos de calibração, por meio de métodos estatísticos multivariados, utilizando-se amostras reais de solo, de constituição complexa, que varia geograficamente e de acordo com o manejo. Por isso, os objetivos deste trabalho foram construir modelos de calibração em NIRS e DRIFTS para a quantificação das frações de argila e areia, em amostras de solos de classes diferentes - Latossolo Vermelho (predominante), Nitossolo, Argissolo Vermelho e Neossolo Quartzarênico - e avaliar qual dessas duas técnicas é mais adequada para essa finalidade, assim como a interferência do agrupamento de amostras e da seleção de variáveis espectrais na qualidade desses modelos. Para isso, valores de referência obtidos pelo método do densímetro, método largamente utilizado nos laboratórios de análise de solo, foram correlacionados com valores de absorbância em NIRS e DRIFTS pela ferramenta estatística PLS (Partial Least Squares), obtendo-se altos coeficientes de determinação (R²), de 0,95, 0,90 e 0,91 para argila, silte e areia, respectivamente, na validação externa. Isso confirma a aplicabilidade das técnicas espectroscópicas na análise granulométrica do solo para fins agrícolas. O agrupamento das amostras segundo a localização e a seleção de variáveis espectrais pouco influenciou na qualidade dos modelos. A técnica espectroscópica mais indicada para essa finalidade foi a DRIFTS.
Resumo:
O Cerrado é uma das principais regiões de expansão agropecuária do país, entretanto a fragilidade dos seus ecossistemas restringe a capacidade de suporte a muitas das atividades agrícolas e compromete a preservação da sua biodiversidade. O objetivo deste estudo foi definir padrões locais de características edáficas e vegetacionais, em uma sub-bacia em Rio Pardo de Minas (MG), como base para o planejamento local de uso sustentável. Para tal, foram utilizadas técnicas de levantamento fitossociológico e de solos associadas à análise estatística multivariada, dendrograma e análise de componentes principais, de forma a correlacionar distribuição espacial de grupos de espécies e atributos edáficos. Os resultados indicaram a ordenação dos ambientes em dois grupos, em função da natureza dos materiais de origem: arenítico-quartzítico e sedimentos argilo-arenosos e argilosos. A seleção de variáveis pela análise multivariada foi capaz de discriminar os ambientes representados no levantamento fitossociológico. Os padrões identificados pelos agricultores corresponderam, em geral, às variações nos parâmetros florísticos e fitossociológicos e aos atributos edáficos, entre estes a densidade absoluta, a área basal e o índice de diversidade; as frações granulométricas foram determinantes na diferenciação dos ambientes.