288 resultados para mIneração de dados


Relevância:

100.00% 100.00%

Publicador:

Resumo:

O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O objetivo deste trabalho foi analisar o comportamento espaçotemporal da precipitação pluvial no Estado do Rio Grande do Sul, entre os decênios de 1987-1996 e 1997-2006, por meio de técnicas de mineração de dados. As séries históricas foram adquiridas no sistema de informações hidrológicas Hidroweb. A metodologia utilizada teve como base o modelo CRISP-DM (Cross Industry Standard Process for Data Mining). Foram definidas áreas pluviometricamente homogêneas para os decênios de 1987-1996 e 1997-2006. Em seguida, pela sobreposição dos agrupamentos obtidos para os dois períodos, encontraram-se seis zonas comuns aos dois decênios (A a F). As alterações ocorridas foram avaliadas nas seguintes escalas temporais: anual, sazonal e mensalmente. Os resultados indicaram incrementos significativos (20 a 240 mm) na precipitação anual em todas as zonas, exceto na zona A. Na análise sazonal, as variações foram aleatórias, sendo que, na primavera, todas as zonas apresentaram incremento significativo (44 a 142 mm). Na análise mensal, destaca-se a redução ocorrida no mês de janeiro em todas as zonas, exceto na E. Nos demais meses, as variações foram aleatórias. Os resultados mostram que, entre os decênios, houve uma alteração no volume da precipitação pluvial em todas as escalas temporais analisadas.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Neste trabalho, verificou-se a aderência de técnicas de mineração de dados voltadas para problemas de classificação de dados na identificação automatizada de áreas cultivadas com cana-de-açúcar, em imagens do satélite Landsat 5/TM. Para essa verificação, foram estudadas imagens de áreas cultivadas com cana-de-açúcar em três fases fenológicas diferentes. Os pixels foram convertidos em valores de refletância de superfície, nas vizinhanças das cidades de Araras, São Carlos e Araraquara, no Estado de São Paulo. Foram gerados cinco modelos de árvores de decisão binária, induzidos pelo algoritmo C4.5, em que todos produziram taxas de acerto superiores a 90%. A introdução de atributos de textura trouxe ganhos significativos na acurácia do modelo de classificação e contribuiu para melhorar a distinção de áreas cultivadas com cana-de-açúcar em meio a tipos diversos de cobertura do solo, como solo exposto, área urbana, lagos e rios. Os índices de vegetação mostraram-se relevantes na distinção da fase e do estado fenológico das culturas. Os resultados reforçam o potencial forte das árvores de decisão no processo de classificação e identificação de áreas cultivadas com cana-de-açúcar, em diferentes cidades produtoras, no Estado de São Paulo.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

RESUMO O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

OBJETIVO: Identificar, com o auxílio de técnicas computacionais, regras referentes às condições do ambiente físico para a classificação de microáreas de risco. MÉTODOS: Pesquisa exploratória, desenvolvida na cidade de Curitiba, PR, em 2007, dividida em três etapas: identificação de atributos para classificar uma microárea; construção de uma base de dados; e aplicação do processo de descoberta de conhecimento em base de dados, por meio da aplicação de mineração de dados. O conjunto de atributos envolveu as condições de infra- estrutura, hidrografia, solo, área de lazer, características da comunidade e existência de vetores. A base de dados foi construída com dados obtidos em entrevistas com agentes comunitários de saúde, sendo utilizado um questionário com questões fechadas, elaborado com os atributos essenciais, selecionados por especialistas. RESULTADOS: Foram identificados 49 atributos, sendo 41 essenciais e oito irrelevantes. Foram obtidas 68 regras com a mineração de dados, as quais foram analisadas sob a perspectiva de desempenho e qualidade e divididas em dois conjuntos: as inconsistentes e as que confirmam o conhecimento de especialistas. A comparação entre os conjuntos mostrou que as regras que confirmavam o conhecimento, apesar de terem desempenho computacional inferior, foram consideradas mais interessantes. CONCLUSÕES: A mineração de dados ofereceu um conjunto de regras úteis e compreensíveis, capazes de caracterizar microáreas, classificando-as quanto ao grau do risco, com base em características do ambiente físico. A utilização das regras propostas permite que a classificação de uma microárea possa ser realizada de forma mais rápida, menos subjetiva, mantendo um padrão entre as equipes de saúde, superando a influência da percepção particular de cada componente da equipe.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

O mapeamento digital de solos permite prever padrões de ocorrência de solos com base em áreas de referência e no uso de técnicas de mineração de dados para modelar associações solo-paisagem. Os objetivos deste trabalho foram produzir um mapa pedológico digital por meio de técnicas de mineração de dados aplicadas a variáveis geomorfométricas e de geologia, com base em áreas de referência; e testar a confiabilidade desse mapa por meio de validação em campo com diferentes sistemas de amostragem. O mapeamento foi realizado na folha Botucatu (SF-22-Z-B-VI-3), utilizando-se as folhas 1:50.000, Dois Córregos e São Pedro, como áreas de referência. Variáveis descritoras do relevo e de geologia associadas às unidades de mapeamento pedológico das áreas de referência compuseram a matriz de dados de treinamento. A matriz foi analisada pelo algoritmo PART de árvore de decisão, do aplicativo Weka (Waikato Environment for Knowledge Analysis), que cria regras de classificação. Essas regras foram aplicadas aos dados geomorfométricos e geológicos da folha Botucatu, para predição de unidades de mapeamento pedológico. A validação de campo dos mapas digitais deu-se por meio de amostragem por transectos em uma unidade de mapeamento da folha São Pedro e de forma aleatório-estratificada na folha Botucatu. A avaliação da unidade de mapeamento na folha São Pedro verificou confiabilidade, respectivamente, de 83 e 66 %, para os mapas pedológicos digital e tradicional com legenda simplificada. Apesar de terem sido geradas regras para todas as unidades de mapeamento pedológico das áreas de treinamento, nem todas as unidades de mapeamento foram preditas na folha Botucatu, o que resultou das diferenças de relevo e geologia entre as áreas de treinamento e de mapeamento. A validação de campo do mapa digital da folha Botucatu verificou exatidão global de 52 %, compatível com levantamentos em nível de reconhecimento de baixa intensidade, e kappa de 0,41, indicando qualidade Boa. Unidades de mapeamento mais extensas geraram mais regras, resultando melhor reprodução dos padrões solo-relevo na área a ser mapeada. A validação por transectos na folha São Pedro indicou compatibilidade do mapa digital com o nível de reconhecimento de alta intensidade e compatibilidade do mapa tradicional, após simplificação de sua legenda, com o nível de reconhecimento de baixa intensidade. O treinamento do algoritmo em mapas e não em observações pontuais reduziu em 14 % a exatidão do mapa pedológico digital da folha Botucatu. A amostragem aleatório-estratificada pelo hipercubo latino é apropriada a mapeamentos com extensa base de dados, o que permite avaliar o mapa como um todo, tornando os trabalhos de campo mais eficientes. A amostragem em transectos é compatível com a avaliação da pureza de unidades de mapeamento individualmente, não necessitando de base de dados detalhada e permitindo estudos de associações solo-paisagem em pedossequências.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Este trabalho objetivou ajustar equações para estimar a biomassa total de plantas de bambu, do gênero Guadua, bem como comparar o ajuste de equações por regressão linear com a técnica de mineração de dados. Foram utilizados 38 colmos de bambu, nos quais foram mensuradas as variáveis diâmetro à altura do peito (dap), diâmetro do colo do colmo e altura do colmo, seguido da determinação de massa total por método destrutivo. A biomassa determinada em 25 colmos foi utilizada para ajuste de equações pelo método dos mínimos quadrados e 13 colmos serviram para a validação da melhor equação. As frações de biomassa por compartimento diferem significativamente (p < 0,05) entre si. A maior fração da biomassa corresponde ao colmo, representando 69,2% do total, seguida pela dos rizomas, dos galhos e da folhagem, com 15,7; 10,8 e 4,2%, respectivamente. A melhor equação ajustada para estimar a biomassa total apresentou coeficiente de determinação de 0,93 e erro padrão da estimativa de 15%. Já a técnica de mineração de dados apresentou coeficiente de determinação de 0,81, com erro padrão de 23,8%. Pode-se estimar acuradamente a biomassa de Guadua por regressão linear e por mineração dos dados. Neste trabalho, o método de regressão apresentou melhor desempenho. A limitação de dados pode ser o fator determinante para o pior desempenho da técnica de mineração de dados, pois requer uma massa de dados mais ampla para funcionar satisfatoriamente.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

O objetivo deste trabalho foi identificar marcadores moleculares relacionados à resistência do cafeeiro (Coffea arabica) à ferrugem (Hemileia vastatrix). Foram identificadas sequências de DNA potencialmente envolvidas na resistência do cafeeiro a doenças, por meio de análise "in silico", a partir das informações geradas pelo Projeto Brasileiro do Genoma Café. A partir das sequências mineradas, foram desenhados 59 pares de iniciadores para amplificá-las. Os 59 iniciadores foram testados em 12 cafeeiros resistentes e 12 susceptíveis a H. vastatrix. Vinte e sete iniciadores resultaram em bandas únicas e bem definidas, enquanto um deles amplificou fragmento de DNA em todos os cafeeiros resistentes, mas não nos suscetíveis. Esse marcador molecular polimórfico amplificou uma região do DNA que corresponde a uma janela aberta de leitura parcial do genoma de C. arabica que codifica uma proteína de resistência a doenças. O marcador CARF 005 é capaz de diferenciar os cafeeiros analisados em resistentes e susceptíveis a H. vastatrix.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

A ferrugem asiática é a mais importante doença da soja no Brasil. Apesar de sua epidemiologia ser conhecida, são escassos os estudos sobre os fatores que desencadeiam a doença com base em dados de campo. Este trabalho objetivou modelar a influência de variáveis meteorológicas a partir de um conjunto extenso de dados de ocorrência da ferrugem, por meio da técnica de indução de árvores de decisão. Os modelos foram desenvolvidos com dados de data de ocorrência da doença em quatro safras (2007/08 a 2010/11) e variáveis de temperatura e chuva em diferentes janelas de tempo prévias à data de detecção. Para cada registro de ocorrência, foi gerado um correspondente de "não ocorrência" como sendo o trigésimo dia anterior ao dia da detecção, assumindo-se a presença de inóculo, mas condições meteorológicas desfavoráveis à doença. O conjunto de treinamento para a modelagem foi composto de 45 variáveis de chuva e temperatura e 12.591 registros. O modelo preditivo escolhido resultou em uma árvore de decisão com, aproximadamente, 78% de taxa de acerto e 108 regras, determinadas por validação cruzada. O modelo interpretado, com 28 regras, considerou variáveis de temperatura como mais importantes, sendo que temperaturas abaixo de 15 °C e acima de 30 °C foram relacionadas com eventos de não ocorrência, enquanto temperaturas dentro da faixa favorável foram associadas com eventos de ocorrência, mostrando coerência com a literatura.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

RESUMO O conhecimento sobre a cobertura da terra é fundamental como informação para o planejamento e o estudo dos efeitos da substituição de paisagens naturais por paisagens antropizadas. Este estudo objetivou analisar a dinâmica da cobertura da terra entre os anos de 1989 e 2011, na bacia hidrográfica do rio Marombas (SC), empregando o classificador árvore de decisão (AD). Foram utilizadas bandas espectrais do satélite Landsat 5, índices de vegetação e atributos de terreno extraídos do modelo digital de elevação. Esses dados foram utilizados como atributos de classificação da cobertura da terra, nos anos de 1989, 1991, 1993, 1997, 2001, 2004 e 2011. A qualidade do classificador AD foi avaliada por um conjunto de 500 pontos aleatórios e independentes, gerados para cada ano, o que permitiu calcular os parâmetros índice Kappa e exatidão global a partir das matrizes de confusão. O algoritmo AD obteve desempenho médio próximo a 83% para o índice Kappa e exatidão global média de 86%. Esses valores permitem considerar a classificação como excelente, o que permitiu uma associação segura entre a influência antrópica e a dinâmica da cobertura da terra na bacia hidrográfica estudada. Foi diagnosticado o aumento das atividades agrícolas e silvicultoras em detrimento das coberturas naturais, além de uma fragmentação dos corredores ecológicos da Floresta Ombrófila Mista, no intervalo analisado de 22 anos.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Os microrganismos são os mais numerosos da fração biológica do solo e estão sujeitos a alterações em sua abundância e nas relações metabólicas em função de mudanças ambientais, como o aporte de poluentes ao solo. O objetivo deste trabalho foi avaliar a atividade microbiana de solos da área de mineração e metalurgia de chumbo (Pb), no município de Adrianópolis (PR), a fim de gerar indicadores biológicos da qualidade desses solos. Os solos foram amostrados (0 a 5 e 5 a 10 cm) em cinco locais e em quatro épocas do ano (maio, setembro, novembro e janeiro). Os teores totais de Pb e Zn do solo foram determinados por espectroscopia de emissão atômica com plasma acoplado indutivamente, após digestão das amostras com HF e HNO3 concentrados e H2O2 30 % (v/v) em forno de micro-ondas. Para extração de formas mais disponíveis de Pb e Zn foi empregada a solução de HNO3 0,5 mol L-1 fervente. Foram estimados os seguintes atributos microbiológicos dos solos: contagem de bactérias totais (BT); contagem de bactérias esporuláveis (BESP); percentagem de bactérias esporuláveis em relação à BT; contagem de fungos; relação entre fungos e bactérias totais; respiração microbiana; biomassa microbiana; percentagem do carbono microbiano em relação ao C orgânico total do solo; e quociente metabólico. Utilizaram-se três métodos para o tratamento estatístico dos dados: diferenciação dos solos por meio da análise de componentes principais (ACP); obtenção de índice de qualidade ambiental relativo aos atributos microbiológicos (IQAMi); e análise de correlação simples. A elevada fertilidade dos solos tornou menos expressivo o efeito prejudicial dos metais pesados sobre os microrganismos. Contudo, no mês de maior estresse climático para os organismos (maio - menor temperatura), solos com maiores teores de Pb apresentaram menor população e atividade microbiana, ou seja, nessas condições as bactérias e fungos foram bons indicadores de qualidade do solo. A maior proporção de BESP nos solos mais contaminados por Pb no mês mais frio (correlação de 0,95* para maio) pode ser interpretada como mecanismo de resistência desses organismos. O IQAMi na camada de 0 a 5 cm foi mais eficiente que a ACP na separação dos solos contaminados com metais pesados: os valores decresceram em sentido oposto ao aumento nos teores de Pb dos solos. Já na profundidade de 5 a 10 cm a ACP foi mais eficiente para esse propósito.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O estudo de cinética de liberação de metais pesados é uma importante ferramenta de diagnóstico ambiental de áreas contaminadas, pois determina, além dos teores acumulados liberados após tempos crescentes de equilíbrio, a taxa (velocidade) de dessorção desses poluentes para a solução do solo. Com o objetivo de avaliar a cinética de liberação de Pb de solos da área de mineração e metalurgia de metais pesados, no município de Adrianópolis (PR), vale do rio Ribeira, selecionaram-se oito solos, submetidos a diferentes formas de contaminação (solos 2, 4 e 5 - incorporação de resíduos da metalurgia de metais pesados aos perfis; solos 3, 6 e 7 - adição de Pb particulado via chaminés da fábrica; solo 8 - contaminação por passagem da água pluvial pela fábrica desativada, que escorre em direção ao rio Ribeira). O solo 1, sob mata nativa, fora da direção de caminhamento das fumaças da metalurgia, localizado a 1.560 m de distância e a 380 m acima da cota da fábrica desativada, foi escolhido como referência dos teores naturais de Pb dos solos da região. As amostras de solo, coletadas em duas profundidades (0 a 10 e 20 a 40 cm), foram submetidas a extrações sequenciais com ácido cítrico 0,1 mol L-1 após diferentes períodos de contato (tempos acumulados: 2, 14, 38, 86, 182, 326, 518, 806 e 1.382 h). Os teores totais de Pb (extração com HF e HNO3 concentrados e H2O2 30 % v/v) foram altos (máximo de 24.755,6 mg kg-1) e indicaram intensa contaminação dos solos. Os dados da cinética de liberação foram ajustados às equações parabólicas de difusão, sendo a liberação do Pb gradual e bifásica, com velocidade de liberação maior na primeira fase. Os solos 3 e 5 foram considerados com elevado potencial de contaminação ambiental devido aos altos teores de Pb dessorvido acumulados nas extrações sequenciais com ácido cítrico (máximo de 18.577,4 mg kg-1). O solo 6, com baixos teores de argila, apresentou a maior velocidade (taxa) de dessorção de Pb.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Trata da comparação entre a indexação manual e a ferramenta de mineração de textos, por meio da análise do índice de precisão de resposta no processo de busca e recuperação da informação. O estudo de caso escolhido para o desenvolvimento da pesquisa foi o Centro de Referência e Informação em Habitação (Infohab), cuja base de dados sobre habitação, saneamento e urbanização foi indexada de forma manual por bibliotecários da Caixa Econômica Federal, com base em uma lista de palavras-chave. Houve o desenvolvimento de um protótipo cujos itens bibliográficos correspondem às teses e dissertações contidas no Infohab, o que permitiu a aplicação do software BR/Search para a execução da mineração de textos. As pesquisas no Infohab e no protótipo foram realizadas a partir da demanda de especialistas da Caixa nos assuntos contidos na base. Conclui que não há ganhos significativos na precisão ao se aplicar a ferramenta de mineração de textos em relação à indexação manual.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

OBJETIVO: Investigação do uso da técnica de mineração de texto como forma de avaliar a qualidade informacional de laudos eletrônicos de mamografia, tendo como parâmetro de qualidade a adesão ao léxico BI-RADS®. MATERIAIS E MÉTODOS: Foram extraídos 22.247 laudos de mamografia do banco de dados do sistema de informação em radiologia do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto, no período de janeiro de 2000 até junho de 2006. Foram realizados dois experimentos, um buscando-se verificar a utilização mais correta dos termos do léxico - experimento 1 (especificidade do método de mineração), e outro buscando-se verificar toda e qualquer tentativa de uso ou alusão ao léxico - experimento 2 (sensibilidade do método de mineração). RESULTADOS: Experimento 1: variação entre 11% e 61% de laudos contendo termos do léxico em sua conclusão, distribuída de forma aleatória ao longo do tempo, a partir do ano de 2001. Experimento 2: variação entre 44% e 100% de laudos que se referem de alguma forma ao léxico em sua conclusão. CONCLUSÃO: Os resultados indicam um bom potencial da aplicação da ferramenta de mineração de texto para a avaliação da qualidade das informações contidas em laudos eletrônicos de mamografia.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Com o advento dos testes eletrofisiológicos, a avaliação clínica parece ter perdido interesse na paralisia de Bell. A eletroneuronografia (ENoG) associada ao estadiamento clínico da doença é o método mais freqüentemente utilizado para mensurar o prognóstico da paralisia de Bell. Entretanto, a ENoG constitui-se em um teste eletrofisiológico ainda não universalmente disponível, especialmente nos serviços de emergência. OBJETIVO: Estudar a medida do prognóstico da paralisia de Bell com base nos dados clínicos e no teste de estimulação elétrica mínima, teste de Hilger, permitindo assim uma previsão de prognóstico segura e factível na maioria dos serviços. FORMA DE ESTUDO: coorte historica. MATERIAL E MÉTODO: Estudo coorte retrospectivo, analisando 1521 casos de paralisia de Bell, correlacionando-se os dados clínicos sexo, idade, lado da paralisia, modo de instalação, sintomas prévios, sintomas associados e os resultados do teste de estimulação elétrica mínima (Hilger), com a evolução da paralisia após 6 meses. RESULTADO: O estudo desses dados indicou que pacientes acima de 60 anos apresentaram prognóstico pior em comparação com pacientes com idade abaixo de 30 anos; o modo de instalação progressiva, a ausência de sintomas prévios, a presença de vertigem concomitante à paralisia e resposta acima de 3,5 mm no teste de Hilger estiveram relacionados com mau prognóstico. Por outro lado, a ausência de sintomas concomitantes, a diminuição do lacrimejamento e o início súbito foram relacionados com bom prognóstico. CONCLUSÃO: A análise de fatores clínicos, associada ao teste de Hilger, pode indicar o prognóstico da paralisia facial com reduzida margem de erro, sendo uma alternativa bastante interessante especialmente quando não há disponibilidade da ENoG.