999 resultados para base de dados
Resumo:
O mapeamento digital de solos permite prever padrões de ocorrência de solos com base em áreas de referência e no uso de técnicas de mineração de dados para modelar associações solo-paisagem. Os objetivos deste trabalho foram produzir um mapa pedológico digital por meio de técnicas de mineração de dados aplicadas a variáveis geomorfométricas e de geologia, com base em áreas de referência; e testar a confiabilidade desse mapa por meio de validação em campo com diferentes sistemas de amostragem. O mapeamento foi realizado na folha Botucatu (SF-22-Z-B-VI-3), utilizando-se as folhas 1:50.000, Dois Córregos e São Pedro, como áreas de referência. Variáveis descritoras do relevo e de geologia associadas às unidades de mapeamento pedológico das áreas de referência compuseram a matriz de dados de treinamento. A matriz foi analisada pelo algoritmo PART de árvore de decisão, do aplicativo Weka (Waikato Environment for Knowledge Analysis), que cria regras de classificação. Essas regras foram aplicadas aos dados geomorfométricos e geológicos da folha Botucatu, para predição de unidades de mapeamento pedológico. A validação de campo dos mapas digitais deu-se por meio de amostragem por transectos em uma unidade de mapeamento da folha São Pedro e de forma aleatório-estratificada na folha Botucatu. A avaliação da unidade de mapeamento na folha São Pedro verificou confiabilidade, respectivamente, de 83 e 66 %, para os mapas pedológicos digital e tradicional com legenda simplificada. Apesar de terem sido geradas regras para todas as unidades de mapeamento pedológico das áreas de treinamento, nem todas as unidades de mapeamento foram preditas na folha Botucatu, o que resultou das diferenças de relevo e geologia entre as áreas de treinamento e de mapeamento. A validação de campo do mapa digital da folha Botucatu verificou exatidão global de 52 %, compatível com levantamentos em nível de reconhecimento de baixa intensidade, e kappa de 0,41, indicando qualidade Boa. Unidades de mapeamento mais extensas geraram mais regras, resultando melhor reprodução dos padrões solo-relevo na área a ser mapeada. A validação por transectos na folha São Pedro indicou compatibilidade do mapa digital com o nível de reconhecimento de alta intensidade e compatibilidade do mapa tradicional, após simplificação de sua legenda, com o nível de reconhecimento de baixa intensidade. O treinamento do algoritmo em mapas e não em observações pontuais reduziu em 14 % a exatidão do mapa pedológico digital da folha Botucatu. A amostragem aleatório-estratificada pelo hipercubo latino é apropriada a mapeamentos com extensa base de dados, o que permite avaliar o mapa como um todo, tornando os trabalhos de campo mais eficientes. A amostragem em transectos é compatível com a avaliação da pureza de unidades de mapeamento individualmente, não necessitando de base de dados detalhada e permitindo estudos de associações solo-paisagem em pedossequências.
Resumo:
Apresenta o processo desenvolvido pela Companhia de Informática do Paraná (Celepar) na conversão de uma base de dados bibliográfica de recuperação de informações em MicroISIS, para disponibilização por meio da Internet. Relata quais os passos seguidos nesta conversão, desde a decisão pela utilização de banco de dados não relacional, até sua recuperação por intermédio de páginas web. Mostra como foi o processo de conversão do arquivo mestre do MicroISIS para um arquivo seqüencial, possibilitando assim o acesso a este em ambiente mainframe. Apresenta ainda a estrutura do módulo de pesquisa, especialmente com relação às facilidades do sistema.
Resumo:
O assunto Brasil foi analisado na base de teses francesas DocThèses, compreendendo os anos de 1969 a 1999. Utilizou-se a técnica de Data Mining como ferramenta para obter inteligência e conhecimento. O software utilizado para a limpeza da base DocThèses foi o Infotrans, e, para a preparação dos dados, empregou-se o Dataview. Os resultados da análise foram ilustrados com a aplicação dos pressupostos da Lei de Zipf, classificando-se as informações em trivial, interessante e ruído, conforme a distribuição de freqüência. Conclui-se que a técnica do Data Mining associada a softwares especialistas é uma poderosa aliada no emprego de inteligência no processo decisório em todos os níveis, inclusive o nível macro, pois oferece subsídios para a consolidação, investimento e desenvolvimento de ações e políticas.
Resumo:
O objetivo deste trabalho foi avaliar uma metodologia para estimar a produtividade potencial da cultura do milho de acordo com valores médios diários de temperatura do ar e radiação solar, utilizando procedimento estocástico. Valores registrados da temperatura média diária do ar durante 86 anos e da radiação solar global diária durante 25 anos, foram fornecidos pela Estação Agrometeorológica de Piracicaba (Esalq/USP). Valores correspondentes à produtividade potencial foram simulados 1.000 vezes, em cada data de semeadura considerada (15/10 - época normal; 15/2 - safrinha; e 15/8 - safra de inverno). Foram considerados dois casos na distribuição de probabilidade normal truncada (valores extremos: média - 1,96 desvio-padrão e média + 1,96 desvio-padrão): temperatura média diária variável e radiação solar global diária constante, e temperatura média diária constante e radiação solar global diária variável. A metodologia de estimação permite definir a ordem de grandeza da produtividade potencial de milho a determinada localidade, com base nos dados de temperatura e radiação solar. O procedimento estocástico proposto permite associar a produtividade potencial de milho a determinada probabilidade.
Resumo:
O objetivo deste trabalho foi determinar épocas de avaliação da produtividade e de componentes da produção que permitam selecionar precocemente genótipos superiores de maracujazeiro. Foram avaliados 111 acessos de maracujazeiro amarelo, do Sul e Sudeste brasileiros, durante duas safras consecutivas. Avaliaram-se, mensalmente, as variáveis produção por planta, número de frutos por planta e peso médio de frutos. Os valores mensais e anuais dessas variáveis foram correlacionados à produção total acumulada em dois anos. Entre os dados mensais, os do terceiro mês tiveram a melhor correlação com os dados acumulados. Seleções positivas e negativas foram simuladas com os dados do terceiro mês e comparadas à seleção feita com base nos dados acumulados em dois anos. Os dados do terceiro mês da primeira safra foram adequados para a seleção quanto ao peso de frutos, mas as variáveis número de frutos e produtividade por planta seriam melhor selecionadas com os dados do terceiro mês da segunda safra.
Resumo:
O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original.
Resumo:
Os marcadores microssatélites são ferramentas úteis em diversas análises genéticas em plantas. No caso do mamoeiro (Carica papaya L.), poucos locos de microssatélites foram descritos até o momento. Assim, o objetivo deste trabalho foi explorar a base de dados do GenBank / NCBI (National Center of Biotechnoloy Information) à procura de microssatélites de mamoeiro, visando a seu futuro uso em estudos genéticos e moleculares aplicados ao melhoramento genético. As seqüências foram obtidas no GenBank / NCBI, no formato FASTA, e analisadas para a presença de microssatélites com um mínimo de 20; 7 e 5 repetições dos motivos de mono-, di- e trinucleotídeos, respectivamente, e acima de 4 repetições para tetra- e pentanucleotídeos. Seqüências com mais de 90% de similaridade foram consideradas redundantes e, portanto, eliminadas das análises. Foram analisadas 44.591 seqüências, das quais 3.180 foram não-redundantes e apresentaram 3.947 microssatélites. Desse total, 3.587 foram classificados como microssatélites perfeitos, 8 imperfeitos, 65 interrompidos, 239 compostos-perfeitos, 8 compostos-imperfeitos e 40 compostos-interrompidos. As repetições de di- e trinucleotídeos representaram 65,7 e 14,4% do total de seqüências analisadas, respectivamente. Somente os motivos do tipo AT/TA representaram 44,1% dos microssatélites encontrados. Os motivos mais comuns de tri-, tetra- e pentanucleotídeos foram AAT, AATT e TTTAA, respectivamente. Observou-se que, nas seqüências disponíveis, o genoma do mamoeiro apresenta, em média, um microssatélite a cada 5,65 kb.
Resumo:
Foi elaborado um sistema para gerenciamento informatizado dos testes de controle de qualidade exigidos pela Portaria 453/98 da Secretaria de Vigilância Sanitária do Ministério da Saúde, visando otimizar sua execução, armazenamento e interpretação. Os testes de controle de qualidade são parte do programa de garantia de qualidade que deve ser implantado em toda instalação de radiodiagnóstico médico e odontológico. Para isso, foi elaborado um banco de dados utilizando o programa Microsoft Access®, permitindo comunicação direta com o sistema informatizado de gerenciamento das manutenções dos equipamentos de raios X, em implantação no Hospital Universitário Clementino Fraga Filho da Universidade Federal do Rio de Janeiro.
Resumo:
Esta pesquisa originou-se de uma base de dados de dois inventários a 100%, realizados em 1984 e 2000 sobre uma mesma área de 576 ha de floresta tropical primária, localizada na Floresta Nacional do Tapajós, Belterra, Pará. O objetivo da pesquisa foi utilizar a análise exploratória de dados e a regressão robusta para modelar o crescimento em diâmetro e área basal. Nos dois inventários as circunferências à altura do peito (CAP) foram medidas com fitamétrica, enquanto as alturas comerciais em 1984 foram medidas com o hipsômetro de Weiss e em 2000, estimadas com o uso de varas; o DAP mínimo em 1984 foi de 55 cm para todas as espécies e em 2000 foi adotado o DAP mínimo de 35 cm. As análises estatísticas foram precedidas de análise exploratória de dados (AED), em que foram utilizados o box plot (caixa-de-bigodes) na detecção de outliers (observações discrepantes) e o gráfico stem-and-leaf (tronco-e-folhas) para filtrar as observações extremas. Utilizou-se a regressão robusta para ajustar os modelos na presença de outliers. A pesquisa mostrou que, apesar das variações intra e interespecíficas, as seis espécies, em conjunto, apresentaram taxas de crescimento medianas observadas e esperadas em diâmetro e área basal de 4,56 e 4,28 mm/ano e 13,00 e 13,09 cm²/ha/ano, respectivamente. A pesquisa também mostrou que o uso da análise exploratória de dados e da regressão robusta viabilizou a análise e a determinação dos incrementos periódicos em diâmetro e área basal em bases consistentes. A metodologia empregada no caso específico dos dados disponíveis e tipos de variáveis mostrou ser mais eficiente com o uso de regressão robusta pelo método Least Trimmed Square do que pelo método dos mínimos quadrados ordinários.
Resumo:
O presente trabalho teve como objetivo avaliar o método para delimitação da bacia de contribuição à montante de um ponto selecionado sobre o hidrografia e a obtenção das respectivas características morfométricas, a partir de bases de dados estruturadas topologicamente. Para tanto, utilizou-se o aplicativo Hidrodata 2.0, desenvolvido para o ArcINFO workstation, comparando os seus resultados com os do processo convencional. Os resultados comprovaram que o tempo de processamento demandado para delimitação de bacias e extração de suas características morfométricas a partir de uma base de dados estruturada topologicamente se manteve baixo e constante. Concluiu-se que o método apresentado poderá ser aplicado em qualquer bacia hidrográfica, independentemente do seu tamanho, mesmo com o uso de computadores de configuração mais modesta.
Resumo:
A ferrugem asiática é a mais importante doença da soja no Brasil. Apesar de sua epidemiologia ser conhecida, são escassos os estudos sobre os fatores que desencadeiam a doença com base em dados de campo. Este trabalho objetivou modelar a influência de variáveis meteorológicas a partir de um conjunto extenso de dados de ocorrência da ferrugem, por meio da técnica de indução de árvores de decisão. Os modelos foram desenvolvidos com dados de data de ocorrência da doença em quatro safras (2007/08 a 2010/11) e variáveis de temperatura e chuva em diferentes janelas de tempo prévias à data de detecção. Para cada registro de ocorrência, foi gerado um correspondente de "não ocorrência" como sendo o trigésimo dia anterior ao dia da detecção, assumindo-se a presença de inóculo, mas condições meteorológicas desfavoráveis à doença. O conjunto de treinamento para a modelagem foi composto de 45 variáveis de chuva e temperatura e 12.591 registros. O modelo preditivo escolhido resultou em uma árvore de decisão com, aproximadamente, 78% de taxa de acerto e 108 regras, determinadas por validação cruzada. O modelo interpretado, com 28 regras, considerou variáveis de temperatura como mais importantes, sendo que temperaturas abaixo de 15 °C e acima de 30 °C foram relacionadas com eventos de não ocorrência, enquanto temperaturas dentro da faixa favorável foram associadas com eventos de ocorrência, mostrando coerência com a literatura.
Resumo:
OBJETIVO: Criar uma base de dados clínicos de terapia nutricional de pacientes pediátricos, informatizar os dados transformando-os em protocolo eletrônico, criar um meio de integração com outros centros médicos a fim de aplicar a base de dados de maneira multicêntrica. MÉTODO: a base de dados foi desenvolvida a partir de busca na literatura médica, em livros-texto e artigos científicos sobre terapia nutricional em pediatria. Inicialmente foi organizado um protocolo mestre, e posteriormente o mesmo foi dividido em dois protocolos específicos, um de admissão e outro de evolução do paciente. A informatização da base de dados foi realizada mediante programa de computador, desenvolvido em linguagem C# (C - Sharp), pelo laboratório eletrônico de pesquisas clínicas do Hospital de Clínicas da Universidade Federal do Paraná. RESULTADOS: o protocolo eletrônico desenvolvido permite armazenar informações clínicas, laboratoriais e complementares de pacientes pediátricos em terapia nutricional. Após a inclusão hierarquizada de todos os itens, foram distribuídos 6694 itens no protocolo mestre, sendo 392 no item Admissão e 6302 em Evolução. CONCLUSÃO: a criação de uma base de coleta de dados de pacientes pediátricos em terapia nutricional foi possível, a informatização da mesma foi factível e existe a possibilidade de integração de diferentes centros para realização de estudos multicêntricos.
Resumo:
OBJETIVO: Analisar a mudança temporal do estádio clínico do câncer de mama ao diagnóstico em mulheres residentes em Goiânia entre 1989 e 2003. MÉTODOS: estudo retrospectivo, utilizando-se a base de dados do Registro de Câncer de Base Populacional de Goiânia. As variáveis estudadas foram: idade, diagnóstico histológico, localização do tumor, tipo histológico e estádio clínico da doença. O período estudado foi dividido em três quinquênios: de 1989 a 1993, de 1994 a 1998 e de 1999 a 2003. Utilizou-se o teste Z para comparação das frequências da extensão ao diagnóstico por quinquênio. RESULTADOS: foram identificados 3.204 casos de câncer de mama. A média de idade foi de 56 anos (dp±16 anos). Quanto ao estádio da doença, evidenciou-se que 45,6% dos casos eram localizados na mama, com aumento de 19,2% entre o primeiro e o terceiro quinquênio (p<0,001; IC95%=0,14-0,23) e 10,2% de casos eram metastáticos, Entretanto, foi observada uma redução de 17,7% para os casos metastáticos no mesmo período (p<0,001; IC95%=0,14-0,21). A taxa de casos in situ entre 1989 e 1993 foi de 0,2%, aumentando para 6,2% em 1999-2003 (p<0,001; IC95%=4,9-7,4). CONCLUSÃO: observou-se um aumento dos casos de carcinoma in situ e de carcinomas invasores localizados somente na mama em detrimento de uma redução dos casos com metástases linfonodais e à distância.
Resumo:
Introdução: Os distúrbios mineral e ósseo (DMO) são encontrados com frequência em pacientes com doença renal crônica (DRC) e são causa importante de morbidade e mortalidade nessa população. São escassos na literatura estudos que avaliam a prevalência dos tipos de alterações histológicas no tecido ósseo e suas associações com desfechos clínicos, como fraturas, hospitalização, doença cardiovascular e mortalidade. Os estudos epidemiológicos dos DMO-DRC podem ser facilitados pela criação de registros. O Registro Brasileiro de Biópsias Ósseas (REBRABO) será uma base de dados coordenada pelo Comitê DMO-DRC da Sociedade Brasileira de Nefrologia. Objetivo: Descrever o desenho, banco de dados e metodologia do REBRABO. Métodos: Será uma base de dados eletrônica online, envolvendo informações nacionais, observacionais, multicêntricas retrospectivas (1ª fase), e prospectivas (2ª fase), contendo dados demográficos, clínicos, laboratoriais e de histologia óssea, obtidos por meio da técnica de histomorfometria em pacientes com DMO-DRC; serão empregadas análises estatísticas de relação e comparação para identificar possíveis associações entre os DMODRC e desfechos clínicos, incluindo fraturas, hospitalizações e mortalidade. Resultados: A primeira fase do REBRABO revelará análise de informações demográficas, clínicas, laboratoriais e de histologia do tecido ósseo de janeiro/1986 até dezembro/2013, cujos Resultados são esperados no primeiro semestre de 2015. Conclusão: Existe a necessidade de estudos que avaliem a prevalência, associações entre variáveis sociodemográficas, clínicas, laboratoriais e de histologia do tecido ósseo, e relações com desfechos clínicos na área dos DMO-DRC. O REBRABO servirá como plataforma única de pesquisa retrospectiva e prospectiva envolvendo dados de biópsia óssea de pacientes com DMO-DRC.
Resumo:
A comparação de dados de mercado é o método mais empregado em avaliação de imóveis. Este método fundamenta-se na coleta, análise e modelagem de dados do mercado imobiliário. Porém os dados freqüentemente contêm erros e imprecisões, além das dificuldades de seleção de casos e atributos relevantes, problemas que em geral são solucionados subjetivamente. Os modelos hedônicos de preços têm sido empregados, associados com a análise de regressão múltipla, mas existem alguns problemas que afetam a precisão das estimativas. Esta Tese investigou a utilização de técnicas alternativas para desenvolver as funções de preparação dos dados e desenvolvimento de modelos preditivos, explorando as áreas de descobrimento de conhecimento e inteligência artificial. Foi proposta uma nova abordagem para as avaliações, consistindo da formação de uma base de dados, ampla e previamente preparada, com a aplicação de um conjunto de técnicas para seleção de casos e para geração de modelos preditivos. Na fase de preparação dos dados foram utilizados as técnicas de regressão e redes neurais para a seleção de informação relevante, e o algoritmo de vizinhança próxima para estimação de valores para dados com erros ou omissões. O desenvolvimento de modelos preditivos incluiu as técnicas de regressão com superficies de resposta, modelos aditivos generalizados ajustados com algoritmos genéticos, regras extraídas de redes neurais usando lógica difusa e sistemas de regras difusas obtidos com algoritmos genéticos, os quais foram comparados com a abordagem tradicional de regressão múltipla Esta abordagem foi testada através do desenvolvimento de um estudo empírico, utilizando dados fornecidos pela Prefeitura Municipal de Porto Alegre. Foram desenvolvidos três formatos de avaliação, com modelos para análise de mercado, avaliação em massa e avaliação individual. Os resultados indicaram o aperfeiçoamento da base de dados na fase de preparação e o equilíbrio das técnicas preditivas, com um pequeno incremento de precisão, em relação à regressão múltipla.Os modelos foram similares, em termos de formato e precisão, com o melhor desempenho sendo atingido com os sistemas de regras difusas.