998 resultados para Banco de dados - Limpeza
Resumo:
A Descoberta de Conhecimento em Banco de Dados (DCBD) é uma nova área de pesquisa que envolve o processo de extração de conhecimento útil implícito em grandes bases de dados. Existem várias metodologias para a realização de um processo de DCBD cuja essência consiste basicamente nas fases de entendimento do domínio do problema, pré-processamento, mineração de dados e pós-processamento. Na literatura sobre o assunto existem muitos trabalhos a respeito de mineração de dados, porém pouco se encontra sobre o processo de pré-processamento. Assim, o objetivo deste trabalho consiste no estudo do pré-processamento, já que é a fase que consome a maior parte do tempo e esforço de todo o processo de DCBD pois envolve operações de entendimento, seleção, limpeza e transformação de dados. Muitas vezes, essas operações precisam ser repetidas de modo a aprimorar a qualidade dos dados e, conseqüentemente, melhorar também a acurácia e eficiência do processo de mineração. A estrutura do trabalho abrange cinco capítulos. Inicialmente, apresenta-se a introdução e motivação para trabalho, juntamente com os objetivos e a metodologia utilizada. No segundo capítulo são abordadas metodologias para o processo de DCBD destacando-se CRISP-DM e a proposta por Fayyad, Piatetsky-Shapiro e Smyth. No terceiro capítulo são apresentadas as sub-fases da fase de pré-processamento contemplando-se entendimento, seleção, limpeza e transformação de dados, bem como os principais métodos e técnicas relacionados às mesmas. Já no quarto capítulo são descritos os experimentos realizados sobre uma base de dados real. Finalmente, no quinto capítulo são apresentadas as considerações finais sobre pré-processamento no processo de DCBD, apontando as dificuldades encontradas na prática, contribuições do presente trabalho e pretensões da continuidade do mesmo. Considera-se como principais contribuições deste trabalho a apresentação de métodos e técnicas de pré-processamento existentes, a comprovação da importância da interatividade com o especialista do domínio ao longo de todo o processo de DCBD, mas principalmente nas tomadas de decisões da fase de pré-processamento, bem como as sugestões de como realizar um pré-processamento sobre uma base de dados real.
Resumo:
The area between Galinhos and São Bento do Norte beaches, located in the northern coast of the Rio Grande do Norte State is submitted to intense and constant processes of littoral and aeolian transport, causing erosion, alterations in the sediments balance and modifications in the shoreline. Beyond these natural factors, the human interference is huge in the surroundings due to the Guamaré Petroliferous Pole nearby, the greater terrestrial oil producing in Brazil. Before all these characteristics had been organized MAMBMARE and MARPETRO projects with the main objective to execute the geo-environmental monitoring of coastal areas on the northern portion of RN. There is a bulky amount of database from the study area such as geologic and geophysical multitemporal data, hydrodynamic measurements, remote sensing multitemporal images, thematic maps, among others; it is of extreme importance to elaborate a Geographic Database (GD), one of the main components of a Geographic Information System (GIS), to store this amount of information, allowing the access to researchers and users. The first part of this work consisted to elaborate a GD to store the data of the area between Galinhos and São Bento do Norte cities. The main goal was to use the potentiality of the GIS as a tool to support decisions in the environmental monitoring of this region, a valuable target for oil exploration, salt companies and shrimp farms. The collected data was stored as a virtual library to assist men decisions from the results presented as digital thematic maps, tables and reports, useful as source of data in the preventive planning and as guidelines to the future research themes both on regional and local context. The second stage of this work consisted on elaborate the Oil-Spill Environmental Sensitivity Maps. These maps based on the Environmental Sensitivity Index Maps to Oil Spill developed by the Ministry of Environment are cartographic products that supply full information to the decision making, contingency planning and assessment in case of an oil spilling incident in any area. They represent the sensitivity of the areas related to oil spilling, through basic data such as geology, geomorphology, oceanographic, social-economic and biology. Some parameters, as hydrodynamic data, sampling data, coastal type, declivity of the beach face, types of resources in risk (biologic, economic, human or cultural) and the land use of the area are some of the essential information used on the environmental sensitivity maps elaboration. Thus using the available data were possible to develop sensitivity maps of the study area on different dates (June/2000 and December/2000) and to perceive that there was a difference on the sensitivity index generated. The area on December presented more sensible to the oil than the June one because hydrodynamic data (wave and tide energy) allowed a faster natural cleaning on June. The use of the GIS on sensitivity maps showed to be a powerful tool, since it was possible to manipulate geographic data with correctness and to elaborate more accurate maps with a higher level of detail to the study area. This presented an medium index (3 to 4) to the long shore and a high index (10) to the mangrove areas highly vulnerable to oil spill
Resumo:
Pós-graduação em Ciência da Computação - IBILCE
Resumo:
The need to know and to preserve the coastal ecosystems is justified by the whole importance that those ecosystems have for our society. Then, it is big the concern in guaranteeing that those places stay free from contaminations. Among the several types of potentials pollutants that can affect the coastal systems, the petroleum-derived are the ones that cause the worst impacts, given the frequency of these accidents. Rapid actions are necessary in order to minimize the oil negative effects . This answer is faster when the most sensitive areas are known and when it presents characteristics of larger importance, as for instance, the presence of sea harvesting or the habitat of an endemic specie. Besides, it is necessary to know which cleanup methods are recommended and which are not recommended for the reached areas, so, the corrected emergency plans for each coastal environment can be applied. It is in this context that this project was developed, implementing a geographical database for the different coastal environment of São Sebastião municipality, SP, and also the data about the best cleanup techniques for each segment of the coast. This database was made available by the internet, enabling the access for several types of users.
Resumo:
Este projeto refere-se a uma mudan??a de metodologia na an??lise de presta????o de contas implementada pela Delegacia do MEC ??? PR. O antigo modelo utilizava ferramentas e equipamentos de pesquisas ineficazes, prejudicando o trabalho. Com a implementa????o do banco de dados, as atividades ganharam velocidade, gerando maior agilidade no atendimento ao usu??rio bem como fornecendo informa????es ??geis e fidedignas ao p??blico alvo
Resumo:
Apresenta-se um sistema computacional, denominado ICADPLUS, desenvolvido para elaboração de banco de dados, tabulação de dados, cálculo do índice CPO e análise estatística para estimação de intervalos de confiança e comparação de resultados de duas populações.Tem como objetivo apresentar método simplificado para atender necessidades de serviços de saúde na área de odontologia processando fichas utilizadas por cirurgiões dentistas em levantamentos epidemiológicos de cárie dentária. A característica principal do sistema é a dispensa de profissional especializado na área de odontologia e computação, exigindo o conhecimento mínimo de digitação por parte do usuário, pois apresenta "menus" simples e claros como também relatórios padronizados, sem possibilidade de erro. Possui opções para fichas de CPO segundo Klein e Palmer, CPO proposto pela OMS, CPOS segundo Klein, Palmer e Knutson, e ceo. A validação do sistema foi feita por comparação com outros métodos, permitindo recomendar sua adoção.
Resumo:
Dissertação apresentada para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Gestão do Território área de especialização em Detecção Remota e Sistemas de Informações Geográficas
Resumo:
Análises comparativas vêm sendo cada vez mais utilizadas para definir e relacionar os tipos de vegetação existentes no Brasil. Para tanto, cada pesquisador vem montando seu próprio banco de dados, usualmente elaborando um sistema com uma finalidade imediata e descartado ao término do projeto ou pesquisa. Essa prática leva ao desperdício de tempo, esforço, dinheiro e, principalmente, informação. Então, um sistema de banco de dados específico para armazenar e gerenciar informações advindas de levantamentos florísticos e, ou, fitossociológicos poderia padronizar, estruturar logicamente, evitar ou eliminar sobreposição de esforços, reduzir os custos e também promover oportunidade para que cientistas de diversas áreas compartilhem informações. Com esses objetivos e para suprir uma necessidade imediata de organizar uma base de dados, foi desenvolvido o FITOGEO. O sistema foi elaborado com a finalidade de gerenciar informações oriundas de listas florísticas ou de levantamentos fitossociológicos, variáveis ambientais associadas a estas listas e taxonômicas. O FITOGEO mantém a integridade dos dados, é centrado na ‘espécie’ e tem a capacidade de integrar dados e metadados de várias fontes. Apresenta duas interfaces: uma de características florísticas ou fitossociológicas, com todas as informações oriundas do levantamento em si, tanto das espécies quanto da metodologia adotada, e das variáveis ambientais associadas, como coordenadas geográficas, altitude, temperatura e precipitação. E outra taxonômica, resgatando informações como nome corrigido e o nome válido das espécies cadastradas e níveis hierárquicos supra-específicos.
Resumo:
O Brasil ocupa uma posição de destaque em estudos de solos tropicais, em razão do enorme volume de informações levantadas sobre os solos do país. Entretanto, a disponibilização dessas informações tem-se mostrado pouco eficiente. Com o intuito de ampliar as possibilidades de utilização de uma base de dados de solos de abrangência nacional, elaborada a partir de levantamentos pedológicos de grande amplitude, procedeu-se à sua reestruturação, atualizando a classificação dos perfis de solo que a constituem, seguida de uma avaliação quanto à sua representatividade e potencial para análises qualitativas. Para isso, os dados foram organizados em formato de banco de dados e a classificação pedológica atualizada de acordo com a versão mais recente do Sistema Brasileiro de Classificação de Solos, até o quarto nível categórico. Essa atualização foi, em geral, bastante satisfatória, sobretudo nos três primeiros níveis hierárquicos, com maiores restrições no subgrupo, conforme a análise dos graus de confiabilidade adotados para expressar a exatidão no ajuste do enquadramento taxonômico. Desse modo, ao suprir a carência de uma nomenclatura unificada e ajustada aos critérios atuais que regem a classificação de solos no Brasil, constituiu-se um banco de dados comparável qualitativamente com variáveis externas, como distribuição geográfica, altitude e tipos climáticos. As avaliações realizadas a partir dessa base evidenciaram uma boa representatividade da distribuição dos perfis na grande maioria dos estados da federação, assim como em relação às condições ambientais representadas por zonas e tipos climáticos da classificação de Köppen. Entretanto, não foram constatadas correlações estreitas entre estas variáveis e as classes de solo em nível de ordem, embora algumas tendências gerais tenham sido observadas, como uma significativa proporção de perfis de Vertissolos e Luvissolos sob clima semi-árido (BS). De forma semelhante, a altitude de onde ocorrem as classes de solos foi também muito variável, mas os valores de quartis e mediana indicaram algumas faixas preferenciais. Assim, Cambissolos e Latossolos tendem a ocupar os níveis mais altos da paisagem brasileira, ao passo que 75 % dos perfis de Espodossolos e de Plintossolos situam-se em cotas inferiores a 200 m. Além das potencialidades de uso evidenciadas, a estruturação atual da base de dados permite outras aplicações para atender necessidades específicas de estudo, inclusive no que tange a investigações relacionadas ao sistema de classificação de solos que vem sendo desenvolvido no país.
Resumo:
A agilidade e eficiência de um bando de informação de um jornal são fundamentais para assegurar a atualidade e credibilidade do próprio jornal. Este artigo tem a finalidade de apresentar e descrever o funcionamento do Banco de Dados do jornal Zero Hora. Usando tecnologia avançada, seus sistemas de processamento, armazenamento, controle, recuperação e disseminação da informação permitem gerenciar as bases de dados e material informacional em texto e imagem
Resumo:
Apresenta a experiência do SIBi/USP no desenvolvimento do seu Projeto de Modernização, com ênfase na automação de acervos e serviços, para concretizar a interconectividade com outras instituições, ampliando a abrangência de acesso à informação e otimizando o atendimento das demandas dos usuários. A base principal do trabalho é o aperfeiçoamento da qualidade do seu Banco de Dados Bibliográficos DEDALUS, com a instalação de software de funções integradas (Aleph) e de equipamentos adequados ao seu funcionamento, permitindo, assim, a expansão do formato de intercâmbio (MARC) e a conversão retrospectiva dos registros armazenados no Banco. São incluídos tópicos de gerenciamento do Sistema relativos à manutenção de coleções, à capacitação de recursos humanos, ao trabalho cooperativo e compartilhado, preparando-o para atender as exigências atuais de acesso e intercâmbio da informação, dentro das normas técnicas e políticas tecnológicas internacionais vigentes.
Resumo:
Os marcadores microssatélites são ferramentas úteis em diversas análises genéticas em plantas. No caso do mamoeiro (Carica papaya L.), poucos locos de microssatélites foram descritos até o momento. Assim, o objetivo deste trabalho foi explorar a base de dados do GenBank / NCBI (National Center of Biotechnoloy Information) à procura de microssatélites de mamoeiro, visando a seu futuro uso em estudos genéticos e moleculares aplicados ao melhoramento genético. As seqüências foram obtidas no GenBank / NCBI, no formato FASTA, e analisadas para a presença de microssatélites com um mínimo de 20; 7 e 5 repetições dos motivos de mono-, di- e trinucleotídeos, respectivamente, e acima de 4 repetições para tetra- e pentanucleotídeos. Seqüências com mais de 90% de similaridade foram consideradas redundantes e, portanto, eliminadas das análises. Foram analisadas 44.591 seqüências, das quais 3.180 foram não-redundantes e apresentaram 3.947 microssatélites. Desse total, 3.587 foram classificados como microssatélites perfeitos, 8 imperfeitos, 65 interrompidos, 239 compostos-perfeitos, 8 compostos-imperfeitos e 40 compostos-interrompidos. As repetições de di- e trinucleotídeos representaram 65,7 e 14,4% do total de seqüências analisadas, respectivamente. Somente os motivos do tipo AT/TA representaram 44,1% dos microssatélites encontrados. Os motivos mais comuns de tri-, tetra- e pentanucleotídeos foram AAT, AATT e TTTAA, respectivamente. Observou-se que, nas seqüências disponíveis, o genoma do mamoeiro apresenta, em média, um microssatélite a cada 5,65 kb.
Resumo:
Foi elaborado um sistema para gerenciamento informatizado dos testes de controle de qualidade exigidos pela Portaria 453/98 da Secretaria de Vigilância Sanitária do Ministério da Saúde, visando otimizar sua execução, armazenamento e interpretação. Os testes de controle de qualidade são parte do programa de garantia de qualidade que deve ser implantado em toda instalação de radiodiagnóstico médico e odontológico. Para isso, foi elaborado um banco de dados utilizando o programa Microsoft Access®, permitindo comunicação direta com o sistema informatizado de gerenciamento das manutenções dos equipamentos de raios X, em implantação no Hospital Universitário Clementino Fraga Filho da Universidade Federal do Rio de Janeiro.