94 resultados para Infra-estrutura de dados espaciais


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Este trabalho é uma pesquisa sobre os investimentos urbanos realizados pela Administração Popular de Porto Alegre, Rio Grande do Sul, Brasil, entre 1991 e 2000. A pesquisa objetiva investigar se os investimentos urbanos realizados em abastecimento de água, esgoto, habitação e transporte, foram planejados e se a Administração Popular, ao contrário de suas declarações, fez planejamento urbano nesse período. Além disso, procura apreender o papel e a importância que o planejamento urbano tem para a Administração Popular no discurso das três primeiras gestões: Olívio Dutra, Tarso Genro e Raul Pont.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Os Sistemas de Informação Geográfica (SIG) são construídos, especificamente, para armazenar, analisar e manipular dados geográficos, ou seja, dados que representam objetos e fenômenos do mundo real, cuja localização em relação à superfície da Terra seja considerada. A interoperabilidade desses sistemas, que constitui-se na capacidade de compartilhar e trocar informações e processos entre ambientes computacionais heterogêneos, se faz necessária, pois, devido ao elevado custo de aquisição dos dados geográficos, as comunidades de informação precisam compartilhar dados de fontes existentes, sem a necessidade de fazer conversões. Porém, pela complexidade e incompatibilidades de representação, de estrutura e de semântica das informações geográficas, a maioria dos softwares de SIG, hoje, não são interoperáveis. Existe também, além do problema da não interoperabilidade, uma crescente preocupação com relação à qualidade e à integridade espacial dos dados geográficos. Contudo, alguns modelos conceituais de dados geográficos e os softwares de SIG não oferecem, ainda, os meios adequados para representar e garantir a integridade espacial das informações. As restrições de integridade definidas durante a fase de projeto conceitual, normalmente, são implementadas durante o projeto físico, seja de forma implícita ou explícita, podendo ser incorporadas diretamente no modelo de implementação do SIG, de forma que o usuário da aplicação apenas mencione a regra e o sistema a implemente e a garanta automaticamente.Este trabalho de pesquisa propõe uma extensão ao Modelo Abstrato OpenGIS, modelo este que deve ser um padrão de interoperabilidade de software para SIG. A extensão proposta incorpora ao mesmo um subconjunto de tipos de restrição espacial, buscando com isso oferecer melhor suporte às regras da realidade geográfica expressáveis na modelagem conceitual do sistema.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Hipertrofia ventricular esquerda é um importante fator de risco em doença cardiovascular e pode ser responsável por parte do elevado risco cardiovascular associado a diabetes. Apesar de que o estresse hemodinâmico seja classicamente indicado como causa da injúria miocárdica que leva ao remodelamento, a injúria associada aos fatores neuro-humorais e a sinalização celular através da ativação imuno-inflamatória também desempenham um papel, acompanhando os mecanismos recentemente descritos na síndrome metabólica, particularmente na obesidade, onde a ativação do sistema imune inato leva a uma resposta inadequada crônica mediada por citocinas em diversos sistemas corpóreos. A ecocardiografia tem sido usada para identificar anormalidades da estrutura cardíaca, porém, variações metodológicas e os diversos ajustes para os determinantes da massa ventricular como idade, sexo, tamanho corporal e outros correlatos clínicos são motivo de debate, assim como a definição dos estados de anormalidade, tanto para hipertrofia ventricular esquerda, como para outras medidas da estrutura ventricular. Em uma amostra populacional de 1479 Afro- Americanos do Estudo ARIC, investigamos de forma estratificada e multivariada as associações independentes entre diabetes e as alterações estruturais do ventrículo esquerdo, definidas por hipertrofia ventricular, aumento da espessura relativa e padrões geométricos anormais. Encontramos prevalências elevadas dea alterações estruturais nos indivíduos com diabetes. Diabetes associou-se com hipertrofia ventricular em ambos os sexos e com espessura parietal aumentada e padrões geométricos anormais nas mulheres. Na maior parte dos modelos, as associações com diabetes foram minimizadas com os ajustes para obesidade, sugerindo que o impacto da obesidade sobre as alterações estruturais vistas em diabetes pode ser mediado por fatores outros do que a hiperglicemia. Essas novas evidências estão em sintonia com o conhecimento contemporâneo descrito.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Apresenta-se uma formulação do tipo incrementaliterativa destinada a análise não linear de pórticos espaciais. Considera-se os efeitos não lineares introduzidos pelas mudanças de configuração geométrica da estrutura e também pela combinação destes efeitos com aqueles inerentes ao comportamento plástico exibido pelo material. As relações cinemáticas empregadas permitem a consideração de deslocamentos arbitrariamente grandes, acompanhadas de pequenas deformações . A modelagem do comportamento plástico do material é efetuada através do conceito de rótula plástica, estabelecido a partir de um critério de plastificação generalizado. Adota-se uma matriz de rigidez geométrica de barra baseada em momentos semitangenciais. Para elementos com extremos plastificados, é deduzida uma matriz de rigidez elasto-plástica. Emprega-se um método numérico do tipo incremental-iterativo, que utiliza como condição básica de controle da análise a constância do trabalho realizado pelos incrementos de cargas, em cada passo incremental (Método de Controle por Trabalho).A formulação permite uma descricão completa do desempenho mecânico da estrutura, inclusive em estágio de deformação pós-crítico em que ocorre regressão do carregamento com aumento de deslocamentos, ou vice-versa. A formulação foi implementada em um programa computacional elaborado em linguagem FORTRAN. Vários exemplos numéricos são apresentados para mostrar a eficiência das procedimentos propostos.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Esta tese apresenta contribuições ao processo de Descoberta de Conhecimento em Bases de Dados (DCBD). DCBD pode ser entendido como um conjunto de técnicas automatizadas – ou semi-automatizadas – otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o já, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que o tornam mais fácil de ser realizado. A partir dessa visão, bem conhecidos algoritmos de Estatística e de Aprendizado de Máquina passam a funcionar com desempenho aceitável sobre bases de dados cada vez maiores. Da mesma forma, tarefas como coleta, limpeza e transformação de dados e seleção de atributos, parâmetros e modelos recebem um suporte que facilita cada vez mais a sua execução. A contribuição principal desta tese consiste na aplicação dessa visão para a otimização da descoberta de conhecimento a partir de dados não-classificados. Adicionalmente, são apresentadas algumas contribuições sobre o Modelo Neural Combinatório (MNC), um sistema híbrido neurossimbólico para classificação que elegemos como foco de trabalho. Quanto à principal contribuição, percebeu-se que a descoberta de conhecimento a partir de dados não-classificados, em geral, é dividida em dois subprocessos: identificação de agrupamentos (aprendizado não-supervisionado) seguida de classificação (aprendizado supervisionado). Esses subprocessos correspondem às tarefas de rotulagem dos itens de dados e obtenção das correlações entre os atributos da entrada e os rótulos. Não encontramos outra razão para que haja essa separação que as limitações inerentes aos algoritmos específicos. Uma dessas limitações, por exemplo, é a necessidade de iteração de muitos deles buscando a convergência para um determinado modelo. Isto obriga a que o algoritmo realize várias leituras da base de dados, o que, para Mineração de Dados, é proibitivo. A partir dos avanços em DCBD, particularmente com o desenvolvimento de algoritmos de aprendizado que realizam sua tarefa em apenas uma leitura dos dados, fica evidente a possibilidade de se reduzir o número de acessos na realização do processo completo. Nossa contribuição, nesse caso, se materializa na proposta de uma estrutura de trabalho para integração dos dois paradigmas e a implementação de um protótipo dessa estrutura utilizando-se os algoritmos de aprendizado ART1, para identificação de agrupamentos, e MNC, para a tarefa de classificação. É também apresentada uma aplicação no mapeamento de áreas homogêneas de plantio de trigo no Brasil, de 1975 a 1999. Com relação às contribuições sobre o MNC são apresentados: (a) uma variante do algoritmo de treinamento que permite uma redução significativa do tamanho do modelo após o aprendizado; (b) um estudo sobre a redução da complexidade do modelo com o uso de máquinas de comitê; (c) uma técnica, usando o método do envoltório, para poda controlada do modelo final e (d) uma abordagem para tratamento de inconsistências e perda de conhecimento que podem ocorrer na construção do modelo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este trabalho tem por objetivo mostrar a adaptação das estratégias de uma empresa fornecedora de equipamentos de transmissão de dados, a PARKS S/A COMUNICAÇÕES DIGITAIS, frente às mudanças do mercado de telecomunicações no Brasil Através de uma análise de caso, evidenciaram-se as mudanças ocorridas no mercado de telecomunicações, a percepção desta empresa para tais mudanças e a orientação estratégica adotada para os seus próprios setores, a saber, o comercial, o industrial, o financeiro, o de recursos humanos e qualidade e o de engenharia. O estudo das mudanças ocorridas neste mercado abrangeu dois períodos, quais sejam, o anterior à privatização e os anos de 1997 até 2000, ressaltando-se, porém, que a análise se centrou neste último, o qual foi analisado mais detalhadamente. Uma vez identificadas as principais mudanças ocorridas na empresa escolhida para o estudo de caso - PARKS S/A Comunicações -, através de observação e da vivência do autor, bem como de contribuições relatadas por colegas da empresa, igualmente participantes do processo, este trabalho analisa estas mudanças uma a uma, mostrando o reflexo das mesmas na estrutura da empresa, procurando explicar como se deu o fenômeno e, assim, contribuindo para a compreensão de processos análogos que venham a ocorrer em um futuro próximo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este trabalho trata sobre as relações entre estratégias e estrutura organizacional. Trata-se de uma pesquisa na área de organizações que toma como foco de atenção os conceitos de estratégia, estrutura e as diferentes formulações teóricas resultantes de pesquisas situadas na literatura especializada. Procurou-se analisar, através de um estudo de caso, a existência de relações de mudança e adequação de uma categoria analítica sobre a outra, ocorrida na Empresa de Pesquisa, Assistência Técnica e Extensão Rural de Mato Grosso do Sul (EMPAER-MS) no período de 1990 a 1998. De acordo com os objetivos específicos formulados, as estratégias desenvolvidas no período delimitado, foram caracterizadas por meio das variáveis de Portfólio, Tecnologia e Orientação para o Mercado. A estrutura organizacional foi caracterizada através das variáveis relativas a Dispersão Espacial, Estrutura de Decisões e Capacidade Administrativa e Produtiva. A verificação das relações de mudança e adequação de uma variável sobre a outra, se deu a partir do cruzamento de todos os resultados obtidos no levantamento de dados, utilizando o método de categorização. Para análise do processo de mudança estratégica, utilizou-se como pano de fundo a influência de fatores de natureza cognitiva e de natureza institucional. A pesquisa caracteriza-se como seccional com avaliação longitudinal, sendo a análise de dados predominantemente qualitativa. Os resultados obtidos, evidenciaram que as relações entre as estratégias desenvolvidas pela empresa com a sua estrutura organizacional são complementares. No entanto, a estrutura organizacional apresentou-se, no período examinado, inadequada em relação as estratégias. Tal situação, vêm comprometendo um melhor alinhamento da empresa às demandas do mercado. Finalmente, elaborou-se, com base nos resultados da pesquisa, um conjunto de medidas estratégicas para a empresa pesquisada.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Considerando não apenas a importância das antraciclinas na terapêutica do câncer, mas também os efeitos colaterais associados ao uso destas drogas, o presente estudo procurou avaliar a atividade genotóxica de seis antraciclinas em uso clínico - doxorrubicina (DOX), daunorrubicina (DNR), epirrubicina (EPI), idarrubicina (IDA), além dos análogos de última geração, pirarrubicina (THP) e aclarrubicina (ACLA). Para tanto, foi empregado o Teste de Mutação e Recombinação Somática (SMART) em Drosophila melanogaster, que permite a detecção simultânea de mutação gênica e cromossômica, assim como de eventos relacionados com recombinação mitótica - possibilitando quantificar a contribuição deste último parâmetro genético para a genotoxicidade total induzida pelas drogas em estudo. Os dados obtidos a partir desta análise demonstraram que todas as antraciclinas estudadas induziram acréscimos significativos, relacionados tanto à mutação, quanto à recombinação nas células somáticas deste inseto. Além disso, a recombinação mitótica - entre cromossomos homólogos - foi o evento responsável por, aproximadamente, 62 a 100% da toxicidade genética observada. A comparação do potencial genotóxico dos diferentes análogos, através da padronização do número de danos genéticos por unidade de tratamento (mM), caracterizou a ACLA e o THP como as drogas mais potentes – sendo cerca de 20 vezes mais efetivas, como genotoxinas, do que a DOX, o análogo menos potente. Já que a principal ação genotóxica desta família de compostos está relacionada à inibição da topoisomerase II (topo II) – uma enzima que atua no relaxamento da supertorção da dupla hélice de DNA, através da quebra e posterior religação de suas fitas - as diferenças observadas podem ser atribuídas ao mecanismo envolvido neste bloqueio Enquanto os análogos DOX, DNR, EPI, IDA e THP atuam como venenos de topo II - tornando permanentes as quebras induzidas pela enzima - a ACLA inibe a função catalítica desta enzima, impedindo a sua ligação ao DNA. Cabe ainda ressaltar que a genotoxicidade da ACLA não está restrita à sua atividade catalítica sobre a topo II, mas também à sua ação como veneno de topo I e à sua habilidade de intercalar-se na molécula de DNA. Quando a potência genotóxica destas drogas foi associada a suas estruturas químicas, observou-se que substituições no grupamento amino-açúcar levaram a uma maior atividade tóxico-genética, quando comparadas a modificações no cromóforo. Cabe ainda ressaltar que as modificações estruturais, presentes nos análogos DOX, DNR, EPI, IDA e THP, não alteraram a sua ação recombinogênica. No entanto, no que se refere a ACLA, observaram-se decréscimos significativos na indução de recombinação mitótica - que podem ser atribuídas às múltiplas substituições presentes tanto no grupamento amino-açúcar quanto no cromóforo. O conjunto destas observações evidencia que a genotoxicidade total das drogas em estudo está centrada na indução de recombinação homóloga - um evento predominantemente envolvido tanto na iniciação, quanto na progressão do câncer. A alta incidência de tumores secundários, em pacientes submetidos ao tratamento com as antraciclinas, pode, pois, ser atribuída à ação preferencial destas drogas sobre a recombinação mitótica – embora a atividade mutagênica não possa ser desconsiderada.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este trabalho tem por objetivo investigar e identificar a influência dos atributos que estruturam a escolha do transportador de carga geral fracionada pelos usuários, em uma determinada rota nacional, baseado na modelagem da demanda. xii A modelagem da demanda é efetuada com base em Modelos Comportamentais Desagregados, utilizando-se as técnicas de Preferência Declarada (Stated Preference), na obtenção dos dados. A determinação das preferências dos decisores são analisadas, buscandose assim quantificar o valor das variáveis que compõem o nível de serviço desejado pelos varejistas usuários. O estudo enfoca o comportamento do varejista usuário de serviços de transporte de cargas com relação a tomada de decisão sobre a transportadora que executará o serviço de transporte de carga. Esta tomada de decisão do varejista usuário leva em consideração que cada operador valoriza os atributos em diferentes graus e que estes fazem parte do nível de serviço de cada transportadora. As técnicas de Preferência Declarada forneceram dados para estimar as funções de Utilidade levando em consideração os diferentes níveis de atributos de cada transportadora. A partir da função de Utilidade de cada transportadora, é estimada a probabilidade de escolha de cada transportadora. A modelagem permite a realização de simulações, a partir de alterações no grau dos atributos das variáveis do modelo, na qual se determinará a parcela de mercado de cada transportadora e a sua respectiva participação no mercado em estudo. Dentre os principais resultados, pode se observar que a modelagem da demanda em transporte de cargas, apesar de pouco utilizada, é coerente com a realidade analisada, validando a metodologia utilizada neste estudo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O objetivo dedste trabalho é investigar o projeto de banco de dados aplicado a Sistemas de Informações Geográficas (SIG), mais especificamente, do mapeamento de esquemas conceituais, orientado a objetos, para esquemas lógicos implementados por softwares de SIG comerciais. A transformação dos esquemas conceituais para os lógicos é realizado através da idedntificação de um conjunto de regras genéricas de mapeamento de qualquer esquema concecitual de banco de dados geográficos, baseados em um framework conceitual, para os esquemas lógicos proprietários dos diversos SIG existentes. A concretização desta tarefa de transformação é possível mediante a proposta de um ambiente de suporte. Esse ambiente fornece uma estrutura específica, constituída por uma linguagem formal, definida pelo padrão SAIF (Saptial Archive and Interchange Format), pela ferramenta FME (feature Manipulation Engine) e pela ferramenta CASE Rational Rose v.2000e. O conjunto de regras genéricas elaborado neste trabalho, é composto por dois subconjuntos. O primeiro define regras de correspondência, determinando uma relação entre os conceitos da realidade percebidos pelo Framework conceitual e a linguagem formal apresentada pelo padrão SAIF. O segundo subconjunto define regras de transformação, onde busca-se mapear os conceitos do paradigma da orientação a objetos par aos conceitos relacionais utilizazdos pela maioria dos softwares de SIG, disponíveis no mercado. Com a finalidade de validar a aplicabilidadee deste conjunto de regras de mapeamento e do ambiente de suporte proposto, este trabalho inclui também a implementação de um protótipo, o qual executa a automatização da trasnformação dos esquemas conceituais para os esquemas lógicos de banco de dados geográfico.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

As lagoas costeiras em geral exibem reduzidas profundidades máximas, sendo portanto, ambientes altamente vulneráveis às oscilações dos fatores climáticos, em particular o vento. Movimentos da água em zonas pelágicas são fortemente influenciados por mudanças no tempo, as quais promovem mudanças no plâncton. A biomassa é uma importante variável em ecossistemas aquáticos uma vez que representa a quantidade de energia estocada em certo nível trófico da comunidade biológica. O trabalho teve como hipótese principal do trabalho que o vento (principal fator determinante na hidrodinâmica da Lagoa Itapeva), influencia diretamente a biomassa fitoplanctônica. Períodos de ausência de ventos ou ventos fracos provocam uma homogeneidade da comunidade, devido á estabilidade da coluna d’água, propiciando eventos de florações com alta biomassa e baixa diversidade. Outra hipótese formulada é que há variação espaço-temporal da biomassa, da diversidade de espécies e das diferentes frações de tamanho na Lagoa Itapeva, no período estudado. O objetivo do trabalho foi determinar o efeito do vento, principal fator hidrodinâmico da Lagoa Itapeva, sobre a comunidade fitoplanctônica em termos de biomassa, diversidade de espécies e categorias de tamanho. A Lagoa Itapeva é a primeira lagoa do Sistema Lagunar de Tramandaí no sentido N→S. Foram realizadas análises espaciais, formando-se três pontos de amostragem (Norte, Centro e Sul) ao longo do maior eixo longitudinal da lagoa, aliada a uma escala temporal diária (turnos de amostragem: 6h, 10h, 14h e 18h) e sazonal (quatro estações do ano), procurando estabelecer padrões e relações com os fatores hidrodinâmicos (velocidade e direção de vento, e nível d’água). Durante o estudo a Divisão Cyanophyta foi a responsável pelos elevados valores de biomassa observados nos pontos de amostragem. Este fato deve-se principalmente às florações de Anabaena circinalis durante as campanhas sazonais. A biomassa foi a variável que melhor se relacionou com os fatores físicos (nível d’água e velocidade média do vento) pela ação dos ventos de quadrantes predominantes que resultavam num fetch efetivo longo. Neste estudo foram apresentados índices de diversidade de espécies calculados através de indivíduos (H’ind) e de biomassa (H’ biom). Estes índices apresentaram estreitas relações positivas entre si. Os índices também apresentaram relações diretas e significativas com os fatores físicos (nível d’água e velocidade média do vento). Na Lagoa Itapeva, a contribuição das diferentes categorias de tamanho em função da biomassa (estimada através do biovolume), ressaltou três frações que melhor representaram a comunidade fitoplanctônica: nanoplâncton, microplâncton e netplâncton. A fração netplanctônica predominou sobre as demais frações de tamanho. A predominância desta fração sobre as outras estudadas deu-se principalmente às espécies de colônias filamentosas Aulacoseira granulata, Anabaena circinalis e A. spiroides. O comportamento da comunidade fitoplanctônica na Lagoa Itapeva sugere estar de acordo com a Hipótese de Distúrbio Intermediário de Connell (1978). Os distúrbios intensos (provocados pelos forte ventos e fetch longo) ou a falta deste (criando um ambiente estável), nos pontos de amostragem, resultaram em florações da cianobactéria Anabaena circinalis. Essas florações proveram uma densa biomassa em todo o período da pesquisa, além de promoverem a baixa diversidade através do domínio desta cianobactéria, e provocar sucessões das frações de tamanho do fitoplâncton.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Nos Sistemas de Informação Geográfica (SIG), os aspectos temporais são importantes, principalmente, para representar o histórico de dados georreferenciados. Vários modelos conceituais de dados para SIG propõem classes e operações que permitem representar os aspectos espaciais e temporais das aplicações. Porém, ao nível do modelo interno dos sistemas atuais, as estruturas de dados armazenam e manipulam somente os aspectos espaciais dos dados geográficos, não contemplando os aspectos espaço-temporais propostos nos modelos conceituais. O objetivo desse trabalho é estender estruturas de dados do tipo quadtree para suporte ao armazenamento e à recuperação de dados espaço-temporais.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A Descoberta de Conhecimento em Banco de Dados (DCBD) é uma nova área de pesquisa que envolve o processo de extração de conhecimento útil implícito em grandes bases de dados. Existem várias metodologias para a realização de um processo de DCBD cuja essência consiste basicamente nas fases de entendimento do domínio do problema, pré-processamento, mineração de dados e pós-processamento. Na literatura sobre o assunto existem muitos trabalhos a respeito de mineração de dados, porém pouco se encontra sobre o processo de pré-processamento. Assim, o objetivo deste trabalho consiste no estudo do pré-processamento, já que é a fase que consome a maior parte do tempo e esforço de todo o processo de DCBD pois envolve operações de entendimento, seleção, limpeza e transformação de dados. Muitas vezes, essas operações precisam ser repetidas de modo a aprimorar a qualidade dos dados e, conseqüentemente, melhorar também a acurácia e eficiência do processo de mineração. A estrutura do trabalho abrange cinco capítulos. Inicialmente, apresenta-se a introdução e motivação para trabalho, juntamente com os objetivos e a metodologia utilizada. No segundo capítulo são abordadas metodologias para o processo de DCBD destacando-se CRISP-DM e a proposta por Fayyad, Piatetsky-Shapiro e Smyth. No terceiro capítulo são apresentadas as sub-fases da fase de pré-processamento contemplando-se entendimento, seleção, limpeza e transformação de dados, bem como os principais métodos e técnicas relacionados às mesmas. Já no quarto capítulo são descritos os experimentos realizados sobre uma base de dados real. Finalmente, no quinto capítulo são apresentadas as considerações finais sobre pré-processamento no processo de DCBD, apontando as dificuldades encontradas na prática, contribuições do presente trabalho e pretensões da continuidade do mesmo. Considera-se como principais contribuições deste trabalho a apresentação de métodos e técnicas de pré-processamento existentes, a comprovação da importância da interatividade com o especialista do domínio ao longo de todo o processo de DCBD, mas principalmente nas tomadas de decisões da fase de pré-processamento, bem como as sugestões de como realizar um pré-processamento sobre uma base de dados real.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

XML é um padrão da W3C largamente utilizado por vários tipos de aplicações para representação de informação semi-estruturada e troca de dados pela Internet. Com o crescimento do uso de XML e do intercâmbio de informações pela Internet é muito provável que determinadas aplicações necessitem buscar uma mesma informação sobre várias fontes XML relativas a um mesmo domínio de problema. No intuito de representar a informação dessas várias fontes XML, o programador é obrigado a escolher entre muitas estruturas hierárquicas possíveis na criação dos esquemas de seus documentos XML. Um mesmo domínio de informação, desta maneira, pode então ser representado de diferentes formas nas diversas fontes de dados XML existentes. Por outro lado, verifica-se que as linguagens de consulta existentes são fortemente baseadas no conhecimento da estrutura de navegação do documento. Assim, ao consultar uma determinada informação semanticamente equivalente em várias fontes é necessário conhecer todos os esquemas envolvidos e construir consultas individuais para cada uma dessas fontes. Em um ambiente de integração, entretanto, é possível gerar um modelo global que representa essas fontes. Ao construir consultas sobre um modelo global, temos consultas integradas sobre estas fontes. Para se atingir esse objetivo, contudo, devem ser resolvidos os problemas da heterogeneidade de representação dos esquemas XML. Dessa forma, com base em uma abordagem de integração de esquemas, o presente trabalho define a linguagem de consulta CXQuery (Conceptual XQuery) que possibilita a construção de consultas sobre um modelo conceitual. Para possibilitar o retorno dos dados das fontes nas consultas feitas em CXQuery, foi desenvolvido um mecanismo de tradução da linguagem CXQuery para a linguagem de consulta XQuery 1.0. A linguagem XQuery 1.0 é umas das linguagens mais utilizadas para o acesso as fontes XML e permite que os dados possam ser retornados ao usuário. Para possibilitar essa tradução, foi definida uma metodologia de representação da informação de mapeamento através de visões XPath. Essa metodologia é relativamente eficaz no mapeamento das diferentes representações das fontes XML.