999 resultados para Extracao : Dados


Relevância:

70.00% 70.00%

Publicador:

Resumo:

Extração de dados é o processo utilizado para obter e estruturar informações disponibilizaadas em documentos semi-estruturados (ex.: páginas da Web). A importâmncia da extrtação de dados vem do fato que, uma vez extraídos, os dados podem ser armazenados e manipulados em uma forma estruturada. Dentre as abordagens existentes para extração de dados, existe a abordagem de extração baseada em ontologias. Nesta abordagem, ontologias são preciamente criadas para descrever um domínio de interesse, gerando um modelo conceitual enriquecido com informações necessárias para extração de dados das fontes semi-estruturadas. A ontologia é utilizada como guia ara um programa (¨parser¨) que executa a extração de dados dos documentos ou páginas fornecidos como enetrada. Oprocesso de criação da ontologia não é uma tarefa trtivial e requer um cuidado trabalho ee análise dos documentos ou páginas fontes dos dados. Este trabalho é feito manualmente por usuários especialistas no domínio de interesse da ontologia. Entretanto, em algumas situações os dados que se desejam extrair estão modelados em bancos de dados relacionais. Neste caso, o modelo realcional do banco de dados por ser utilizado para constrtução do modelo conceitual na ontologia. As instâncias dos dados armazenados neste mesmo banco podem ajudar a gerar as informações sobre conteúdo e formato dos dados a serem extraídos. Estas informações sobre conteúdo e formato de dados, na ontologia, são representadas por expressões regulares e estão inseridas nos chamados "data frames". O objetivo deste trabalho é apresentar um método para criação semi-automática de ontologias de extração a partir das informações em um banco de dados já existente. O processo é baseado na engenharia reversa do modelo relacional para o modelo conceitual da ontologia combinada com a análise das instâncias dos dados para geração das expressões regulares nos "data frames".

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Existem vários trabalhos na área de extração de dados semi-estruturados, usando diferentes técnicas. As soluções de extração disponibilizadas pelos trabalhos existentes são direcionadas para atenderem a dados de certos domínios, considerando-se domínio o conjunto de elementos pertencentes à mesma área de interesse. Dada a complexidade e a grande quantidade dos dados semi-estruturados, principalmente dos disponíveis na World Wide Web (WWW), é que existem ainda muitos domínios a serem explorados. A maior parte das informações disponíveis em sites da Web está em páginas HTML. Muitas dessas páginas contêm dados de certos domínios (por exemplo, remédios). Em alguns casos, sites de organizações diferentes apresentam dados referentes a um mesmo domínio (por exemplo, farmácias diferentes oferecem remédios). O conhecimento de um determinado domínio, expresso em um modelo conceitual, serve para definir a estrutura de um documento. Nesta pesquisa, são consideradas exclusivamente tabelas de páginas HTML. A razão de se trabalhar somente com tabelas está baseada no fato de que parte dos dados de páginas HTML encontra-se nelas, e, como conseqüência, elimina-se o processamento dos outros dados, concentrando-se os esforços para que sejam processadas automaticamente. A pesquisa aborda o tratamento exclusivo de tabelas de páginas HTML na geração das regras de extração, na utilização das regras e do modelo conceitual para o reconhecimento de dados em páginas semelhantes. Para essa técnica, foi implementado o protótipo de uma ferramenta visual denominado Gerador de Regras de Extração e Modelo Conceitual (GREMO). GREMO foi desenvolvido em linguagem de programação visual Delphi 6.0. O processo de extração ocorre em quatro etapas: identificação e análise das tabelas de informações úteis em páginas HTML; identificação de conceitos para os elementos dos modelos conceituais; geração dos modelos conceituais correspondentes à página, ou utilização de modelo conceitual existente no repositório que satisfaça a página em questão; construção das regras de extração, extração dos dados da página, geração de arquivo XML correspondente aos dados extraídos e, finalmente, realimentação do repositório. A pesquisa apresenta as técnicas para geração e extração de dados semi-estruturados, as representações de domínio exclusivo de tabelas de páginas HTML por meio de modelo conceitual, as formas de geração e uso das regras de extração e de modelo conceitual.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Analisa o resultado das eleições federais, estaduais e municipais, realizadas no Brasil em 1952, 1954 e 1955, confrontando com dados estatísticos de eleições anteriores.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria de Orçamento e Fiscalização Financeira.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Área XVI - Saúde Pública, Sanitarismo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Área XII - Recursos Minerais, Hídricos e Energéticos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Descreve a proposição, a aplicação e a avaliação de um método de classificação temática em uma base de dados com discursos proferidos por deputados federais no plenário da Câmara dos Deputados da República Federativa do Brasil entre outubro de 2000 e outubro de 2002, indexada com auxílio de um vocabulário controlado.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Analisa os instrumentos de que dispõe os artigos 15 a 17 da Lei de Responsabilidade Fiscal no controle dos gastos públicos. Objetiva conhecer melhor a sistemática de conferência dos dados do Relatório de Gestão Fiscal - RGF, bem como do cumprimento das exigências dos artigos 16 e 17 da Lei de Responsabilidade Fiscal e aprimorar o trabalho executado no âmbito da Coordenação de Auditoria Contábil e Operacional da Secretaria de Controle Interno da Câmara dos Deputados.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A desorganização de dados em bancos de dados automatizados implica em ineficiência operacional causada por redundâncias, inconsistências, baixo reuso, riscos informacionais, enfim, menor valor agregado da TI aos objetivos organizacionais. Apoiado por técnicas de gerenciamento de projetos, busca-se em um estudo de caso na Câmara dos Deputados a otimização da organização dos dados em bancos de dados automatizados.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta dados estatísticos sobre o resultado das eleições municipais realizadas em 1972.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Trata das eleições federais e estaduais, realizadas em 3 de outubro de 1954 e 1955 , com quadros sinópticos, relação nominal dos eleitos e suplentes e dados sobre o eleitorado por municípios.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta dados estatísticos e quadros sinópticos das eleiçõs federais e estaduais no Brasil em 1962.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Reúne os quadros comparativos das eleições realizadas nas diversas circunscrições, entre 1945 e 1963. Representa o conjunto das publicações anteriormente feitas pelo Tribunal Superior Eleitoral. Está dividido em cinco partes: eleições federais, eleições estaduais, quadro comparativo dos quocientes eleitorais, observações sobre os partidos extintos e eleições municipais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta dados estatístico referentes às eleições federais e estaduais de 3 de outubro de 1950, com base nos estudos estatísticos do Tribunal Superior Eleitoral.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Trata das eleições federais e estaduais, realizadas em 1974. Contém quadros comparativos dos pleitos de 1945 a 1974.