999 resultados para Estrutura de dados


Relevância:

30.00% 30.00%

Publicador:

Resumo:

O objetivo do presente trabalho foi caracterizar, em três épocas, a comunidade de plantas presentes em áreas de cultivo de abacateiro e de nogueira pecan, localizadas na Fazenda Experimental Lageado, da FCA-UNESP, município de Botucatu-SP. Em decorrência da arquitetura da copa e do caráter decíduo das nogueiras, esta área apresenta-se mais ensolarada, o que produz condições ambientais diferentes entre as duas áreas estudadas. Foi estabelecida uma grade retangular composta de 55 parcelas quadradas, contíguas, com 5 m de lado, havendo 40 parcelas sob os abacateiros e 15 sob as nogueiras. As coletas foram realizadas em março, maio e agosto de 1993, quando foram sorteados quadrados de 1x 1 m em cada parcela, de forma a não haver coincidência entre as amostragens realizadas em cada época. Foram levantadas as espécies ocorrentes, sua porcentagem de cobertura e freqüência. Os dados foram analisados através de métodos multivariados, utilizando-se a Análise de Agrupamento para as seis situações (3 épocas x 2 ambientes). Foram coletadas, no total, 54 espécies, distribuídas em 38 gêneros e 19 famílias, sendo Asteraceae e Poaceae as que contribuíram com o maior número de espécies. A riqueza em espécies foi maior na área sob as nogueiras; em ambas as áreas, a riqueza foi maior na estação úmida. Sob os abacateiros, a porcentagem de cobertura total da comunidade apresentou pouca variação temporal, diferindo da área sob as nogueiras onde se observou flutuação deste parâmetro. O padrão de distribuição espacial, para quase todas as populações, foi do tipo agrupado. A similaridade florística foi maior entre as duas áreas dentro de cada época de coleta. A presença constante de espécies como Commelina nudiflora que contribuiu com valores elevados de cobertura nas três épocas de coleta, mostra a necessidade de utilizar métodos de controle permanentes na área do pomar estudado.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O estudo fitossociológico, se realizado em diferentes estratos verticais da floresta, fornece dados de grande valia para a compreensão da dinâmica da comunidade. Efetuou-se levantamento das espécies arbóreas presentes em diferentes estratos, em área de 6.000 m² de floresta madura, na Estação Ecológica dos Caetetus, Gália, SP. Foram utilizadas 60 parcelas de 10 x 10 m, para indivíduos com diâmetro do caule a 1,30 m acima do nível do solo (DAP) a partir de 5 cm (estrato superior); 10 x 2 m, para indivíduos com DAP entre 1 e 5 cm (estrato intermediário) e 60 sub-parcelas de 2 x 2 m, para indivíduos menores que 1 cm de DAP (estrato inferior). Verificou-se que a diversidade, a composição florística e a densidade relativa das espécies variam entre estratos. No estrato superior, com 1.080 indivíduos.ha-1 e área basal de 31,2 m².ha-1, encontraram-se 62 espécies (28 famílias), tendo sido as mais importantes, em ordem decrescente de IVI: Metrodorea nigra, Savia dictyocarpa, Ocotea indecora, Aspidosperma polyneuron e Trichilia catigua. O estrato intermediário apresentou-se com densidade de 3.525 indivíduos.ha-1, pertencentes a 30 espécies (17 famílias), sendo as mais importantes em ordem decrescente de IVI: Metrodorea nigra, Actinostemon concolor, Trichilia catigua, Aspidosperma polyneuron e Trichilia clausenii. No estrato inferior a densidade foi de 28.875 indivíduos.ha-1, pertencentes a 37 espécies (19 famílias), sendo as mais abundantes, em ordem decrescente de densidade relativa: Metrodorea nigra, Actinostemon concolor, Trichilia catigua, Aspidosperma polyneuron e Eugenia blastantha. Constatou-se que há espécies do estrato superior da floresta que não foram observadas em regeneração, especialmente heliófitas de estádios sucessionais iniciais (p. ex. Croton floribundus). Outras ocorreram com densidade relativa decrescente nos estratos inferiores (p. ex. Savia dictyocarpa e Ocotea indecora). Para outras espécies, as sementes germinaram, mas não se desenvolveram à sombra, estando ausentes no estrato intermediário (p. ex. Cariniana estrellensis). Observou-se, ainda, um grupo de espécies, de estádios sucessionais mais avançados, que apresentaram a mesma densidade relativa em todos os estratos (p. ex. Metrodorea nigra e Aspidosperma polyneuron).

Relevância:

30.00% 30.00%

Publicador:

Resumo:

As sinúsias herbáceas e arbustivas são componentes de comunidades florestais pouco pesquisados nas regiões tropicais e subtropicais. Neste trabalho foram estudadas a composição florística e a estrutura fitossociológica destas sinúsias em uma floresta arenosa (restinga) da Planície Costeira do Rio Grande do Sul, Brasil. Os dados fitossociológicos foram obtidos em 30 parcelas de 2 x 2 m. Em cada parcela anotou-se a presença e a altura máxima das espécies herbáceas e arbutivas, e a cobertura foi estimada pela escala de Causton. A composição florística total da área compreende 61 espécies, 52 gêneros e 33 famílias. As famílias que apresentaram mais de duas espécies foram: Poaceae, Commelinaceae, Orchidaceae, Piperaceae, Rubiaceae e Asteraceae. As formas de vida hemicriptófita e caméfita foram as mais representativas. A amostragem fitossociológica resultou em 26 espécies herbáceas e 10 arbustivas, pertencentes a 31 gêneros e 24 famílias. As espécies mais importantes foram Carex sellowiana Schlecht., Oplismenus hirtellus (L.) P. Beauv., Spathicarpa hastifolia Hook. (herbáceas), Pavonia sepium St.-Hil. e Justicia brasiliana Roth (arbustos). A diversidade e eqüidade específica, segundo os índices de Shannon (H') e Pielou (J) estimados pela freqüência, foram 2,98 e 0,84, respectivamente.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A diversidade, estrutura e distribuição espacial de palmeiras em um cerrado sensu stricto foi estudada. Os dados foram coletados em 21 parcelas de 20 × 50 m distribuídas aleatoriamente em 152 ha (400 × 3800 m). Os diâmetros foram adquiridos a 0,10 m acima do nível do solo. Registraram-se o estágio reprodutivo e a altura dos indivíduos. Foram identificadas seis espécies de palmeiras, totalizando 1671 indivíduos em 2,1 ha. A densidade total das espécies foi de 795,7 palmeiras.ha-1, destacando-se Syagrus flexuosa (Mart.) Becc. (41,2%), S. petraea (Mart.) Becc. (21,7%) e S. comosa (Mart.) Mart. (11,2%). As mais freqüentes foram S. flexuosa e Allagoptera leucocalyx (Drude) O. Kuntze. A área basal total foi de 0,51 m².ha-1. S. flexuosa teve o maior VI. A distribuição de alturas e diâmetros foi quase unimodal para todas as espécies. O coeficiente de correlação entre diâmetro e altura foi baixo (r = 0,0002 a 0,1247). Syagrus comosa apresentou a maior altura (380 cm). Butia archeri destacou-se em diâmetro (6,8-21 cm). Todas as espécies apresentaram-se férteis, destacando-se B. archeri (100%). Todas as espécies tiveram padrão de dispersão agregado. Uma classificação por TWINSPAN (autovalor 0,501), separou dois grupos: B. archeri, S. comosa e S. petraea, como preferenciais para um grupo de parcelas, e A. campestris, A. leucocalyx e S. flexuosa, como menos agregada. Conclui-se que o cerrado apresenta uma rica e abundante flora de palmeiras com diferenças morfológicas e estruturais que precisam ser melhor conhecidas para se determinarem padrões da diversidade e estrutura de palmeiras para o bioma.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

flora e características estruturais do estrato arbustivo-arbóreo. Um total de 131 espécies, 92 gêneros e 45 famílias foram registrados na área. As famílias com maior riqueza de espécies foram: Leguminosae, Myrtaceae, Rubiaceae, Annonaceae e Malpighiaceae, com 43% (56/131) das espécies e 38% (35/92) dos gêneros. Análise de dados sobre a similaridade florística, pelos índices de Jaccard (IJ) e Sørensen (IS), com 20 outros locais de cerrado (sensu lato) revelou que a área estudada tem mais espécies em comum com a vegetação de Mato Grosso e do Pantanal. A área estudada apresentou alta diversidade de espécies (H' = 3,75 nats.individuo-¹). Na pesquisa estrutural foi registrada uma densidade total de 1.653 individuos.ha-¹. A espécie mais importante foi Annona dioica A.St.-Hil. e a família foi Annonaceae. A importância da maioria das espécies foi pequena, considerando os valores de densidade, freqüência e dominância. Esses resultados, associados ao fato que a comunidade sofre perturbações ambientais constantes, justificam estudos e medidas de conservação em curto prazo para a área estudada.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O presente estudo avaliou a diversidade e estrutura da vegetação de fragmentos de floresta aluvial no Município de São Sebastião da Bela Vista, MG, e as principais variáveis ambientais que influenciam essa vegetação. Os estudos das variáveis ambientais (dados de amostras superficiais dos solos, nível freático no solo, cobertura do dossel e impactos ambientais) e da composição e estrutura da vegetação arbórea (DAP ³ 5 cm) foram conduzidos em 54 parcelas de 200 m², alocadas em floresta ciliar com influência aluvial e em cinco fragmentos de floresta aluvial. Nas parcelas, foram registrados 2.064 indivíduos pertencentes a 51 espécies. A análise de correspondência canônica detectou gradiente de distribuição das espécies arbóreas no eixo 1, de acordo com os valores no solo de: profundidade do nível freático, porcentagem de areia e argila e teores de Mg, matéria orgânica e H + Al. O eixo 2 esteve correlacionado com as variáveis cobertura do dossel e porcentagem de silte no solo. Estas variáveis ambientais ocasionaram a formação de grupos de parcelas, de acordo com a distribuição das espécies.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Substrato difusor de nutrientes (SDN) foi utilizado para determinar o efeito da adição de fósforo sobre o desenvolvimento do perifíton em uma represa rasa (Lago do IAG, PEFI, São Paulo). Três tratamentos (n = 2) foram delineados: controle (sem adição de fósforo) e dois com adição de fósforo (P1 = 0,1 M e P2 = 0,5 M KH2PO4). A superfície dos SDN foi revestida com malha de 20 µm para crescimento do perifíton. Coletas foram realizadas nos 15º, 20º, 25º e 30º dias de colonização. A acumulação de biomassa (massa orgânica, clorofila-a, biovolume total de algas) e de densidade total de algas não forneceu resposta significativa ao enriquecimento. Seis espécies de clorofíceas e uma de diatomáceas associaram-se à disponibilidade de fósforo. O estado nutricional do perifíton (%P, %N, N:P) demonstrou a limitação pelo fósforo, bem como reforçou a capacidade da comunidade na retenção do fósforo. Os atributos do perifíton foram mais sensíveis ao enriquecimento pelo fósforo, do que aos níveis de adição, indicando que a comunidade passou a ser limitada pelo nitrogênio. A comparação com dados anteriores indicou aumento temporal (1996-2002) da disponibilidade de fósforo na represa, embora ainda prevalecendo condição P-limitante. O perifíton, por meio de seu estado nutricional e estrutura de espécies, foi sensível às alterações temporais de disponibilidade de fósforo e ao enriquecimento experimental, reforçando seu potencial como ferramenta avaliadora de sinais precoces de eutrofização.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este Artigo é o relato da descoberta de uma Estrutura do Valor Patrimonial . Independente quer dos «objectos» [documentos, colecções e museus] que foram sendo o Património, quer dos «usos» [expografias, representações, narrativas mediações e serviços] que lhe foram sendo dados nas épocas histórico - sociais que se sucederam no percurso humano. Este resultado remete, num primeiro momento, para a discussão de cinco qu estões - chave, cujas consequências para a Museologia se repercutem quer no plano teórico quer no plano prático. Sendo uma delas, a de substituir o «instinto de coleccionar» na teoria museológica

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O grupo das mulheres trabalhadoras do sexo (MTS) é reconhecido como uma populaçãode maior risco à infecção pelo HIV, tanto pela prevalência elevada, como por suavulnerabilidade social como pelos fatores relacionados à própria atividade profissional. Porém, arealização de estudos nos subgrupos de maior risco ao HIV mediante estratégias convencionaisde amostragem é, em geral, problemática por essas populações possuírem pequena magnitudeem termos populacionais e por estarem vinculados a comportamentos estigmatizados ouatividades ilegais. Em 1997, foi proposto um método de amostragem probabilística parapopulações de difícil acesso denominado Respondent-Driven Sampling (RDS). O método éconsiderado como uma variante da amostragem em cadeia e possibilita a estimação estatísticados parâmetros de interesse. Na literatura internacional, para análise de dados coletados porRDS, muitos autores têm utilizado técnicas estatísticas multivariadas tradicionais, sem levar emconta a estrutura de dependência das observações, presente nos dados coletados por RDS.A presente tese tem por objetivo contribuir para suprir informações sobre as práticas derisco relacionadas ao HIV entre as mulheres trabalhadoras do sexo (MTS) com odesenvolvimento de método estatístico para análise de dados coletados com o método deamostragem RDS. Com tal finalidade, foram utilizadas as informações coletadas na PesquisaCorrente da Saúde realizada em dez cidades brasileiras, com 2.523 MTS recrutadas por RDS,entre os anos de 2008 e 2009. O questionário foi autopreenchido e incluiu módulos sobrecaracterísticas da atividade profissional, práticas sexuais, uso de drogas, testes periódicos deHIV, e acesso aos serviços de saúde.Primeiramente, foram descritos alguns pressupostos do RDS e todas as etapas deimplantação da pesquisa. Em seguida, foram propostos métodos de análise multivariada, considerando o RDS como um desenho complexo de amostragem.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A atuação do enfermeiro em Saúde Coletiva deve estar voltada para o planejamento da assistência de enfermagem, num modelo capaz de, enfocar o ser humano como um todo, como a Sistematização da Assistência de Enfermagem (SAE), caracterizada pelas etapas: histórico, diagnósticos, prescrição e evolução de enfermagem. O objetivo deste estudo foi identificar a estrutura de organização da SAE nos registros de prontuários dos usuários de risco atendidos em Saúde Coletiva, no Programa de Saúde da Família numa Unidade Básica de Saúde de um município da Região Metropolitana de São Paulo. O método quantitativo, exploratório, descritivo com coleta de dados secundários foi utilizado para compreender a realidade estudada. A coleta de dados foi realizada em uma unidade de saúde da família da região metropolitana de São Paulo. Os registros realizados pelos enfermeiros em prontuários,utilizados como amostra deste estudo foram 116 prontuários de usuários acamados considerados de risco como, hipertensos e diabéticos. Os resultados foram divididos em três partes, nas quais houve a caracterização dos usuários, estrutura de registros de enfermagem no prontuário, e especificamente os elementos da SAE. Os resultados demonstraram que a maioria dos registros relativos ao histórico, diagnóstico, prescrição e evolução de enfermagem não estiveram presentes nos prontuários de pacientes de risco atendidos. No entanto, a anotação de enfermagem estava presente em sua maioria. A conclusão é que a estrutura de organização da SAE nos registros de enfermagem apresentava-se muito deficitária e que deve ser revista e melhorada, considerando-se ser o papel da enfermeira.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Esta tese apresenta contribuições ao processo de Descoberta de Conhecimento em Bases de Dados (DCBD). DCBD pode ser entendido como um conjunto de técnicas automatizadas – ou semi-automatizadas – otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o já, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que o tornam mais fácil de ser realizado. A partir dessa visão, bem conhecidos algoritmos de Estatística e de Aprendizado de Máquina passam a funcionar com desempenho aceitável sobre bases de dados cada vez maiores. Da mesma forma, tarefas como coleta, limpeza e transformação de dados e seleção de atributos, parâmetros e modelos recebem um suporte que facilita cada vez mais a sua execução. A contribuição principal desta tese consiste na aplicação dessa visão para a otimização da descoberta de conhecimento a partir de dados não-classificados. Adicionalmente, são apresentadas algumas contribuições sobre o Modelo Neural Combinatório (MNC), um sistema híbrido neurossimbólico para classificação que elegemos como foco de trabalho. Quanto à principal contribuição, percebeu-se que a descoberta de conhecimento a partir de dados não-classificados, em geral, é dividida em dois subprocessos: identificação de agrupamentos (aprendizado não-supervisionado) seguida de classificação (aprendizado supervisionado). Esses subprocessos correspondem às tarefas de rotulagem dos itens de dados e obtenção das correlações entre os atributos da entrada e os rótulos. Não encontramos outra razão para que haja essa separação que as limitações inerentes aos algoritmos específicos. Uma dessas limitações, por exemplo, é a necessidade de iteração de muitos deles buscando a convergência para um determinado modelo. Isto obriga a que o algoritmo realize várias leituras da base de dados, o que, para Mineração de Dados, é proibitivo. A partir dos avanços em DCBD, particularmente com o desenvolvimento de algoritmos de aprendizado que realizam sua tarefa em apenas uma leitura dos dados, fica evidente a possibilidade de se reduzir o número de acessos na realização do processo completo. Nossa contribuição, nesse caso, se materializa na proposta de uma estrutura de trabalho para integração dos dois paradigmas e a implementação de um protótipo dessa estrutura utilizando-se os algoritmos de aprendizado ART1, para identificação de agrupamentos, e MNC, para a tarefa de classificação. É também apresentada uma aplicação no mapeamento de áreas homogêneas de plantio de trigo no Brasil, de 1975 a 1999. Com relação às contribuições sobre o MNC são apresentados: (a) uma variante do algoritmo de treinamento que permite uma redução significativa do tamanho do modelo após o aprendizado; (b) um estudo sobre a redução da complexidade do modelo com o uso de máquinas de comitê; (c) uma técnica, usando o método do envoltório, para poda controlada do modelo final e (d) uma abordagem para tratamento de inconsistências e perda de conhecimento que podem ocorrer na construção do modelo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Conforme os sites Web crescem em número de páginas, sua manutenção torna-se mais complicada. Assim, os administradores dos sites de métodos e ferramentas que tornem sua manutenção mais organizada e automatizada. Entretanto, a criação de tais mecanismos é dificultada pelo formato das páginas Web (HTML), que mistura o conteúdo e a formatação da página em um mesmo arquivo. Uma solução usual para esse problema é separar estes componentes da página em documentos XML (conteúdo) e folhas de estilo XSLT (formatação). Pode-se notar várias semelhanças entre páginas Web e programas de computador (software), pois ambos têm componentes de tipos diferentes que evoluem com o tempo. Assim, técnicas oriundas da área de Gerência de Configuração de Software, como controle de versões, podem ser adaptadas para auxiliar a manuutenção de sites. Além da melhoria na manutenção, outra necessidade cada vez mais comum aos sites é a adaptação automática das páginas. Por meio desta, páginas podem ser automaticamente adequadas (adaptadas) e determinado usuário, o que potencialmente atrai um maior número de visitantes ao site. Se forem mantidas versões de cada componente de página, pode-se combiná-las para gerar muitas páginas alternativas. Através da escolha cuidadosa das versões dos ocmponentes que compõem uma página, é possível obter páginas adaptadas automaticamente. Na área de Gerência de Configuração de Software, o chamado proceesso de configuração é responsável por selecionar automaticamente versões de módulos para compor um programa completo. O presente trabalho propõe uma infra-estrutura para um servidor Web que realiza controle de versões e suporta a adaptação de páginas Web de forma transparente ao visitante. Para tanto, é projetado um modelo de versões de páginas que separa conteúdo e formatação em componentes distintos. É proposto um processo de configuração que é responsável pela geração de páginas dinâmicas, o que é suportado por informações presentes no modelo de versões. Os autores de páginas e o próprio servidor Web podem interferir nas escolhas doprocesso de configuração, fornecendo critérios de seleção de versões. Esses critérios guiam as escolhas do processo de configuração, pois representam características que as versões escolhidas devem (necessariamente ou preferencialmente) apresentar.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O Resource Description Framework (RDF) é uma infra-estrutura, que possibilita a codificação, troca e reuso de metadata estruturado. Metadata é dados sobre dados. O termo refere a qualquer dado usado para ajudar a identificação, descrição e localização de recursos eletrônicos na rede. O RDF permite adicionar declarações, sinônimos e palavras que não estão presentes nos recursos, mas que são pertinentes a eles. Uma declaração RDF pode ser desenhada usando diagramas de arcos e nodos, onde os nodos representam os recursos e os arcos representam as propriedades nomeadas. O modelo básico consiste em recursos, propriedades e objetos. Todas as coisas sendo descritas pelas declarações RDF são chamadas de recursos. Um recurso pode ser uma página da Web inteira ou um elemento específico HTML ou XML dentro de um documento fonte. Uma propriedade é um aspecto específico, característica, atributo, ou relação usada para descrever um recurso. O objeto pode ser um outro recurso ou um literal. Estas três partes, juntas, formam uma declaração RDF. O resultado do parser para recursos com metadata RDF, é um conjunto de declarações referentes aquele recurso. A declaração destas propriedades e a semântica correspondente delas estão definidas no contexto do RDF como um RDF schema. Um esquema não só define as propriedades do recurso (por exemplo, título, autor, assunto, tamanho, cor, etc.), mas também pode definir os tipos de recursos sendo descritos (livros, páginas Web, pessoas, companhias, etc.). O RDF schema, provê um sistema básico de tipos necessários para descrever tais elementos e definir as classes de recursos. Assim, os recursos constituindo este sistema de tipos se tornam parte do modelo RDF de qualquer descrição que os usa. A geração de modelos RDF pode ser conseguida através de algoritmos implementados com linguagens de programação tradicionais e podem ser embutidos em páginas HTML, documentos XML e até mesmo em imagens. Com relação a modelos em imagens, servidores Web específicos são usados para simular dois recursos sobre o mesmo URI, servindo ora a imagem ora a descrição RDF. Uma alternativa para armazenar e manipular grande quantidade de declarações RDF é usar a tecnologia de banco de dados relacional. Abordagens para armazenar declarações RDF em banco de dados relacional foram propostas, mas todas elas mantêm modelos diversos de diferentes fontes. Critérios de avaliação como tempo de carga, proliferação de tabelas, espaço, dados mantidos e custo de instruções SQL foram definidos. Duas abordagens apresentaram resultados satisfatórios. Com uma nova abordagem proposta por este trabalho se obteve melhores resultados principalmente no aspecto de consultas. A nova proposta provê mecanismos para que o usuário faça seu próprio modelo relacional e crie suas consultas. O conhecimento necessário pelo usuário se limita em parte aos modelos mantidos e ao esquema RDF.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este trabalho tem por objetivo mostrar a adaptação das estratégias de uma empresa fornecedora de equipamentos de transmissão de dados, a PARKS S/A COMUNICAÇÕES DIGITAIS, frente às mudanças do mercado de telecomunicações no Brasil Através de uma análise de caso, evidenciaram-se as mudanças ocorridas no mercado de telecomunicações, a percepção desta empresa para tais mudanças e a orientação estratégica adotada para os seus próprios setores, a saber, o comercial, o industrial, o financeiro, o de recursos humanos e qualidade e o de engenharia. O estudo das mudanças ocorridas neste mercado abrangeu dois períodos, quais sejam, o anterior à privatização e os anos de 1997 até 2000, ressaltando-se, porém, que a análise se centrou neste último, o qual foi analisado mais detalhadamente. Uma vez identificadas as principais mudanças ocorridas na empresa escolhida para o estudo de caso - PARKS S/A Comunicações -, através de observação e da vivência do autor, bem como de contribuições relatadas por colegas da empresa, igualmente participantes do processo, este trabalho analisa estas mudanças uma a uma, mostrando o reflexo das mesmas na estrutura da empresa, procurando explicar como se deu o fenômeno e, assim, contribuindo para a compreensão de processos análogos que venham a ocorrer em um futuro próximo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.