998 resultados para Dados não estruturados


Relevância:

30.00% 30.00%

Publicador:

Resumo:

Com a crescente popularização dos microcomputadores e da rede mundial de informação, Internet, uma enorme variedade e quantidade de informações estão se tornando acessíveis a um número cada vez maior de pessoas. Desta forma, também cresce a importância de se extrair a informação útil que está no grande conjunto das informações disponibilizadas. Hoje há muito mais dados na forma de textos eletrônicos do que em tempos passados, mas muito disto é ignorado. Nenhuma pessoa pode ler, entender e sintetizar megabytes de texto no seu cotidiano. Informações perdidas, e conseqüentemente oportunidades perdidas, estimularam pesquisas na exploração de várias estratégias para a administração da informação, a fim de estabelecer uma ordem na imensidão de textos. As estratégias mais comuns são recuperação de informações, filtragem de informações e outra relativamente nova, chamada de extração de informações. A extração de informações tem muitas aplicações potenciais. Por exemplo, a informação disponível em textos não-estruturados pode ser armazenada em bancos de dados tradicionais e usuários podem examiná-las através de consultas padrão. Para isso, há um complexo trabalho de gerenciamento, que é conseqüência da natureza não estruturada e da difícil análise dos dados. Os dados de entrada, que são os textos semi ou não-estruturados, são manipulados por um processo de extração configurado através de bases de conhecimento criadas pelo usuário do sistema. Esta dissertação tem como objetivo a definição de uma linguagem, com base em uma arquitetura de múltiplos níveis, para extrair satisfatoriamente as informações desejadas pelo usuário, presentes em bases de dados textuais. Também faz parte deste trabalho a implementação de um protótipo que utiliza a linguagem proposta.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Extração de dados é o processo utilizado para obter e estruturar informações disponibilizaadas em documentos semi-estruturados (ex.: páginas da Web). A importâmncia da extrtação de dados vem do fato que, uma vez extraídos, os dados podem ser armazenados e manipulados em uma forma estruturada. Dentre as abordagens existentes para extração de dados, existe a abordagem de extração baseada em ontologias. Nesta abordagem, ontologias são preciamente criadas para descrever um domínio de interesse, gerando um modelo conceitual enriquecido com informações necessárias para extração de dados das fontes semi-estruturadas. A ontologia é utilizada como guia ara um programa (¨parser¨) que executa a extração de dados dos documentos ou páginas fornecidos como enetrada. Oprocesso de criação da ontologia não é uma tarefa trtivial e requer um cuidado trabalho ee análise dos documentos ou páginas fontes dos dados. Este trabalho é feito manualmente por usuários especialistas no domínio de interesse da ontologia. Entretanto, em algumas situações os dados que se desejam extrair estão modelados em bancos de dados relacionais. Neste caso, o modelo realcional do banco de dados por ser utilizado para constrtução do modelo conceitual na ontologia. As instâncias dos dados armazenados neste mesmo banco podem ajudar a gerar as informações sobre conteúdo e formato dos dados a serem extraídos. Estas informações sobre conteúdo e formato de dados, na ontologia, são representadas por expressões regulares e estão inseridas nos chamados "data frames". O objetivo deste trabalho é apresentar um método para criação semi-automática de ontologias de extração a partir das informações em um banco de dados já existente. O processo é baseado na engenharia reversa do modelo relacional para o modelo conceitual da ontologia combinada com a análise das instâncias dos dados para geração das expressões regulares nos "data frames".

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Este trabalho tem como objetivo o desenvolvimento e a aplicação de métodos de caracterização de filmes ópticos, associados à sua estrutura inomogênea ou anisotrópica. Os materiais estudados são guias ópticos planares e filmes compósitos com propriedades ópticas não-lineares. Esses materiais são relevantes para aplicações na área de optoeletrônica e óptica integrada. O trabalho é dividido em duas partes principais. A primeira parte é dedicada à caracterização de guias de onda planares produzidos por troca iônica, vidros dopados com íons de Ag e/ou K, através de um e/ou dois processos de troca. O perfil de índice de refração é estudado através da técnica de Modos Guiados, uma técnica óptica empregada tradicionalmente em guias desse tipo. Em complementação a essa medida óptica, são realizadas medidas do perfil de concentração do íon dopante, empregando as técnicas de RBS e EDS. É dedicado um interesse especial pela região próxima à superfície da amostra, a região crítica na análise por Modos Guiados. Os métodos de Abelès-Hacskaylo e de Brewster-Pfund são estendidos a esses guias inomogêneos, permitindo a medida direta do valor do índice de refração superficial. Essa informação e os dados obtidos por Modos Guiados permitem a determinação de um perfil de índice de refração mais acurado ao longo da profundidade do guia. A segunda parte é dedicada ao estudo de materiais compósitos: filmes finos constituídos por uma matriz (silicato, silicato + PVP, e PMMA) dopada com moléculas orgânicas que apresentam propriedades ópticas não-lineares de segunda ordem (PNA, DR-1 e HBO-BO6). Nessas amostras, é aplicado um campo elétrico de alta voltagem (efeito corona), gerando um alinhamento dos cromóforos dopantes. Essa mudança na simetria estrutural do material, de isotrópica para uniaxial, é observada através da assimetria correspondente no valor do índice de refração (birrefringência). O valor da birrefringência induzida é obtido através da medida da variação da refletância de luz pelo material, auxiliada por medidas prévias das constantes ópticas do material por Elipsometria.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Neste trabalho analisamos o efeito da contratação de sistemas de ensino para métodos estruturados sobre a evolução e dispersão do desempenho dos alunos das escolas públicas municipais do estado de São Paulo. O objetivo da análise é avaliar se os métodos estruturados de ensino, além de aumentar o desempenho médio dos alunos nos municípios contratantes, também servem com meio para homogeneizar a nota dos alunos em um nível mais elevado. Para este fim utilizamos os dados dos exames de português e matemática dos anos de 2005, 2007 e 2009 da Prova Brasil e, pelo método de estimação de diferenças em diferenças com, efeito fixo por município, avaliamos o incremento no desempenho médio e no desvio padrão do desempenho dos municípios devido à posse de contrato para método estruturado em relação àqueles que não o possuem. Os resultados obtidos revelaram que os métodos estruturados de ensino contribuem para o aumento do desempenho médio dos municípios, e que não foi observado benefício diferenciado a alunos com maior ou menor desempenho inicial. Sobre o efeito da contratação de sistemas de ensino sobre o desvio padrão do desempenho, os resultados não apresentaram robustez suficiente que nos permitissem afirmar que os métodos contribuem para a homogeneização do desempenho.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

In recent decades, changes have been occurring in the telecommunications industry, allied to competition driven by the policies of privatization and concessions, have fomented the world market irrefutably causing the emergence of a new reality. The reflections in Brazil have become evident due to the appearance of significant growth rates, getting in 2012 to provide a net operating income of 128 billion dollars, placing the country among the five major powers in the world in mobile communications. In this context, an issue of increasing importance to the financial health of companies is their ability to retain their customers, as well as turn them into loyal customers. The appearance of infidelity from customer operators has been generating monthly rates shutdowns about two to four percent per month accounting for business management one of its biggest challenges, since capturing a new customer has meant an expenditure greater than five times to retention. For this purpose, models have been developed by means of structural equation modeling to identify the relationships between the various determinants of customer loyalty in the context of services. The original contribution of this thesis is to develop a model for loyalty from the identification of relationships between determinants of satisfaction (latent variables) and the inclusion of attributes that determine the perceptions of service quality for the mobile communications industry, such as quality, satisfaction, value, trust, expectation and loyalty. It is a qualitative research which will be conducted with customers of operators through simple random sampling technique, using structured questionnaires. As a result, the proposed model and statistical evaluations should enable operators to conclude that customer loyalty is directly influenced by technical and operational quality of the services offered, as well as provide a satisfaction index for the mobile communication segment

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Pós-graduação em Matematica Aplicada e Computacional - FCT

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A implementação de programas de LTPP – Long-Term Pavement Performance (avaliação do desempenho de pavimentos a longo prazo), ao criar um registo histórico sobre as características e a evolução do estado dos pavimentos da rede, revela-se uma ferramenta de valor acrescido no auxílio à tomada de decisões, no âmbito da conservação e da reabilitação de pavimentos, por parte das administrações das infraestruturas rodoviárias. O LTPP americano, dentre os existentes no mundo, é o projeto pioneiro e um dos que tem a maior quantidade de informação armazenada. Por isso, foi o escolhido no âmbito desta dissertação para estudar a evolução do estado dos pavimentos em várias secções classificadas no programa como SPS-5, incluídas no estudo de reabilitação de pavimentos betuminosos. A avaliação efetuada considera cerca de 15 anos de registos de dados, na Califórnia, no Texas e no Mississippi. Após uma breve apresentação de vários projetos LTPP existentes no mundo, descreve-se o modo como são recolhidos e estruturados os dados no LTPP americano, referindo os módulos, as tabelas e os campos considerados para estudo que se faz nesta dissertação. Os estados americanos escolhidos apresentam características climáticas que não reproduzem de forma muito próxima o que acontece em Portugal. Mesmo assim, procurou estabelecer-se um paralelo entre aquelas zonas, com base na temperatura do ar e na precipitação, de modo a poder inferir, de forma aproximada, tendências de evolução do estado dos pavimentos para Portugal Continental. A correspondência climática entre os estados americanos e as regiões portuguesas, resultou nos pares Califórnia/Beja, Texas/Lisboa e Mississippi/Porto. No que se refere ao desenvolvimento de patologias nos pavimentos, analisou-se a evolução do fendilhamento longitudinal, transversal, em bloco (ou malha) e por fadiga (ou pele de crocodilo), da desagregação superficial, do Índice de Irregularidade Internacional (IRI) e das rodeiras. O fendilhamento em bloco (ou malha) e a desagregação superficial não foram objeto de estudos estatísticos para determinação de modelos de previsão. A evolução do estado dos pavimentos, traduzida por indicadores relacionados com as patologias analisadas, foi apreciada em função de diversas variáveis associadas às técnicas de reabilitação, tais como a preparação da superfície de trabalho (realização de atividades de fresagem antes da nova camada), a espessura da camada de reforço (50 ou 125 mm) e o tipo de mistura utilizada (nova ou contendo cerca de 30% de material reciclado). Para as situações em que os dados existentes eram coerentes e em quantidade suficiente, apresentam-se análises de regressão multivariada, de modo a prever a evolução no tempo do estado dos pavimentos, tendo em conta um conjunto de variáveis explicativas relacionadas com as técnicas de reabilitação aplicadas e com o tráfego que solicitou os pavimentos. A análise agregada dos dados para cada um dos estados permitiu concluir que a preparação da superfície por fresagem, o aumento da espessura do reforço, e a utilização de misturas betuminosas novas ou com material reciclado, interferem na evolução das degradações. A influência daqueles fatores é variável em função dos diferentes tipos de patologias em análise.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Since the last decade, the combined use of chemometrics and molecular spectroscopic techniques has become a new alternative for direct drug determination, without the need of physical separation. Among the new methodologies developed, the application of PARAFAC in the decomposition of spectrofluorimetric data should be highlighted. The first objective of this article is to describe the theoretical basis of PARAFAC. For this purpose, a discussion about the order of chemometric methods used in multivariate calibration and the development of multi-dimensional methods is presented first. The other objective of this article is to divulge for the Brazilian chemical community the potential of the combination PARAFAC/spectrofluorimetry for the determination of drugs in complex biological matrices. For this purpose, two applications aiming at determining, respectively, doxorrubicine and salicylate in human plasma are presented.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The objective of this work was to compare the soybean crop mapping in the western of Parana State by MODIS/Terra and TM/Landsat 5 images. Firstly, it was generated a soybean crop mask using six TM images covering the crop season, which was used as a reference. The images were submitted to Parallelepiped and Maximum Likelihood digital classification algorithms, followed by visual inspection. Four MODIS images, covering the vegetative peak, were classified using the Parallelepiped method. The quality assessment of MODIS and TM classification was carried out through an Error Matrix, considering 100 sample points between soybean or not soybean, randomly allocated in each of the eight municipalities within the study area. The results showed that both the Overall Classification (OC) and the Kappa Index (KI) have produced values ranging from 0.55 to 0.80, considered good to very good performances, either in TM or MODIS images. When OC and KI, from both sensors were compared, it wasn't found no statistical difference between them. The soybean mapping, using MODIS, has produced 70% of reliance in terms of users. The main conclusion is that the mapping of soybean by MODIS is feasible, with the advantage to have better temporal resolution than Landsat, and to be available on the internet, free of charge.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The main objective of this work was to evaluate the linear regression between spectral response and soybean yield in regional scale. In this study were monitored 36 municipalities from the west region of the states of Parana using five images of Landsat 5/TM during 2004/05 season. The spectral response was converted in physical values, apparent and surface reflectances, by radiometric transformation and atmospheric corrections and both used to calculate NDVI and GVI vegetation indices. Those ones were compared by multiple and simple regression with government official yield values (IBGE). Diagnostic processing method to identify influents values or collinearity was applied to the data too. The results showed that the mean surface reflectance value from all images was more correlated with yield than individual dates. Further, the multiple regressions using all dates and both vegetation indices gave better results than simple regression.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The main objective of this work is to discuss the notion of metalanguage concerning the use of thesaurus (symbols systems, functions indicators, descriptors) utilized by indexers for article representation in computerized bibliographical databases. Our corpus comprises article abstracts and bibliographical database descriptors LILACS (Literatura Latino-Americana em Ciências da Saúde) and SOCIOFILE Sociological Abstracts. We aim at clarifying the effects of subjectivity in the functioning of indexing taking account the grounds for interpretation that allow different meanings.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Universidade Estadual de Campinas. Faculdade de Educação Física

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Universidade Estadual de Campinas . Faculdade de Educação Física

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The vinasse, awaste produced in the proportion of 13 liters for each liter of alcohol. It has a high potential of polluting groundwater and superficial water resources, changes the soil behaviour and can also develop sanilization problems. This work aims to evaluate the efficiency of the DC-resistivity method in detecting and mapping anomalies caused by inappropriate disposal of vinasse in an inactive infiltration tank located at Sepé-Tiarajú settlement of landless agricultural laborers in the Ribeirão Preto region. Besides, as secondary goals, this work aims to characterize the type of anomaly residue as well as to diagnose its influence inside and outside of the limits of the tank. Eleven electrical resistivity tomography profiles were carried out with the dipole-dipole array, 10m of dipoles length and 5 leveis of investigation The geophysical survey enabled us to conclude that the DC-resistivity method is appropriate for mapping the contamination plume caused by intense vinasse disposal and its influence. It enabled also to conclude that the contamination exceeds the tank limits. The vinasse influence can be characterized by low resistivity values between 10 Ohm.m and 90 Ohm.m and its behavior can be compared with the one of the chorume, which is also conductive.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A desintegração radioativa é um processo aleatório e a estimativa de todas as medidas associadas é governada por leis estatísticas. Os perfis de taxas de contagem são sempre "ruidosos" quando utilizados períodos curtos como um segundo para cada medida. Os filtros utilizados e posteriormente as correções feitas no processamento atual de dados gamaespectrométricos não são suficientes para remover ou diminuir, consideravelmente, o ruído oriundo do espectro. Dois métodos estatísticos que atuam diretamente nos dados coletados, isto é, nos espectros, vêm sendo sugeridos na literatura para remover e minimizar estes ruídos remanescentes o Noise-Adjusted Singular Value Decomposition - NASVD e Maximum Noise Fraction - MNF. Estes métodos produzem uma redução no ruído de forma significativa. Neste trabalho eles foram implementados dentro do ambiente de processamento do software Oasis Montaj e aplicados na área compreendida pelos blocos I e II do levantamento aerogeofísico que recobre a porção oeste da Província Mineral do Tapajós, entre os Estados do Pará e Amazonas. Os dados filtrados e não-filtrados com as técnicas de NASVD e MNF foram processados com os parâmetros e constantes fornecidos pela empresa Lasa Engenharia e Prospecções S.A., sendo estes comparados. Os resultados da comparação entre perfis e mapas apresentaram-se de forma promissora, pois houve um ganho na resolução dos produtos.