1000 resultados para Custos assistenciais. Plano de saúde. Mineração de dados
Resumo:
A grande disponibilidade de informações oferece um amplo potencial comercial. Contudo, o enorme volume e diversidade de oportunidades gera um problema: limitações comerciais criadas pela seleção e a manipulação manual dessa informação. O tratamento das grandes bases de dados não estruturadas e/ou semi-estruturadas (BDNE/SE), como as trazidas pela Internet, é uma fonte de conhecimento rica e confiável, permitindo a análise de mercados. O tratamento e a estruturação dessa informação permitirá seu melhor gerenciamento, a realização de consultas e a tomada de decisões, criando diferenciais competitivos de mercado. Pesquisas em Recuperação de Informação (RI), as quais culminaram nesta tese, investem na melhoria da posição competitiva de pequenas e médias empresas, hoje inseridas, pelo comércio eletrônico, em um mercado globalizado, dinâmico e competitivo. O objetivo deste trabalho é o desenvolvimento de uma Metodologia de Extração de Informações para o Tratamento e Manipulação de Informações de Comércio Eletrônico. Chamaremos essa metodologia de EI-MNBC, ou seja, Extração de Informações em Múltiplos Níveis Baseada em Conhecimento. Os usuários da EIMNBC podem rapidamente obter as informações desejadas, frente ao tempo de pesquisa e leitura manual dos dados, ou ao uso de ferramentas automáticas inadequadas. Os problemas de volume, diversidade de formatos de armazenamento, diferentes necessidades de pesquisa das informações, entre outros, serão solucionados. A metodologia EI-MNBC utiliza conhecimentos de RI, combinando tecnologias de Recuperação de Documentos, Extração de Informações e Mineração de Dados em uma abordagem híbrida para o tratamento de BDNE/SE. Propõe-se uma nova forma de integração (múltiplos níveis) e configuração (sistema baseado em conhecimento - SBC) de processos de extração de informações, tratando de forma mais eficaz e eficiente as BDNE/SE usadas em comércio eletrônico. Esse tratamento viabilizará o uso de ferramentas de manipulação de dados estruturados, como Sistemas Gerenciadores de Bancos de Dados, sobre as informações anteriormente desestruturadas. A busca do conhecimento existente em bases de dados textuais não estruturadas demanda a compreensão desses dados. O objetivo é enfatizar os aspectos cognitivos superficiais envolvidos na leitura de um texto, entendendo como as pessoas recuperam as informações e armazenando esse conhecimento em regras que guiarão o processo de extração. A estrutura da metodolo gia EI-MNBC é similar a de um SBC: os módulos de extração (máquinas de inferência) analisam os documentos (eventos) de acordo com o conteúdo das bases de conhecimento, interpretando as regras. O resultado é um arquivo estruturado com as informações extraíd as (conclusões). Usando a EI-MNBC, implementou-se o SE-MNBC (Sistema de Extração de Informações em Múltiplos Níveis Baseado em Conhecimento) que foi aplicado sobre o sistema ETO (Electronic Trading Opportunities). O sistema ETO permite que as empresas negociem através da troca de e-mails e o SE-MNBC extrai as informações relevantes nessas mensagens. A aplicação é estruturada em três fases: análise estrutural dos textos, identificação do assunto (domínio) de cada texto e extração, transformando a informação não estruturada em uma base de dados estruturada.
Resumo:
O objetivo deste trabalho é testar a aplicação de um modelo gráfico probabilístico, denominado genericamente de Redes Bayesianas, para desenvolver modelos computacionais que possam ser utilizados para auxiliar a compreensão de problemas e/ou na previsão de variáveis de natureza econômica. Com este propósito, escolheu-se um problema amplamente abordado na literatura e comparou-se os resultados teóricos e experimentais já consolidados com os obtidos utilizando a técnica proposta. Para tanto,foi construído um modelo para a classificação da tendência do "risco país" para o Brasil a partir de uma base de dados composta por variáveis macroeconômicas e financeiras. Como medida do risco adotou-se o EMBI+ (Emerging Markets Bond Index Plus), por ser um indicador amplamente utilizado pelo mercado.
Resumo:
O uso combinado de algoritmos para a descoberta de tópicos em coleções de documentos com técnicas orientadas à visualização da evolução daqueles tópicos no tempo permite a exploração de padrões temáticos em corpora extensos a partir de representações visuais compactas. A pesquisa em apresentação investigou os requisitos de visualização do dado sobre composição temática de documentos obtido através da modelagem de tópicos – o qual é esparso e possui multiatributos – em diferentes níveis de detalhe, através do desenvolvimento de uma técnica de visualização própria e pelo uso de uma biblioteca de código aberto para visualização de dados, de forma comparativa. Sobre o problema estudado de visualização do fluxo de tópicos, observou-se a presença de requisitos de visualização conflitantes para diferentes resoluções dos dados, o que levou à investigação detalhada das formas de manipulação e exibição daqueles. Dessa investigação, a hipótese defendida foi a de que o uso integrado de mais de uma técnica de visualização de acordo com a resolução do dado amplia as possibilidades de exploração do objeto em estudo em relação ao que seria obtido através de apenas uma técnica. A exibição dos limites no uso dessas técnicas de acordo com a resolução de exploração do dado é a principal contribuição desse trabalho, no intuito de dar subsídios ao desenvolvimento de novas aplicações.
Resumo:
This dissertation investigates how credit institutions’ market power limits the effects of creditor protection rules on the interest rate and the spread of bank loans. We use the Brazilian Bankruptcy Reform of June/2005 (BBR) as a legal event affecting the institutional environment of the Brazilian credit market. The law augments creditor protection and aims to improve the access of firms to the credit market and to reduce the cost of borrowing. Either access to credit or the credit cost are also determined by bank industry competition and the market power of suppliers of credit. We derive a simple economic model to study the effect of market power interacting with cost of lending. Using an accounting and operations dataset from July/2004 to December/2007 provided by the Brazilian Central Bank, we estimate that the lack of competition in the bank lending industry hinders the potential reducing effect of the BBR on the interest rate of corporate loans by approximately 30% and on the spread by approximately 23%. We also find no statistical evidence that the BBR affected the concentration level of the Brazilian credit market. We present a brief report on bankruptcy reforms around the world, the changes in the Brazilian legislation and on some recent related articles in our introductory chapter. The second chapter presents the economic model and the testable hypothesis on how the lack of competition in the lending market limits the effects of improved creditor protection. In this chapter, we introduce our empirical strategy using a differences-in-differences model and we estimate the limiting effect of market power on the BBR’s potential to reduce interest rates and on the spread of bank loans. We use the BBR as an exogenous event that affects collateralized corporate loans (treatment group) but that does not affect clean consumer loans (control group) to identify these effects, using different concentration measures. In Chapter 3, we propose a two-stage empirical strategy to handle the H–Statistics proposed by Panzar and Rosse as a measure of market competition. We estimate the limiting effects of the lack of competition in replacing the concentration statistics by the H–Statistics. Chapter 4 presents a structural break test of the concentration index and checks if the BBR affects the dynamic evolution of the concentration index.
Resumo:
No jornalismo, são chamadas suítes as matérias que trazem a sequência de um fato já noticiado. Conforme a imprensa cresce na Internet, podemos ver frequentemente um mesmo fato sendo repetido em portais de notícias dia após dia. Este trabalho visa medir as quantidades de artigos a respeito de um mesmo assunto que tenha iniciado uma suíte, com esta medição acontecendo ao longo dos dias em que ele foi explorado. Os resultados permitiram que fossem encontrados padrões que identifiquem os dias em que os fatos mais relevantes foram noticiados, bem como o tempo em que o assunto foi desenvolvido. Para esta análise, foram escolhidos alguns dos mais importantes fatos que viraram suítes no Brasil ao longo dos últimos anos. As quantidades de artigos são provenientes do maior portal de notícias do país, o G1, e da base de dados do Media Cloud Brasil.
Resumo:
Este trabalho minera as informações coletadas no processo de vestibular entre 2009 e 2012 para o curso de graduação de administração de empresas da FGV-EAESP, para estimar classificadores capazes de calcular a probabilidade de um novo aluno ter bom desempenho. O processo de KDD (Knowledge Discovery in Database) desenvolvido por Fayyad et al. (1996a) é a base da metodologia adotada e os classificadores serão estimados utilizando duas ferramentas matemáticas. A primeira é a regressão logística, muito usada por instituições financeiras para avaliar se um cliente será capaz de honrar com seus pagamentos e a segunda é a rede Bayesiana, proveniente do campo de inteligência artificial. Este estudo mostre que os dois modelos possuem o mesmo poder discriminatório, gerando resultados semelhantes. Além disso, as informações que influenciam a probabilidade de o aluno ter bom desempenho são a sua idade no ano de ingresso, a quantidade de vezes que ele prestou vestibular da FGV/EAESP antes de ser aprovado, a região do Brasil de onde é proveniente e as notas das provas de matemática fase 01 e fase 02, inglês, ciências humanas e redação. Aparentemente o grau de formação dos pais e o grau de decisão do aluno em estudar na FGV/EAESP não influenciam nessa probabilidade.
Resumo:
The aims of this study were to analyze the access of dental services by child population, to determine the prevalence of dental caries, gingivitis and malocclusion in resident children from the municipal district of Sobral Ceará and to evaluate the incidence of the dental decay in adolescents associated with the factors related to socioeconomic condition, access to health services and self-perception. This study had as main factor the multidisciplinary represented by the participation of health professional (doctors, dentists, nurses) in the development of the survey's initial reference; student from Human Sciences area to apply the structured questionnaire in domiciliary visits; statistics professionals in the orientation of the analysis to be held and family health team (community health agents, dentists and dental clinic assistants) in the scheduling of domiciliary visits and the accomplishment of oral exam. The sample was determined from the domicile record that included children born between 1990 and 1994 to develop the research Children health conditions in the municipal district of Sobral Ceará . The first sample comprised 3425 parents of children from 5 to 9 years old, living in the urban area at the municipal district of Sobral Ceará, aiming at identifying the most important factors associated to the access to dental service. From this sample, 1021 children were selected in a systematic way, for the accomplishment to the epidemiological study of decay, gingivitis and malocclusion. In the study's third phase, in order to arrange the group to be followed, 688 adolescents were examined and interviewed, by means of the active search from the 1021 individuals that had been previously examined. It was observed that 50.9% of the children had access to dental service at least once in a lifetime. Of this total, 65.3% accomplished it during the last year, and 85.4% of these did in public services, what allows to identify the importance of this sector in the access to dental services. It was observed that the factors that most affected the access to dental 129 services were related to socioeconomic condition, such as the access to health plan, the possession of toothbrush, garbage collecting, mother s schooling, sewerage treatment and malnutrition. In relation to oral diseases, an increase in the DMF-T index according the age was observed, from 0.10 in five years old to 1.66 in the nine years old, while with the dmf-t index, the inverse happened, since the index decreased from 3.59 in five years old to 2.69 in nine years old. In relation to gingivitis, an average 32.7% of the children presented gum bleeding. In what concerns malocclusion, it was observed that 60.3% of the children didn't present any problem, 30.17% had light malocclusion and 9.5% severe malocclusion. The average incidence of dental caries was 1.86 teeth per youngster. Among the studied variables, tooth pain in the last six months, mother's income and school snack, adjusted by the perception about the need of treatment, the mother's schooling and the dentist's appointment at least once in a lifetime, were the variables that presented positive relationship with the high incidence of dental caries on this population by logistic regression. Variables of socioeconomic nature, related to the access to health services and behavior and biological variables presented a relationship with the high caries incidence. The study point out to the need of developing health actions in a humanized way, by an oral health team effectively bound to the population's interest, with the great objective to provide, with the public health services managers, adequate conditions to improve oral health
Resumo:
Currently, one of the biggest challenges for the field of data mining is to perform cluster analysis on complex data. Several techniques have been proposed but, in general, they can only achieve good results within specific areas providing no consensus of what would be the best way to group this kind of data. In general, these techniques fail due to non-realistic assumptions about the true probability distribution of the data. Based on this, this thesis proposes a new measure based on Cross Information Potential that uses representative points of the dataset and statistics extracted directly from data to measure the interaction between groups. The proposed approach allows us to use all advantages of this information-theoretic descriptor and solves the limitations imposed on it by its own nature. From this, two cost functions and three algorithms have been proposed to perform cluster analysis. As the use of Information Theory captures the relationship between different patterns, regardless of assumptions about the nature of this relationship, the proposed approach was able to achieve a better performance than the main algorithms in literature. These results apply to the context of synthetic data designed to test the algorithms in specific situations and to real data extracted from problems of different fields
Resumo:
The opening of the Brazilian market of electricity and competitiveness between companies in the energy sector make the search for useful information and tools that will assist in decision making activities, increase by the concessionaires. An important source of knowledge for these utilities is the time series of energy demand. The identification of behavior patterns and description of events become important for the planning execution, seeking improvements in service quality and financial benefits. This dissertation presents a methodology based on mining and representation tools of time series, in order to extract knowledge that relate series of electricity demand in various substations connected of a electric utility. The method exploits the relationship of duration, coincidence and partial order of events in multi-dimensionals time series. To represent the knowledge is used the language proposed by Mörchen (2005) called Time Series Knowledge Representation (TSKR). We conducted a case study using time series of energy demand of 8 substations interconnected by a ring system, which feeds the metropolitan area of Goiânia-GO, provided by CELG (Companhia Energética de Goiás), responsible for the service of power distribution in the state of Goiás (Brazil). Using the proposed methodology were extracted three levels of knowledge that describe the behavior of the system studied, representing clearly the system dynamics, becoming a tool to assist planning activities
Resumo:
Traditional applications of feature selection in areas such as data mining, machine learning and pattern recognition aim to improve the accuracy and to reduce the computational cost of the model. It is done through the removal of redundant, irrelevant or noisy data, finding a representative subset of data that reduces its dimensionality without loss of performance. With the development of research in ensemble of classifiers and the verification that this type of model has better performance than the individual models, if the base classifiers are diverse, comes a new field of application to the research of feature selection. In this new field, it is desired to find diverse subsets of features for the construction of base classifiers for the ensemble systems. This work proposes an approach that maximizes the diversity of the ensembles by selecting subsets of features using a model independent of the learning algorithm and with low computational cost. This is done using bio-inspired metaheuristics with evaluation filter-based criteria