3 resultados para Decision tree
em Biblioteca Digital de Teses e Dissertações Eletrônicas da UERJ
Resumo:
No presente trabalho foram utilizados modelos de classificação para minerar dados relacionados à aprendizagem de Matemática e ao perfil de professores do ensino fundamental. Mais especificamente, foram abordados os fatores referentes aos educadores do Estado do Rio de Janeiro que influenciam positivamente e negativamente no desempenho dos alunos do 9 ano do ensino básico nas provas de Matemática. Os dados utilizados para extrair estas informações são disponibilizados pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira que avalia o sistema educacional brasileiro em diversos níveis e modalidades de ensino, incluindo a Educação Básica, cuja avaliação, que foi foco deste estudo, é realizada pela Prova Brasil. A partir desta base, foi aplicado o processo de Descoberta de Conhecimento em Bancos de Dados (KDD - Knowledge Discovery in Databases), composto das etapas de preparação, mineração e pós-processamento dos dados. Os padrões foram extraídos dos modelos de classificação gerados pelas técnicas árvore de decisão, indução de regras e classificadores Bayesianos, cujos algoritmos estão implementados no software Weka (Waikato Environment for Knowledge Analysis). Além disso, foram aplicados métodos de grupos e uma metodologia para tornar as classes uniformemente distribuídas, afim de melhorar a precisão dos modelos obtidos. Os resultados apresentaram importantes fatores que contribuem para o ensino-aprendizagem de Matemática, assim como evidenciaram aspectos que comprometem negativamente o desempenho dos discentes. Por fim, os resultados extraídos fornecem ao educador e elaborador de políticas públicas fatores para uma análise que os auxiliem em posteriores tomadas de decisão.
Resumo:
No presente trabalho foram desenvolvidos modelos de classificação aplicados à mineração de dados climáticos para a previsão de eventos extremos de precipitação com uma hora de antecedência. Mais especificamente, foram utilizados dados observacionais registrados pela estação meteorológica de superfície localizada no Instituto Politécnico da Universidade do Estado do Rio de Janeiro em Nova Friburgo RJ, durante o período de 2008 a 2012. A partir desses dados foi aplicado o processo de Descoberta de Conhecimento em Banco de Dados (KDD Knowledge Discovery in Databases), composto das etapas de preparação, mineração e pós processamento dos dados. Com base no uso de algoritmos de Redes Neurais Artificiais e Árvores de Decisão para a extração de padrões que indicassem um acúmulo de precipitação maior que 10 mm na hora posterior à medição das variáveis climáticas, pôde-se notar que a utilização da observação meteorológica de micro escala para previsões de curto prazo é suscetível a altas taxas de alarmes falsos (falsos positivos). Para contornar este problema, foram utilizados dados históricos de previsões realizadas pelo Modelo Eta com resolução de 15 km, disponibilizados pelo Centro de Previsão de Tempo e Estudos Climáticos do Instituto Nacional de Pesquisas Espaciais CPTEC/INPE. De posse desses dados, foi possível calcular os índices de instabilidade relacionados à formação de situação convectiva severa na região de Nova Friburgo e então armazená-los de maneira estruturada em um banco de dados, realizando a união entre os registros de micro e meso escala. Os resultados demonstraram que a união entre as bases de dados foi de extrema importância para a redução dos índices de falsos positivos, sendo essa uma importante contribuição aos estudos meteorológicos realizados em estações meteorológicas de superfície. Por fim, o modelo com maior precisão foi utilizado para o desenvolvimento de um sistema de alertas em tempo real, que verifica, para a região estudada, a possibilidade de chuva maior que 10 mm na próxima hora.
Resumo:
Os profissionais da área da saúde formam um dos grupos mais vulneráveis à infecção pelo Mycobacterium tuberculosis (Mtb). Segundo estimativas da Organização Mundial de Saúde (OMS), 8,8 milhões de pessoas estavam infectadas pelo Mtb e ocorreram 1,4 milhão de óbitos por tuberculose (TB) em 2010. A identificação de pessoas com Infecção Latente Tuberculosa (ILTB) é considerada pela OMS como uma prioridade no controle da doença, especialmente em países em desenvolvimento em que a incidência da doença ativa tem apresentado redução. O objetivo do presente trabalho foi avaliar, no Brasil, o custo-efetividade dos testes Prova Tuberculínica (PT) e Quantiferon TB Gold-In-Tube (QTF-GIT) no diagnóstico e tratamento da ILTB em profissionais de saúde atuantes na atenção básica, sob a perspectiva do Sistema Único de Saúde (SUS), comparando cinco estratégias que incluem o QTF-GIT, distintos pontos de corte para a PT e uso sequencial dos dois testes; e analisar o impacto do tabagismo sobre o risco de ILTB entre os profissionais de saúde, destacando-se a categoria da Enfermagem. Foi realizada uma avaliação econômica completa do tipo custo-efetividade, conduzida considerando uma coorte hipotética de 10.000 profissionais de saúde atuantes na atenção básica, com horizonte temporal restrito a um ano. Um modelo analítico de decisão, caracterizado por uma árvore de probabilidades de eventos, foi desenvolvido utilizando o software TreeAge ProTM 2013 para simular os resultados clínicos e impactos econômicos em saúde da nova tecnologia diagnóstica (QTF-GIT) versus a PT tradicional. Esse modelo simulou cinco estratégias diagnósticas para detecção e tratamento da ILTB: (a) PT, usando ponto de corte de 5mm; (b) PT, usando ponto de corte de 10 mm; (c) teste QTF-GIT; (d) PT, com ponto de corte de 5mm, seguida de teste QTF-GIT quando PT positiva; (e) PT, com ponto de corte de 10mm, seguida de teste QTF-GIT quando PT positiva. Foi realizada análise de sensibilidade determinística univariada. Na determinação dos fatores associados à ILTB, foi elaborado um modelo de regressão logística múltipla com seleção hierarquizada, utilizando o software Stata. A estratégia mais custo-efetiva foi a PT no ponto de corte ≥10mm, considerando como medida de desfecho tanto o número de indivíduos corretamente classificados pelos testes assim como o número de casos de TB evitados. A utilização isolada do QTF-GIT revelou-se a estratégia de menor eficiência, com RCEI= R$ 343,24 por profissional corretamente classificado pelo teste. Encontrou-se risco à ILTB significantemente maior para sexo masculino [OR=1,89; IC 95%:1,11-3,20], idade ≥ 41 anos [OR=1,56; IC 95%: 1.09-2,22], contato próximo com familiar com TB [OR=1,55; IC 95%: 1.02-2,36], status do tabagismo fumante [OR=1,75; IC 95%: 1.03-2,98] e categoria profissional da Enfermagem [OR=1,44; IC 95%: 1.02-2,03]. Concluiu-se que a PT no ponto de corte de 10mm é a estratégia diagnóstica mais custo-efetiva para ILTB entre os profissionais de saúde na atenção básica e que a ILTB está associada ao hábito do tabagismo e à categoria profissional de Enfermagem.