1000 resultados para Classificação Hierárquica
Resumo:
Data classification is a task with high applicability in a lot of areas. Most methods for treating classification problems found in the literature dealing with single-label or traditional problems. In recent years has been identified a series of classification tasks in which the samples can be labeled at more than one class simultaneously (multi-label classification). Additionally, these classes can be hierarchically organized (hierarchical classification and hierarchical multi-label classification). On the other hand, we have also studied a new category of learning, called semi-supervised learning, combining labeled data (supervised learning) and non-labeled data (unsupervised learning) during the training phase, thus reducing the need for a large amount of labeled data when only a small set of labeled samples is available. Thus, since both the techniques of multi-label and hierarchical multi-label classification as semi-supervised learning has shown favorable results with its use, this work is proposed and used to apply semi-supervised learning in hierarchical multi-label classication tasks, so eciently take advantage of the main advantages of the two areas. An experimental analysis of the proposed methods found that the use of semi-supervised learning in hierarchical multi-label methods presented satisfactory results, since the two approaches were statistically similar results
Resumo:
O objetivo deste trabalho é avaliar diferentes abordagens para identificação de grupos de pacientes VIH com padrões temporais de evolução da doença similares. Foi considerado um sistema de equações diferenciais ordinárias para caracterizar a comportamento ao longo do tempo de um paciente VIH sob tratamento antiretroviral - TAR de longo prazo, com 5 parâmetros estimados a partir de metodologia Bayesiana. As distribuições a posteriori foram usadas para quantificar distâncias (univariadas) entre pacientes, através do valor médio da distribuição a posteriori, e considerando a distância entre as distribuições a posteriori para cada parâmetro. O resultado do agrupamento hierárquico obtido pelas duas abordagens sugere que o uso de uma distância que considere a distribuição a posteriori é preferível. Trabalho futuro irá considerar distâncias multivariadas em vez de distâncias univariadas.
Resumo:
Mestrado em Engenharia Informática
Resumo:
Trabalhos têm apontado demandas em relação ao conhecimento da variação pedológica de Argissolos. Essa variação pode ser analisada pela estatística multivariada - também responsável pela classificação numérica dos dados. A comparação entre a classificação numérica e a classificação hierárquica pode contribuir para a evolução do Sistema Brasileiro de Classificação de Solos (SiBCS). Os objetivos deste trabalho foram analisar a variação pedológica de Argissolos derivados de materiais sedimentares na Depressão Central do Rio Grande do Sul e validar a estrutura da ordem dos Argissolos do SiBCS por meio da interpretação da classificação numérica. Foram considerados 42 perfis de Argissolos derivados da Formação Santa Maria e da Formação Caturrita, na região central do Rio Grande do Sul. O estudo foi realizado por meio da análise das componentes principais e da análise de agrupamento. Foram determinadas cinco componentes principais, com poder de explicação de 84,3 % da variância dos dados, representadas de um a cinco pelas variáveis: teor de areia, matiz (cor), saturação por bases, atividade da argila e teor de C orgânico total. A análise de agrupamento separou os perfis de Argissolos em três grupos principais. O grupo A apresentou perfis com drenagem deficiente, derivados das três rochas consideradas neste trabalho. O grupo B, derivado exclusivamente dos arenitos das Formações Santa Maria e Caturrita, mostrou perfis bem drenados, porém com menor teor de argila, maior gradiente textural e menor capacidade de troca de cátions potencial em relação ao grupo C. Este grupo apresentou perfis bem drenados, alíticos e com teores de argila superiores em relação aos demais grupos, derivados, predominantemente, do lamito da Formação Santa Maria. A classificação numérica validou a estrutura do SiBCS para a ordem dos Argissolos. Contudo, a análise de agrupamento evidenciou aspectos morfológicos importantes e ainda não considerados pelo SiBCS em nível categórico elevado (grande grupo), como a variação na espessura e textura do horizonte A ou A + E, o teor de argila no horizonte B e o gradiente textural nos perfis de Argissolos.
Resumo:
São apresentados os resultados da avaliação de processo das atividades de vigilância epidemiológica, realizada em 1985, em 948 unidades de saúde situadas em 98 dos mais populosos municípios de cada Estado brasileiro. Foram analisados os seguintes aspectos: fluxo de informações, análise de dados e realização de investigação epidemiológica. Foram considerados potencialmente determinantes do desempenho: inserção institucional, atividades de vacinação, aspectos gerenciais e capacitação em serviço. A análise estatística baseou-se na análise de correspondência múltipla e na classificação hierárquica ascendente, disponíveis no programa "Systeme Portable Pur L' Analise De Données -SPAD". As unidades avaliadas não apresentaram padrão uniforme de desempenho, sendo classificadas em seis grupos segundo a atuação na vigilância epidemiológica. Em 53,7% das unidades foi observado desrespeito às normas mais elementares das atividades de vigilância epidemiológica. A presença de atividades de vacinação nas unidades estava relacionada com um melhor desempenho em vigilância epidemiológica. Foi apontada a necessidade de rever o modelo de vigilância epidemiológica ainda em uso no país, pois não é mais concebível a redução da epidemiologia dos serviços de saúde às doenças transmissíveis ou o gerenciamento dos serviços e programas sem a informação epidemiológica.
Resumo:
OBJETIVO: Descrever os cenários das lesões decorrentes de acidentes de trabalho na indústria madeireira. MÉTODOS: Foram identificados todos os acidentes típicos entre janeiro de 1997 e janeiro de 1999, notificados a um dos postos do Instituto Nacional de Seguro Social, localizado em Lages, Santa Catarina. Trata-se de um estudo transversal descritivo em que foram analisadas 254 Comunicações de Acidentes de Trabalho (CAT). Aplicou-se análise multivariada com Análise Fatorial de Correspondência Múltipla (AFCM), Classificação Hierárquica de Ascendência (CHA) e Classificação Não Hierárquica de Partição (CNHP) para a identificação dos cenários típicos de lesões decorrentes de acidentes. RESULTADOS: Cinco cenários de lesões decorrentes de acidentes foram agrupados: 1) queda do trabalhador, 40 casos; 2) sobreesforço ao erguer ou empurrar um objeto, 5 casos; 3) objetos ou peças que tenham caído ou saltado de máquinas em movimento, 76 casos; 4) esmagamento de partes moles, 56 casos; e 5) contato com serras em movimento, 77 casos. CONCLUSÕES: A utilização de análise multivariada permitiu definir as lesões mais típicas relacionadas a determinados tipos de acidentes, bem como apreender as circunstâncias em que ocorreram.
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Estatística e Gestão de Informação
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Ciência e Sistemas de Informação Geográfica
Resumo:
A presente dissertação tem como objetivo identificar e avaliar os elementos de instabilidade geotécnica das vertentes e terrenos da zona do Vanzinho (Castelo Branco, Furnas, ilha de São Miguel), com vista a propor medidas de estabilização das vertentes e controlo da erosão superficial dos terrenos. Com este objetivo foi definida uma metodologia de trabalho em cinco etapas que consistiu: (i) a primeira etapa, no levantamento de dados bibliográficos, integração da informação geológica/geomorfológica em SIG (sistema de informação geográfica) e na observação e levantamento de campo das superfícies de instabilidade geotécnica; (ii) a segunda etapa, na recolha de amostras de solo, remexidas e não remexidas, para caracterização das propriedades físicas e mecânicas dos materiais; (iii) a terceira etapa, na realização de ensaios laboratoriais para a determinação das propriedades físicas e mecânicas dos solos e respetiva classificação; (iv) uma quarta etapa, que consistiu no tratamento estatístico multivariado de dados, nomeadamente, a aplicação dos métodos de análise fatorial das correspondências e de classificação hierárquica com vista à caracterização da tipologia dos materiais e eventual correlação com as evidências de instabilidade; (v) a quinta etapa consistiu na projeção de um conjunto de medidas estruturais e não estruturais (medidas biológicas) a implementar para a estabilização de vertentes e controlo dos processos de erosão superficial observados na área do Vanzinho. Para a estimação da distribuição espacial das diferentes tipologias de solo foi utilizado o método geoestatístico da krigagem multifásica. Para cada elemento de instabilidade cartografado foi criada uma ficha que caracteriza a tipologia da ocorrência, a dimensão, a forma e o coberto vegetal do meio envolvente. O trabalho realizado teve por base a integração de toda a informação num SIG, o que possibilita a atualização de eventuais novas ocorrências, bem como o fácil manuseamento e análise dos dados, a utilizar em trabalhos futuros.
Resumo:
Cabo Verde desde do século passado tem envidado esforço na florestação, sobretudo depois de 1975 para atenuar os efeitos da seca e da desertificação criando deste modo grandes áreas arborizadas. Entretanto, à medida que os recursos florestais foram sendo criados, a problemática da sua avaliação e da sua gestão sustentável, passaram a merecer maior atenção das autoridades nacionais. A lei florestal, promulgada em 1998 define como uma das atribuições e acções do Estado, através dos serviços florestais, a elaboração dos planos de gestão das zonas florestais. Este plano de gestão implica a análise e a apreciação de dados concretos e actualizados sobre a situação real das zonas florestais, sendo possível apenas através do inventário florestal nacional (IFN). Neste trabalho é proposta uma metodologia de processamento do IFN em que se utilizam as potencialidades dos Sistemas de Informação Geográfica (SIG). Foram utilizados para este trabalho os programas: ArcGis 9.1, para produção cartográfica, geoprocessamento e análise espacial e o Field-Map 8.1 para a classificação de ortofotos num esquema de classificação hierárquica, em cinco níveis, adaptado a Cabo Verde (classes de uso do solo adoptado ao esquema de classificação do território europeu – CORINE Land Cover e da Organização das Nações Unidas para a Agricultura e Alimentação (FAO). Os dados utilizados foram compilados no âmbito do projecto do inventário florestal. Os resultados obtidos, para a Ilha de Santiago, constituem uma base cartográfica para o IFN com diversos temas cartográficos, nomeadamente, mapas das zonas florestadas, mapas de ocupação do solo e mapas de amostras inventariáveis cuja metodologia de elaboração poderá ser facilmente replicada para as restantes ilhas do arquipélago
Resumo:
Cabo Verde desde do século passado tem envidado esforço na florestação, sobretudo depois de 1975 para atenuar os efeitos da seca e da desertificação criando deste modo grandes áreas arborizadas. Entretanto, à medida que os recursos florestais foram sendo criados, a problemática da sua avaliação e da sua gestão sustentável, passaram a merecer maior atenção das autoridades nacionais. A lei florestal, promulgada em 1998 define como uma das atribuições e acções do Estado, através dos serviços florestais, a elaboração dos planos de gestão das zonas florestais. Este plano de gestão implica a análise e a apreciação de dados concretos e actualizados sobre a situação real das zonas florestais, sendo possível apenas através do inventário florestal nacional (IFN). Neste trabalho é proposta uma metodologia de processamento do IFN em que se utilizam as potencialidades dos Sistemas de Informação Geográfica (SIG). Foram utilizados para este trabalho os programas: ArcGis 9.1, para produção cartográfica, geoprocessamento e análise espacial e o Field-Map 8.1 para a classificação de ortofotos num esquema de classificação hierárquica, em cinco níveis, adaptado a Cabo Verde (classes de uso do solo adoptado ao esquema de classificação do território europeu – CORINE Land Cover e da Organização das Nações Unidas para a Agricultura e Alimentação (FAO). Os dados utilizados foram compilados no âmbito do projecto do inventário florestal. Os resultados obtidos, para a Ilha de Santiago, constituem uma base cartográfica para o IFN com diversos temas cartográficos, nomeadamente, mapas das zonas florestadas, mapas de ocupação do solo e mapas de amostras inventariáveis cuja metodologia de elaboração poderá ser facilmente replicada para as restantes ilhas do arquipélago.
Resumo:
O presente trabalho objetivou verificar a possibilidade da utilização de métodos estatísticos multivariados na caracterização das fases do desenvolvimento do mosaico sucessional de um trecho de floresta estacional semidecidual, através de variáveis estruturais. Foram alocadas parcelas de 10 m x 10 m, em que se procedeu à análise estrutural, ou seja, levantamento fitossociológico acrescido das variáveis Porcentagem de Cobertura (PC), Altura do Dossel (AD) e Cobertura por Lianas (CL). Os métodos estatísticos empregados foram Análise de Componentes Principais e Análise de Agrupamento, mais especificamente Classificação Hierárquica Ascendente. O primeiro componente principal explicou 43,96% da variância total, enquanto o segundo, 25,66%. As variáveis Área Basal (AB), Diâmetro Médio (DM) e Dominância Média (DOM) apresentaram correlações positivas entre si superiores a 0,75, podendo ser DM e DOM consideradas como um grupo de variáveis. As variáveis Número de Indivíduos (NI) e Número de Espécies (NE) apresentaram correlação 0,60, enquanto AD, CL e PC baixas correlações com as demais, indicando a importância da inclusão destas na análise. A classificação hierárquica e a partição dos grupos em quatro foram feitas considerando os dois primeiros eixos fatoriais. Os resultados indicaram dois comportamentos diferenciados: 1) valores baixos para AD e AB: Grupo 1, com valores baixos também para NI, NE e PC (fase de clareira); e Grupo 2, com valores elevados para NI e CL e baixos para DOM e DM (fase de construção); e 2) valores altos para AD e AB: Grupo 3, com valores altos também para NI, NE e PC e valor baixo para CL (fase madura); e Grupo 4, com valores elevados para DOM e DM e mais baixos para CL (fase de degradação). Os métodos estatísticos multivariados permitiram caracterizar as fases do desenvolvimento do mosaico sucessional, através das variáveis estruturais. A forma como foram estimadas as variáveis AD, CL e PC, porém, deve ser aprimorada, assim como é preciso incluir variáveis que discriminem melhor cada fase.
Resumo:
O cenário empresarial atual leva as empresas a terem atuações cada vez mais dinâmicas, buscando utilizar as informações disponíveis de modo a melhorar seu processo de decisão. Com esse objetivo, diversas organizações têm adquirido sistemas de business intelligence. O processo de seleção de sistemas é difícil, diferente do utilizado em outras aquisições empresariais e sofre influência de diversos aspectos intangíveis, o que impossibilita o uso das técnicas de análise financeira normalmente utilizadas pelas companhias para apoiar decisões de investimento. Dessa forma, pode-se dizer que a decisão de escolha de um software de business intelligence é baseada em um conjunto de fatores tanto tangíveis quanto intangíveis. Este trabalho teve como objetivo principal identificar e estabelecer um ranking dos principais fatores que influenciam a decisão de escolha entre sistemas de business intelligence, tendo como foco empresas do setor de incorporação imobiliária atuantes na grande São Paulo e como objetivo secundário procurar identificar a possível existência de aspectos determinantes para a decisão de escolha entre a lista de fatores apurados. Essa pesquisa foi realizada através de doze entrevistas com pessoas que participaram de processos de decisão de escolha de sistemas de business intelligence, sendo algumas da área de TI e outras de área de negócio, atuantes em sete empresas incorporadoras da grande São Paulo. Essa avaliação teve como resultado a identificação dos fatores mais importantes e a sua classificação hierárquica, possibilitando a apuração de um ranking composto pelos catorze fatores mais influentes na decisão de escolha e statisticamente válido segundo o coeficiente de concordância de Kendall. Desse total, apenas três puderam ser classificados como determinantes ou não determinantes; o restante não apresentou padrões de resposta estatisticamente válidos para permitir conclusões sobre esse aspecto. Por fim, após a análise dos processos de seleção utilizados pelas sete empresas dessa pesquisa, foram observadas duas fases, as quais sofrem influência de distintos fatores. Posteriormente, estudando-se essas fases em conjunto com os fatores identificados no ranking, pôde-se propor um processo de seleção visando uma possível redução de tempo e custo para a realização dessa atividade. A contribuição teórica deste trabalho está no fato de complementar as pesquisas que identificam os fatores de influência no processo de decisão de escolha de sistemas, mais especificamente de business intelligence, ao estabelecer um ranking de importância para os itens identificados e também o relacionamento de fatores de importância a fases específicas do processo de seleção identificadas neste trabalho.
Resumo:
Pesquisas acerca das Infecções Hospitalares mostram a gravidade do problema na saúde e a existência de poucos profissionais das áreas do Direito e da Saúde especializados nas implicações jurídicas relacionadas com o controle das Infecções Hospitalares. Assim, este estudo multidisciplinar tem como objetivos: apreender as Representações Sociais das Implicações Jurídicas das Infecções Hospitalares e de seu Controle, elaboradas pelos profissionais do direito e da saúde e analisar o impacto destas representações sobre Infecções Hospitalares e seu controle no âmbito do Hospital Getúlio Vargas, em Teresina, no Estado do Piauí. Trata-se de um estudo de caráter exploratório, desenvolvido em hospital público com profissionais do Direito e da Saúde, subsidiado na Teoria das Representações Sociais, de Serge Moscovici. Os dados foram coletados através de entrevista em profundidade e da observação. As informações apreendidas foram processadas no software Alceste 4.8, possibilitando a análise lexical e estatística pela Classificação Hierárquica Descendente, que permitiu identificar no discurso classes representativas de palavras de interesse da investigação. Os resultados indicaram que os sujeitos do estudo, através das suas representações sociais, defendem os direitos dos usuários da saúde e conhecem a prática das políticas de saúde, prevenção das Infecções Hospitalares e de seu Controle. Porém, demonstraram pouca preocupação com as implicações jurídicas inerentes às sua práticas mesmo estando sujeitos a responder civil e penalmente pelas ocorrências geradas por iatrogenia no exercício da profissão
Resumo:
O presente trabalho objetivou verificar a possibilidade da utilização de métodos estatísticos multivariados na caracterização das fases do desenvolvimento do mosaico sucessional de um trecho de floresta estacional semidecidual, através de variáveis estruturais. Foram alocadas parcelas de 10 m x 10 m, em que se procedeu à análise estrutural, ou seja, levantamento fitossociológico acrescido das variáveis Porcentagem de Cobertura (PC), Altura do Dossel (AD) e Cobertura por Lianas (CL). Os métodos estatísticos empregados foram Análise de Componentes Principais e Análise de Agrupamento, mais especificamente Classificação Hierárquica Ascendente. O primeiro componente principal explicou 43,96% da variância total, enquanto o segundo, 25,66%. As variáveis Área Basal (AB), Diâmetro Médio (DM) e Dominância Média (DOM) apresentaram correlações positivas entre si superiores a 0,75, podendo ser DM e DOM consideradas como um grupo de variáveis. As variáveis Número de Indivíduos (NI) e Número de Espécies (NE) apresentaram correlação 0,60, enquanto AD, CL e PC baixas correlações com as demais, indicando a importância da inclusão destas na análise. A classificação hierárquica e a partição dos grupos em quatro foram feitas considerando os dois primeiros eixos fatoriais. Os resultados indicaram dois comportamentos diferenciados: 1) valores baixos para AD e AB: Grupo 1, com valores baixos também para NI, NE e PC (fase de clareira); e Grupo 2, com valores elevados para NI e CL e baixos para DOM e DM (fase de construção); e 2) valores altos para AD e AB: Grupo 3, com valores altos também para NI, NE e PC e valor baixo para CL (fase madura); e Grupo 4, com valores elevados para DOM e DM e mais baixos para CL (fase de degradação). Os métodos estatísticos multivariados permitiram caracterizar as fases do desenvolvimento do mosaico sucessional, através das variáveis estruturais. A forma como foram estimadas as variáveis AD, CL e PC, porém, deve ser aprimorada, assim como é preciso incluir variáveis que discriminem melhor cada fase.