1000 resultados para Análise de agrupamento
Resumo:
A mineração de dados constitui o processo de descoberta de conhecimento interessante, com a utilização de métodos e técnicas que permitem analisar grandes conjuntos de dados para a extração de informação previamente desconhecida, válida e que gera ações úteis, de grande ajuda para a tomada de decisões estratégicas. Dentre as tarefas de mineração de dados, existem aquelas que realizam aprendizado não-supervisionado, o qual é aplicado em bases de dados não-classificados, em que o algoritmo extrai as características dos dados fornecidos e os agrupa em classes. Geralmente, o aprendizado não-supervisionado é aplicado em tarefas de agrupamento, que consistem em agrupar os dados de bancos de dados volumosos, com diferentes tipos de dados em classes ou grupos de objetos que são similares dentro de um mesmo grupo e dissimilares em diferentes grupos desses bancos de dados, de acordo com alguma medida de similaridade. Os agrupamentos são usados como ponto de partida para futuras investigações. Este trabalho explora, mediante a realização de um estudo de caso, o uso de agrupamento como tarefa de mineração de dados que realiza aprendizado nãosupervisionado, para avaliar a adequação desta tecnologia em uma base de dados real da área de saúde. Agrupamento é um tema ativo em pesquisas da área pelo seu potencial de aplicação em problemas práticos. O cenário da aplicação é o Sistema de Informações Hospitalares do SUS, sob a gestão da Secretaria Estadual de Saúde do Rio Grande do Sul. Mensalmente, o pagamento de um certo número de internações é bloqueado, uma vez que a cobrança de internações hospitalares é submetida a normas do SUS e a critérios técnicos de bloqueio estabelecidos pela Auditoria Médica da SES para verificar a ocorrência de algum tipo de impropriedade na cobrança dos procedimentos realizados nessas internações hospitalares. A análise de agrupamento foi utilizada para identificar perfis de comportamentos ou tendências nas internações hospitalares e avaliar desvios ou outliers em relação a essas tendências e, com isso, descobrir padrões interessantes que auxiliassem na otimização do trabalho dos auditores médicos da SES. Buscou-se ainda compreender as diferentes configurações de parâmetros oferecidos pela ferramenta escolhida para a mineração de dados, o IBM Intelligent Miner, e o mapeamento de uma metodologia de mineração de dados, o CRISP-DM, para o contexto específico deste estudo de caso. Os resultados deste estudo demonstram possibilidades de criação e melhora dos critérios técnicos de bloqueio das internações hospitalares que permitem a otimização do trabalho de auditores médicos da SES. Houve ainda ganhos na compreensão da tecnologia de mineração de dados com a utilização de agrupamento no que se refere ao uso de uma ferramenta e de uma metodologia de mineração de dados, em que erros e acertos evidenciam os cuidados que devem ser tomados em aplicações dessa tecnologia, além de contribuírem para o seu aperfeiçoamento.
Resumo:
Estado e sociedade brasileiros conviveram em descompasso, nos anos 80. A conseqüência imediata desse fenômeno foi o atendimento insuficiente de necessidades básicas da sociedade, nesse período, com aumento da entropia em vários subsistemas sociais brasileiros, dentre os quais o subsistema de saúde. Nesta tese, trabalhando com dados econômicos, sociais e de saúde, e construindo algumas variáveis-indicadores, confrontou-se, naquele período, necessidades da sociedade com ações do Estado, na área da saúde. Utilizando técnicas estatísticas - análise gráfica, associação estatística dos indicadores selecionados (matriz de correlação de PEARSON), análise em componentes principais, análise de agrupamento e análise de regressão linear múltipla com variáveis logaritímizadas - foi possível visualizar causas e conseqüências dessa alta entropia, caracterizada por desperdício de recursos e várias situações propensas à geração de crises nas organizações, setores e instituições do subsistema de saúde brasileiro. Propõe-se um método de alocação de recursos federais, objetivando minimizar desigualdades entre as Unidades da Federação, a partir de seus desempenhos na área de saúde.
Resumo:
O presente estudo teve como objetivo avaliar as modificações que ocorreram no ecossistema aquático pela transformação rio-reservatório devido à construção e operação da barragem Dona Francisca. Amostras sazonais foram coletadas para avaliar características físicas e químicas ao longo de dois anos em nove estações amostrais na área correspondente ao reservatório da Dona Francisca, compreendendo quatro períodos de amostragem antes da formação do reservatório e quatro períodos depois da formação do reservatório, totalizando 8 períodos. No Capítulo 1 são apresentadas as bases teóricas sobre reservatório como ecossistemas complexos e compartimentalisados. O capítulo dois corresponde ao estudo experimental dos processos de estratificação e circulação baseado nos perfis verticais de temperatura, oxigênio dissolvido, condutividade elétrica e pH. No Capítulo 3 são comparados os padrões espaciais e temporais através da análise de alguns características físicas e químicas em duas fases, sendo uma compreendendo um ano antes de reservatório e outra compreendendo um ano depois da formação do reservatório. Por último, no Capítulo 4 é apresenteda uma análise integrada das características físicas e químicas da água usando análise multivariada (agrupamento e ordenação). Os resultados demonstraram que houve alterações das características limnológicas tanto no espaço como no tempo. As alterações compreendem mudanças nos padrões de fluxo unidirecional da antiga condição de rio para padrões anuais com períodos de estratificação com formação de termoclina no verão, deslocamento de massas de água sem homogeneizaçãi da coluna de água no outono e circulação com homogeneisação da coluna de água no inverno e primavera. Tais padrões variaram nas diferentes reggiões do reservatório, e conduziram à classificação do reservatório Dona Francisca como monomítico quente. A zonação em três regiões distintas baseada no gradiente longitudinal causado pela pressaão da cunha fluvial do rio principal, e a formação de remansos são fenômenos comuns à maioria dos reservatórios sendo também constatados no reservatório dona Francisca. As mudanças constatadas resultaram em processos de precipitação e sedimentação de materiais como ferro, manganês e sólidos suspensos, os quais eram carregados rio abaixo antes da formação do reservatório. Além disso, foram registradas mudanças no balanço térmico e químico, como o aumento da temperatur e a diminuição do oxigênio dissolvido devido ao aumento do tempo de residência. Também ocorreu aumento gradual da acidez e demanda química de oxigênio causada pela decomposição da vegetação submersa.
Resumo:
A compreensão e a produção de metáforas são consideradas habilidades necessárias para o desenvolvimento inicial do léxico e para a formação de conceitos. As teorias da metáfora conceitual de Lakoff e Johnson (1980; 2002) e das metáforas verbais como aproximações semânticas de Duvignau (2003) demonstram a importância das metáforas para o desenvolvimento do pensamento e da linguagem. O objetivo deste estudo é verificar o processo de analogia envolvido na formação de conceitos verbais em crianças no período inicial de aquisição da linguagem oral, através da tarefa de denominação de ações de vídeo. Utilizou-se um delineamento transversal, quasi-experimental, de grupos contrastantes. Comparando um grupo de 80 crianças de 2 a 4 anos com um grupo de 75 adultos universitários com idades entre 17 e 34 anos, constatou-se a presença da analogia nos dois grupos. Os dados foram analisados através do teste não-paramétrico U de Wilcoxon-Mann-Whitney (WMW) e do coeficiente de correlação para postos de Spearman. Os resultados foram estatisticamente diferentes para quase todas as variáveis estudadas. As crianças mostraram maior capacidade analógica nas primeiras respostas aos filmetes. Este resultado revelou que, quando não dispõem do léxico convencional para nomear uma ação, as crianças se utilizam de uma estratégia de aproximação semântica por analogia para expressar uma idéia. Os adultos, ao contrário, apresentaram um léxico altamente convencional. No entanto, quando solicitados a fornecer uma segunda alternativa de resposta aos filmetes, também apresentam aproximações semânticas por analogia. As aproximações podem ser do tipo intradomínio (sinonímia) e extradomínio (metáfora). O mesmo grupo de 80 crianças foi dividido em dois grupos com idades de 2 a 3 anos e de 3,1 a 4,4 anos, que foram comparados entre si. Os resultados mostraram diferenças estatisticamente significativas, demonstrando que as aproximações semânticas diminuem de freqüência conforme a idade avança, dando lugar a um léxico mais convencional e específico. O grupo de crianças brasileiras foi comparado com um grupo de crianças francesas da mesma faixa etária, sugerindo que há uma universalidade no uso das aproximações semânticas. Encontrou-se um percentual em torno de 35% de aproximações semânticas na faixa etária dos 2 aos 3 anos e 24% na faixa etária dos 3 aos 4 anos. A análise dos estímulos, realizada através da análise de agrupamento (cluster), demonstrou semelhanças e diferenças nos tipos de respostas aos filmetes. Os dados deste estudo são discutidos dentro da abordagem da psicolingüística cognitiva.
Resumo:
Ecomorphology is a science based on the idea that morphological differences among species could be associated with distinct biological and environmental pressures suffered by them. These differences can be studied employing morphological and biometric indexes denominated Ecomorphological attributes , representing standards that express characteristics of the individual in relation to its environment, and can be interpreted as indicators of life habits or adaptations suffered due its occupation of different habitats. This work aims to contribute for the knowledge of the ecomorphology of the Brazilian marine ichthyofauna, specifically from Galinhos, located at Rio Grande do Norte state. 10 different species of fish were studied, belonging the families Gerreidae (Eucinostomus argenteus), Haemulidae (Orthopristis ruber,Pomadasyscorvinaeformis,Haemulonaurolineatum,Haemulonplumieri,Haemulonsteindachneri), Lutjanidae (Lutjanus synagris), Paralichthyidae (Syaciummicrurum), Bothidae (Bothus ocellatus) and Tetraodontidae (Sphoeroidestestudineus), which were obtained during five collections, in the period time of September/2004 to April/2005, utilizing three special nets. The ecomorphological study was performed at the laboratory. Eight to ten samples of each fish specie were measured. Fifteen morphological aspects were considered to calculate twelve ecomorphological attributes. Multivariate statistical analysis methods such as Principal Component Analysis (PCA) and Cluster Analysis were done to identify ecmorphological patterns to describe the data set obtained. As results, H.aurolineatumwas the most abundant specie found (23,03%) and S.testudineusthe less one with 0,23%. The 1st Principal component showed variation of 60,03% with influence of the ecomorphological attribute related to body morphology, while the 2nd PC with 23,25% variation had influence of the ecomorphological attribute related to oral morphology. The Cluster Analiysis promoted the identification of three distinct groups Perciformes, Pleuronectiformes and Tetraodontiformes. Based on the obtained data, considering morphological characters differences among the species studied, we suggest that all of them live at the medium (E.argenteus,O.rubber, P.corvinaeformis,H.aurolineatum,H.plumieri,H.steindachneri,L.synagris) and bottom (S.micrurum,B.ocellatus,S.testudineus) region of column water.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
Resumo:
The increase in ultraviolet radiation (UV) at surface, the high incidence of non-melanoma skin cancer (NMSC) in coast of Northeast of Brazil (NEB) and reduction of total ozone were the motivation for the present study. The overall objective was to identify and understand the variability of UV or Index Ultraviolet Radiation (UV Index) in the capitals of the east coast of the NEB and adjust stochastic models to time series of UV index aiming make predictions (interpolations) and forecasts / projections (extrapolations) followed by trend analysis. The methodology consisted of applying multivariate analysis (principal component analysis and cluster analysis), Predictive Mean Matching method for filling gaps in the data, autoregressive distributed lag (ADL) and Mann-Kendal. The modeling via the ADL consisted of parameter estimation, diagnostics, residuals analysis and evaluation of the quality of the predictions and forecasts via mean squared error and Pearson correlation coefficient. The research results indicated that the annual variability of UV in the capital of Rio Grande do Norte (Natal) has a feature in the months of September and October that consisting of a stabilization / reduction of UV index because of the greater annual concentration total ozone. The increased amount of aerosol during this period contributes in lesser intensity for this event. The increased amount of aerosol during this period contributes in lesser intensity for this event. The application of cluster analysis on the east coast of the NEB showed that this event also occurs in the capitals of Paraiba (João Pessoa) and Pernambuco (Recife). Extreme events of UV in NEB were analyzed from the city of Natal and were associated with absence of cloud cover and levels below the annual average of total ozone and did not occurring in the entire region because of the uneven spatial distribution of these variables. The ADL (4, 1) model, adjusted with data of the UV index and total ozone to period 2001-2012 made a the projection / extrapolation for the next 30 years (2013-2043) indicating in end of that period an increase to the UV index of one unit (approximately), case total ozone maintain the downward trend observed in study period
Resumo:
Objetivou-se neste trabalho a obtenção de padrões de infestação de plantas daninhas na cultura de cana-de-açúcar com histórico de colheita mecanizada sem queima prévia da palha. Foram realizadas amostragens em 28 talhões na região de Ribeirão Preto, SP; em cada talhão foram demarcadas unidades de avaliação e coleta, na proporção de duas por hectare, que consistiram de áreas (quatro linhas de 4 metros de comprimento) mantidas sem controle de plantas daninhas e onde foram realizadas as amostragens de plantas emergidas. As amostragens foram realizadas aos 120 dias após o corte, com quadrados vazados (0,5 x 0,5 m) lançados aleatoriamente duas vezes em cada uma das unidades de avaliação e coleta. Com os dados obtidos, calculou-se a importância relativa e o índice de agregação das espécies ou grupo de espécies. Esses índices foram usados no processamento da análise de agrupamento hierárquica, utilizando como medida de semelhança a distância euclidiana e como estratégia de agrupamento o método UPGMA (Unweighted Pair-Group Method using arithmetic Averages). Foi possível distinguir quatro grupos em função da importância relativa e cinco grupos de talhões em função do índice de agregação; dentro de alguns grupos houve formação de subgrupos.
Resumo:
A alface-d'água (Pistia stratiotes) é uma das principais entre as macrófitas aquáticas que causam problemas em corpos hídricos no Brasil e são consideradas como plantas daninhas. O presente trabalho foi realizado com os objetivos de conhecer melhor a variabilidade genética dessa macrófita e relacionar essa variabilidade com a resposta à aplicação do herbicida glyphosate. Para isso, foram coletados indivíduos em 12 corpos hídricos em diferentes cidades do território nacional (Americana, Cambaratiba, Curitiba, Itapura, Jaboticabal, Lagoa Santa, Piraí, Rio Grande, Rubinéia, Salto Grande, Santa Gertrudes e Três Lagoas). Os acessos foram caracterizados pelo uso de marcadores RAPD (DNA Polimórfico Amplificado ao Acaso), que permitiram, com o auxílio de iniciadores aleatórios, a caracterização dos locos polimórficos identificados por uma matriz de ausência e presença de bandas. Utilizando essa matriz, a análise de agrupamento permitiu nítida classificação dos acessos em três grupos com diferenças genéticas entre eles. Um ensaio de controle químico, com plantas mantidas em vasos plásticos (5 L) e pulverizadas com o herbicida glyphosate nas concentrações de 0,0, 0,6, 1,2, 1,8 e 2,4 kg ha-1, identificou, utilizando avaliações aos 7, 14 e 21 dias após aplicação, que as duas maiores doses promoveram melhor efeito herbicida. Foi verificado também que os acessos de Curitiba e Cambaratiba apresentaram menor suscetibilidade ao herbicida glyphosate. Não houve correspondência entre a estrutura de grupos dos acessos pela análise multivariada de agrupamento com a técnica RAPD e a suscetibilidade da alface-d'água ao glyphosate.
Resumo:
O objetivo deste estudo foi avaliar a possibilidade de agrupar talhões de cana-de-açúcar colhida mecanicamente e sem queima prévia da palha na região de Ribeirão Preto-SP, de acordo com o potencial de infestação de plantas daninhas, por meio de análise de agrupamento por método hierárquico e outras técnicas de análise multivariada, utilizando como variável o índice de infestação relativa atribuído por avaliações visuais, em duas etapas. A primeira contemplou 20 talhões de cana-planta com ciclo de 18 meses; essas áreas foram utilizadas para comparação de dois métodos de estimativa da composição específica da flora daninha: análise fitossociológica e por meio da porcentagem visual de cobertura geral (CG) e específica (CE). A segunda etapa consistiu no levantamento da composição específica da comunidade de plantas daninhas em 189 talhões, em áreas de cana-soca colhidas durante a safra de 2008, incluindo nesses talhões apenas CG e CE. Com as informações sobre os levantamentos da comunidade infestante foi construído um banco de dados, posteriormente submetido a análises exploratórias por técnicas de estatística multivariada. Para as principais espécies dentro dos talhões, que foram DIGNU, ARACH, IPOHF, MRRCI e IPOQU, seguidas de CYPRO, ELEIN e EPHHS, foram verificados 75% de coincidências de resultados entre os dois métodos de avaliação. Também notou-se que as avaliações visuais de porcentagem de cobertura das espécies podem substituir, para fins de praticidade, agilidade e aplicabilidade, as avaliações fitossociológicas, uma vez que proporcionaram boa capacidade de detecção das principais plantas daninhas dentro de cada talhão. As técnicas de estatística multivariada demonstraram que os talhões podem ser agrupados de acordo com semelhanças na intensidade da infestação e na composição específica.
Resumo:
Avaliaram-se as relações entre características físicas e morfológicas do sêmen de bovinos das subespécies Bos taurus taurus e Bos taurus indicus com a idade dos touros e a época de colheita do sêmen. Utilizaram-se observações feitas durante o período de 1993 a 1999, em 42 touros com 12 a 174 meses de idade, divididos em cinco classes: Bos taurus taurus - 12 a 36 meses; 37 a 60 meses; 61 a 84 meses; 85 a 108 meses; e 109 a 138 meses; e Bos taurus indicus - 12 a 42 meses; 43 a 72 meses; 73 a 102 meses; 103 a 132 meses; e 133 a 174 meses. As características analisadas foram: volume, turbilhonamento espermático, concentração espermática, motilidade espermática, vigor espermático, anormalidades espermáticas e integridade do acrossoma. No processamento das análises, utilizaram-se as médias das características em cada classe de idade e o mês de colheita de sêmen durante o período de 1993 a 1999. As técnicas estatísticas multivariadas de componentes principais e de agrupamento hierárquico mostraram resultados que podem contribuir na escolha de sêmen de melhor qualidade. As classes 103 a 132 meses e 133 a 174 meses para a subespécie Bos taurus indicus e a classe de idade 109 a 138 meses para a subespécie Bos taurus taurus foram as mais contrastantes. Para ambas as subespécies, nos meses mais úmidos, o sêmen apresentou menor qualidade, principalmente na subespécie Bos taurus taurus. As características do sêmen mais contrastantes no estudo por classes e no período de coleta de sêmen foram: vigor espermático, motilidade espermática, concentração espermática, integridade do acrossoma e anormalidades terciárias no sêmen.
Resumo:
The reef area of Pirangi beach has been experiencing antropogenic actions, mainly due to tourism activity. In order to evaluate these effects, surveys on seaweeds were conducted at nine stations located over the fringing reef. Benthic community (seaweeds/corals) were identified using the photoquadrat method, with 50 meters random transects located paralleled to the coast. The general categories evaluated in each transect were: rock, sand, seaweeds, corals and mollusks. Data achieved were processed at Coral Point Count with Excel Extensions software. A total of 30 seaweed species, 5 coral species and 1 mollusk species were identified. There was a high dominance of short algae at stations with high tourism pressure, whereas frondose algae usually occurred at places without human interference. Seaweeds with the highest percent cover were composed by Sargassum vulgare (59%), Caulerpa racemosa (47%) and Dictyopteris delicatula (33%). Cluster analyses considering benthic organisms revealed five benthic features: (1) submersed area characterized by a diversified marine flora; (2) area with dominance of Caulerpa racemosa and presence of Millepora alcicornis; (3) area with high cover of Sargassum vulgare; (4) trampling area characterized by bare rocks, short algae and Zoanthus sociatus and (5) area with high coverage of Palythoa caribaeroum. Obtained data suggest that the studied area has been damaged by tourism activities. Furthermore, observed differences in algal communities may be a good indicator of ecosystem health of Pirangi reefs
Resumo:
O objetivo deste trabalho foi determinar a distribuição da riqueza de espécies e a preferência pelo habitat de Carabidae e Staphylinidae (Coleoptera), em áreas com rotação de soja e milho, em plantio direto e convencional, e em áreas adjacentes a estas com fragmento florestal e povoamento de pínus, respectivamente. Os besouros foram amostrados por meio de armadilhas de solo distribuídas em dois transectos de 100 m de comprimento. A distribuição da riqueza de espécies nas culturas, no fragmento florestal e no pínus foi avaliada por meio de análise de regressão linear. A análise de agrupamento foi empregada para identificar as espécies quanto à preferência pelos habitats: fragmento florestal, pínus, cultura e interface. A distribuição da riqueza de espécies de Carabidae e Staphylinidae não variou em relação à posição no transecto, enquanto a riqueza de espécies observada nas interfaces foi elevada em comparação com a encontrada nos demais habitats. A ocorrência de espécies de Carabidae diferiu conforme o tipo de cobertura vegetal: Megacephala sp. e Scarites sp. preferiram áreas cultivadas em sistema de rotação soja-milho; Odontochila nodicornis (Dejean) preferiu o fragmento florestal e o povoamento de pínus. A espécie Abaris basistriatus Chaudoir caracterizou-se como generalista quanto à preferência pelo habitat.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)