998 resultados para Análise por Envoltória de Dados
Resumo:
The objective of this work was to develop a free access exploratory data analysis software application for academic use that is easy to install and can be handled without user-level programming due to extensive use of chemometrics and its association with applications that require purchased licenses or routines. The developed software, called Chemostat, employs Hierarchical Cluster Analysis (HCA), Principal Component Analysis (PCA), intervals Principal Component Analysis (iPCA), as well as correction methods, data transformation and outlier detection. The data can be imported from the clipboard, text files, ASCII or FT-IR Perkin-Elmer “.sp” files. It generates a variety of charts and tables that allow the analysis of results that can be exported in several formats. The main features of the software were tested using midinfrared and near-infrared spectra in vegetable oils and digital images obtained from different types of commercial diesel. In order to validate the software results, the same sets of data were analyzed using Matlab© and the results in both applications matched in various combinations. In addition to the desktop version, the reuse of algorithms allowed an online version to be provided that offers a unique experience on the web. Both applications are available in English.
Resumo:
The objective of this work is to demonstrate the efficient utilization of the Principal Components Analysis (PCA) as a method to pre-process the original multivariate data, that is rewrite in a new matrix with principal components sorted by it's accumulated variance. The Artificial Neural Network (ANN) with backpropagation algorithm is trained, using this pre-processed data set derived from the PCA method, representing 90.02% of accumulated variance of the original data, as input. The training goal is modeling Dissolved Oxygen using information of other physical and chemical parameters. The water samples used in the experiments are gathered from the Paraíba do Sul River in São Paulo State, Brazil. The smallest Mean Square Errors (MSE) is used to compare the results of the different architectures and choose the best. The utilization of this method allowed the reduction of more than 20% of the input data, which contributed directly for the shorting time and computational effort in the ANN training.
Resumo:
O objetivo deste trabalho foi empregar a análise exploratória de dados, no caso, a técnica de análise de componentes principais (PCA) como ferramenta na avaliação de modificadores químicos na determinação direta e simultânea de Al, As, Cu, Fe, Mn e Ni em álcool etílico combustível por espectrometria de absorção atômica em forno de grafite (GFAAS). Os modificadores químicos avaliados foram: Pd(NO3)2 + Mg(NO3)2; W/Rh; W+ co-injeção de Pd(NO3)2 + Mg(NO3)2 e para cada modificador foram utilizadas trintas amostras de álcool etílico combustível. Como dados experimentais foram utilizados os resultados dos testes de adição e recuperação dos analitos frente aos diferentes modificadores químicos estudados. O emprego da técnica de PCA possibilitou a separação dos tipos de modificadores em função do intervalo de recuperação do analito. Dentre os modificadores avaliados, W+ co-injeção de Pd(NO3)2 + Mg(NO3)2 apresentou-se como a espécie de maior correlação positiva, pois apresenta os maiores teores de recuperação, e sendo assim, foi o escolhido para o desenvolvimento de metodologia para determinação direta e simultânea de Al, As, Cu, Fe, Mn e Ni em álcool etílico combustível por GFAAS.
Resumo:
Foram analisadas amostras de quiabo dos municípios de Caruaru e Vitória de Santo Antão, em Pernambuco, assim como nos municípios de Ceará-Mirim, Macaíba e Extremoz no estado do Rio Grande do Norte. A aplicação de dois métodos de análise exploratória de dados: Análise de Componentes principais - PCA e Análise de Agrupamentos Hierárquicos - HCA permitiu a discriminação geográfica do quiabo proveniente dos dois estados.
Resumo:
Esta pesquisa originou-se de uma base de dados de dois inventários a 100%, realizados em 1984 e 2000 sobre uma mesma área de 576 ha de floresta tropical primária, localizada na Floresta Nacional do Tapajós, Belterra, Pará. O objetivo da pesquisa foi utilizar a análise exploratória de dados e a regressão robusta para modelar o crescimento em diâmetro e área basal. Nos dois inventários as circunferências à altura do peito (CAP) foram medidas com fitamétrica, enquanto as alturas comerciais em 1984 foram medidas com o hipsômetro de Weiss e em 2000, estimadas com o uso de varas; o DAP mínimo em 1984 foi de 55 cm para todas as espécies e em 2000 foi adotado o DAP mínimo de 35 cm. As análises estatísticas foram precedidas de análise exploratória de dados (AED), em que foram utilizados o box plot (caixa-de-bigodes) na detecção de outliers (observações discrepantes) e o gráfico stem-and-leaf (tronco-e-folhas) para filtrar as observações extremas. Utilizou-se a regressão robusta para ajustar os modelos na presença de outliers. A pesquisa mostrou que, apesar das variações intra e interespecíficas, as seis espécies, em conjunto, apresentaram taxas de crescimento medianas observadas e esperadas em diâmetro e área basal de 4,56 e 4,28 mm/ano e 13,00 e 13,09 cm²/ha/ano, respectivamente. A pesquisa também mostrou que o uso da análise exploratória de dados e da regressão robusta viabilizou a análise e a determinação dos incrementos periódicos em diâmetro e área basal em bases consistentes. A metodologia empregada no caso específico dos dados disponíveis e tipos de variáveis mostrou ser mais eficiente com o uso de regressão robusta pelo método Least Trimmed Square do que pelo método dos mínimos quadrados ordinários.
Resumo:
Os delineamentos sistemáticos se destacam pela sua compacidade e abrangência e por permitir testar maior número de espaçamentos possíveis. No entanto, não é utilizado devido ao arranjo sistemático (não casualizado) das plantas e à alta sensibilidade para valores perdidos. O objetivo deste trabalho foi descrever o modelo geoestatístico e métodos associados de inferência no contexto de análise de experimentos não aleatorizados, reportando resultados aplicados para identificar a dependência espacial em um particular experimento em delineamento sistemático tipo leque de Eucalyptus dunnii. Também foram propostas, analisadas e comparadas diferentes alternativas para tratar dados faltantes que pudessem advir de falhas e, ou, mortalidade de plantas. Os dados foram analisados seguindo-se três modelos que diferiram, com co-variáveis, na forma de tratar os dados faltantes. Para cada um destes foi construído um semivariograma, com o ajuste de três modelos de função de correlação, sendo os parâmetros estimados pelo método de máxima verossimilhança e selecionados pelo critério de Akaike. Esses modelos, com e sem o componente espacial, foram comparados pelo teste da razão de verossimilhança. De acordo com os resultados, verificou-se que: (1) as co-variáveis interagiram positivamente com a variável de resposta, evitando que dados coletados sejam desperdiçados; (2) a comparação dos modelos, com e sem o componente espacial, não confirmou a existência de dependência; (3) a incorporação da estrutura de dependência espacial aos modelos observacionais recuperou a capacidade de fazer inferências válidas na ausência de aleatorização, permitindo contornar problemas operacionais e, assim, garantindo que os dados possam ser submetidos a uma análise clássica.
Resumo:
Os métodos atualmente utilizados para realização de análise sensorial têm deixado muito a desejar por não traduzir satisfatoriamente os resultados. Diante deste problema, analisou-se a possibilidade de introdução de um fator que medisse o índice de concordância dos provadores sobre determinado aspecto analisado. Para validação deste coeficiente, foi avaliada a concordância entre julgadores na análise sensorial para três diferentes amostras de suco de pinha (Annona squamosa L.): uma constituída apenas do suco de pinha sem leite e duas com diferentes concentrações pinha/leite. Utilizou-se a Análise de Componentes Principais (ACP) e também a nova metodologia proposta pelos autores, com base na definição do desvio-padrão, aplicada às frequências absolutas das notas dos julgadores, para cada propriedade sensorial estudada. Com esta metodologia, definiu-se uma relação para o cálculo de uma medida de concordância entre os julgadores, denominada de coeficiente de concordância, a qual pode assumir valores de 0 a 100% e também permite comparações que não são possíveis, utilizando-se da ACP. Por fim, concluiu-se que tal metodologia é mais indicada que a ACP, na avaliação da concordância entre os julgadores na análise sensorial.
Resumo:
O objetivo deste trabalho foi analisar o comportamento espaçotemporal da precipitação pluvial no Estado do Rio Grande do Sul, entre os decênios de 1987-1996 e 1997-2006, por meio de técnicas de mineração de dados. As séries históricas foram adquiridas no sistema de informações hidrológicas Hidroweb. A metodologia utilizada teve como base o modelo CRISP-DM (Cross Industry Standard Process for Data Mining). Foram definidas áreas pluviometricamente homogêneas para os decênios de 1987-1996 e 1997-2006. Em seguida, pela sobreposição dos agrupamentos obtidos para os dois períodos, encontraram-se seis zonas comuns aos dois decênios (A a F). As alterações ocorridas foram avaliadas nas seguintes escalas temporais: anual, sazonal e mensalmente. Os resultados indicaram incrementos significativos (20 a 240 mm) na precipitação anual em todas as zonas, exceto na zona A. Na análise sazonal, as variações foram aleatórias, sendo que, na primavera, todas as zonas apresentaram incremento significativo (44 a 142 mm). Na análise mensal, destaca-se a redução ocorrida no mês de janeiro em todas as zonas, exceto na E. Nos demais meses, as variações foram aleatórias. Os resultados mostram que, entre os decênios, houve uma alteração no volume da precipitação pluvial em todas as escalas temporais analisadas.
Resumo:
OBJETIVO: Rever, usando a metodologia de análise secundária de dados, os casos descritos de doença hidática policística (DHP) pelo Echinococcus vogeli, quanto às características clínico-epidemiológicas, de evolução e procedimentos terapêuticos. MÉTODO: Foram usados cinco bancos eletrônicos; anais de eventos científicos da área de Medicina Tropical; livros textos; consultas aos índices remissivos de revistas não-indexadas e a especialistas. As 52 variáveis estudadas foram categorizadas para cada caso de DHP e registradas em ficha-padrão. Somente foram incluídos os casos com comprovação histológica e/ou parasitológica do E. vogeli. RESULTADOS: Foram recuperados 131 trabalhos publicados e uma comunicação pessoal, sendo grande parte com somente um caso descrito, e entre estes apenas 17 (12,9%) tinham casos com comprovação do agente etiológico, com um total de 44 pacientes: 52,3% do sexo masculino; média de idade de 45,0 (± 16,7) anos; e 50% descritos no Brasil. A presença de massas e a dor abdominal foram registradas em 94,7% (18/19) e 92,6% (25/27), respectivamente. Não houve diferença estatística (p>0,20) entre os resultados do tratamento clínico (albendazol) e cirúrgico, mas as freqüências de "sem êxito" foram, respectivamente, de 0% e 28,6%, e as de óbitos de 0% e 21,4%. CONCLUSÕES: A maioria dos trabalhos sobre a DHP não tem pacientes com comprovação etiológica e, conseqüentemente, é possível que parte do conhecimento clínico atual sofra mudanças significativas por investigações futuras. De outra parte, os dados levantados indicam que a melhor opção terapêutica, nos casos irressecáveis, é o uso de albendazol.
Resumo:
OBJETIVOS: Avaliar a concordância entre as técnicas de microscopia de polarização e microscopia confocal na avaliação do fuso meiótico de oócitos humanos maturados in vivo. MÉTODOS: Estudo prospectivo que avaliou oócitos com o primeiro corpúsculo polar extruído obtidos de mulheres inférteis submetidas à estimulação ovariana para realização de injeção intracitoplasmática de espermatozoide. Os oócitos com o primeiro corpúsculo polar extruído foram avaliados por meio da microscopia de polarização e, imediatamente após, foram fixados e corados para avaliação dos microtúbulos e cromatina pela microscopia confocal de alto desempenho. Foram comparadas as técnicas de microscopia de polarização e confocal, de acordo com a visualização ou não do fuso meiótico pela microscopia de polarização e a presença ou não de anomalias meióticas à análise pela microscopia confocal. Foram calculados os intervalos de confiança, o índice de Kappa e a concordância entre as metodologias, considerando a análise da microscopia de imunofluorescência como padrão-ouro para avaliação de normalidade do fuso e distribuição cromossômica oocitária. RESULTADOS: Observou-se que 72,7% dos oócitos em metáfase II com fuso celular não visível à polarização apresentaram anormalidades meióticas à análise confocal e que 55,6% dos oócitos em metáfase II com fuso celular visível à polarização apresentaram-se como oócitos anormais à análise confocal. Somente 44,4% dos oócitos com fuso celular visível à polarização apresentaram-se como normais à análise confocal. A concordância entre os métodos foi de 51,1% (Kappa: 0,11; IC95% -0,0958 - 0,319). CONCLUSÕES: A baixa concordância entre a microscopia de polarização e a confocal na avaliação do fuso meiótico oocitário sugere que a visualização do fuso meiótico de oócitos humanos em metáfase II pela microscopia de polarização tem limitado o valor preditivo de normalidade meiótica oocitária.
Resumo:
O objetivo deste trabalho foi o de indicar, ou não, distribuições alternativas e assimétricas para a análise de dados que foram obtidos com os testes de germinação, frio e envelhecimento, peso de matéria seca e porcentagem de umidade medidos durante a maturação de sementes de milho. Para isto foi realizada uma análise exploratória dos dados obtidos de um experimento em que foram semeados três híbridos em três épocas distintas e cujas plantas tiveram as espigas amostradas dentro de cada parcela. O intervalo de coleta variou em quatro dias começando após o 23º e terminando no 59º dia após o florescimento. As distribuições estudadas foram a Normal, a Lognormal, a de Gumbel e a de Weibull. O valor numérico do logaritmo da função verossimilhança foi usado como indicativo do grau de ajustamento. Os resultados indicaram que distribuições diferentes da Normal podem ser uma alternativa para dados em porcentagem obtidos durante a maturação. O maior valor do logaritmo da função de verossimilhança foi obtido com o ajuste da distribuição de Gumbel para os dados germinativos em percentagem e a de Weibull para o peso da matéria seca acumulada e porcentagem de umidade.
Resumo:
Nos últimos anos verificou-se uma evolução significativa dos equipamentos de diagnóstico por imagem, tendo como consequência um aumento do número de exames realizados. A nível internacional assistiu-se a um aumento no consumo de exames de Tomografia Computorizada e Ressonância Magnética e uma estagnação de exames de Radiologia Geral. Este estudo pretende avaliar o consumo de exames imagiológicos nos Hospitais Distritais de Portugal Continental entre 2002-2006, consoante o tipo de Gestão hospitalar e valências imagiológicas disponíveis. Os dados analisados estavam disponíveis on-line na Associação Central dos Sistemas de Saúde. Analisaram-se 36 Hospitais, sendo 21 E.P.E. e 15 S.P.A. Foi observado um crescimento médio de 11% na valência de Radiologia Geral, 48,8% em Mamografia, 11,2% em Ecografia, 24,9% em Tomografia Computorizada e 32,5% em Ressonância Magnética. Constatou-se ainda que a valência de Ressonância Magnética apenas se encontra disponível nos Hospitais E.P.E.. Concluiu-se que apesar da aparente fragilidade dos dados disponíveis, nos Hospitais E.P.E. foi evidente uma maior capacidade tecnológica, que se traduz numa maior disponibilidade de equipamentos e técnicas. O comportamento das técnicas avaliadas é semelhante às referências internacionais, com excepção de RG, onde foi observada uma clara tendência de crescimento.
Resumo:
O grupo das mulheres trabalhadoras do sexo (MTS) é reconhecido como uma populaçãode maior risco à infecção pelo HIV, tanto pela prevalência elevada, como por suavulnerabilidade social como pelos fatores relacionados à própria atividade profissional. Porém, arealização de estudos nos subgrupos de maior risco ao HIV mediante estratégias convencionaisde amostragem é, em geral, problemática por essas populações possuírem pequena magnitudeem termos populacionais e por estarem vinculados a comportamentos estigmatizados ouatividades ilegais. Em 1997, foi proposto um método de amostragem probabilística parapopulações de difícil acesso denominado Respondent-Driven Sampling (RDS). O método éconsiderado como uma variante da amostragem em cadeia e possibilita a estimação estatísticados parâmetros de interesse. Na literatura internacional, para análise de dados coletados porRDS, muitos autores têm utilizado técnicas estatísticas multivariadas tradicionais, sem levar emconta a estrutura de dependência das observações, presente nos dados coletados por RDS.A presente tese tem por objetivo contribuir para suprir informações sobre as práticas derisco relacionadas ao HIV entre as mulheres trabalhadoras do sexo (MTS) com odesenvolvimento de método estatístico para análise de dados coletados com o método deamostragem RDS. Com tal finalidade, foram utilizadas as informações coletadas na PesquisaCorrente da Saúde realizada em dez cidades brasileiras, com 2.523 MTS recrutadas por RDS,entre os anos de 2008 e 2009. O questionário foi autopreenchido e incluiu módulos sobrecaracterísticas da atividade profissional, práticas sexuais, uso de drogas, testes periódicos deHIV, e acesso aos serviços de saúde.Primeiramente, foram descritos alguns pressupostos do RDS e todas as etapas deimplantação da pesquisa. Em seguida, foram propostos métodos de análise multivariada, considerando o RDS como um desenho complexo de amostragem.
Resumo:
O presente estudo trata de uma pesquisa quantitativa e descritiva que teve por objetivo caracterizar as produções científicas na área de enfermagem com os descritores “HIV and enfermagem”, “AIDS and Enfermagem”, “DST and enfermagem”, publicadas na Scientific Eletronic Library Online – SciELO, no período de 1992 à 2008. A amostra constitui-se de 40 publicações, sendo que 38 eram sobre HIV/AIDS e 2 sobre DST em geral. Foi verificado que o número de estudos tem aumentado nos últimos anos o que demonstra interesse por parte dos enfermeiros para pesquisar a temática. O Estado de São Paulo concentra a maior parte dos artigos publicados 85%. Na caracterização das publicações de acordo com a metodologia, 47,5%, eram estudos qualitativos o que pode traduzir a necessidade de identificar através da pesquisa os aspectos subjacentes a essas temáticas. Os sujeitos de estudo em 37,5% dos trabalhos eram mulheres e 57,5% haviam sido desenvolvidos com clientes soropositivos ao HIV/AIDS. Quanto ao objeto de estudo abordado pelos autores, 30% dos trabalhos pesquisaram o conhecimento dos clientes sobre DST/AIDS e 30% sobre a assistência de enfermagem.