876 resultados para Multidimensional. Desenvolvimento. Convergência. Divergência. Análise de agrupamentos
Resumo:
The problems of combinatory optimization have involved a large number of researchers in search of approximative solutions for them, since it is generally accepted that they are unsolvable in polynomial time. Initially, these solutions were focused on heuristics. Currently, metaheuristics are used more for this task, especially those based on evolutionary algorithms. The two main contributions of this work are: the creation of what is called an -Operon- heuristic, for the construction of the information chains necessary for the implementation of transgenetic (evolutionary) algorithms, mainly using statistical methodology - the Cluster Analysis and the Principal Component Analysis; and the utilization of statistical analyses that are adequate for the evaluation of the performance of the algorithms that are developed to solve these problems. The aim of the Operon is to construct good quality dynamic information chains to promote an -intelligent- search in the space of solutions. The Traveling Salesman Problem (TSP) is intended for applications based on a transgenetic algorithmic known as ProtoG. A strategy is also proposed for the renovation of part of the chromosome population indicated by adopting a minimum limit in the coefficient of variation of the adequation function of the individuals, with calculations based on the population. Statistical methodology is used for the evaluation of the performance of four algorithms, as follows: the proposed ProtoG, two memetic algorithms and a Simulated Annealing algorithm. Three performance analyses of these algorithms are proposed. The first is accomplished through the Logistic Regression, based on the probability of finding an optimal solution for a TSP instance by the algorithm being tested. The second is accomplished through Survival Analysis, based on a probability of the time observed for its execution until an optimal solution is achieved. The third is accomplished by means of a non-parametric Analysis of Variance, considering the Percent Error of the Solution (PES) obtained by the percentage in which the solution found exceeds the best solution available in the literature. Six experiments have been conducted applied to sixty-one instances of Euclidean TSP with sizes of up to 1,655 cities. The first two experiments deal with the adjustments of four parameters used in the ProtoG algorithm in an attempt to improve its performance. The last four have been undertaken to evaluate the performance of the ProtoG in comparison to the three algorithms adopted. For these sixty-one instances, it has been concluded on the grounds of statistical tests that there is evidence that the ProtoG performs better than these three algorithms in fifty instances. In addition, for the thirty-six instances considered in the last three trials in which the performance of the algorithms was evaluated through PES, it was observed that the PES average obtained with the ProtoG was less than 1% in almost half of these instances, having reached the greatest average for one instance of 1,173 cities, with an PES average equal to 3.52%. Therefore, the ProtoG can be considered a competitive algorithm for solving the TSP, since it is not rare in the literature find PESs averages greater than 10% to be reported for instances of this size.
Resumo:
The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data, this study provides a common group of data sets (benchmark data sets) to be shared among researchers and used for comparisons with new methods
Resumo:
Os dados são provenientes de 234 touros da raça Nelore participantes de um teste de progênie, no período de 1996 a 2003. A diferença esperada na progênie (DEP) de sete características: peso aos 120 e 210 dias, efeito materno (DMPP120 e DMPP210), peso e perímetro escrotal aos 365 e 450 dias, efeito direto (DDP365, DDP450, DDPE365 e DDPE450) e idade ao primeiro parto (DDIPP) foi utilizada para classificar os animais em três grupos, assim como identificar quais as características possuíram maior poder discriminatório na formação de cada grupo. Para tanto, foram utilizados procedimentos estatísticos multivariados de análise de agrupamentos k-médias e componentes principais. Os resultados evidenciaram que, dos três grupos formados, dois se destacaram quanto aos valores médios das DEPs. A importância desses dois grupos de touros foi confirmada pela análise de componentes principais, que associou a eles valores superiores de DEPs diretas de peso e perímetro escrotal. A quantidade da variabilidade original retida pelos dois primeiros componentes principais foi de 70,22%. Estes procedimentos mostraram-se eficientes e constituíram importantes ferramentas para classificar touros, discriminar variáveis, bem como resumir informações multivariadas, podendo ser usados como auxílio valioso na seleção de reprodutores para uso nos programas de melhoramento genético.
Resumo:
Neste trabalho, analisam-se algumas causas pelas quais clientes frequentam um supermercado, tais como: preço de produtos, localização do estabelecimento, rapidez de atendimento, qualidade de atendimento, variedade de produtos, estacionamento e outras. Por meio de análise estatística multivariada, foi verificada a relevância de cada causa em contraste com as outras, ou seja, a importância relativa de cada uma. Assim, pôde-se observar que a rapidez de atendimento desempenha um papel importante em relação às demais para o nível de serviço dos clientes. Utilizando-se análise de agrupamentos hierárquicos de variáveis e análise de correspondência, associaram-se causas em grupos e relacionaram-se causas a alguns fatores, como, por exemplo, escolaridade dos clientes, sendo esta uma observação interessante por existir, no Brasil, uma relação significativa entre renda e escolaridade. A coleta de dados foi realizada em um supermercado no interior de São Paulo e, desta forma, os resultados baseiam-se em um estudo de caso, tendo limitações inferenciais.
Resumo:
Pós-graduação em Educação - IBRC
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Agronomia (Energia na Agricultura) - FCA
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Educação Matemática - IGCE
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Geociências e Meio Ambiente - IGCE
Resumo:
Este trabalho foi feito em formato de artigo de acordo com as normas da revista Biota Neotropica, foi desenvolvido na Fazenda Tanguro, localizada em uma região de transição Amazônia - Cerrado, município de Querência/ MT, com o objetivo de estudar a composição e história natural da comunidade de serpentes encontrada na região. Foram realizadas seis expedições a área de estudo, que resultaram no registro de 203 espécimes (194 capturas), distribuídos em 34 espécies, 26 gêneros e 8 famílias. Uma Estimativa baseada na incidência de espécies raras (Jackknife 1) indicou uma riqueza total de 38 espécies na área. As espécies mais abundantes foram Caudisona durissa (N=50), Philodryas olfersii (N=15), Philodryas nattereri (N=13), Xenodon rabdocephalus (N=12), Lachesis muta (N=10) e Liophis almadensis (N=10). Uma análise de Coordenadas Principais (PCO) demonstrou que as taxocenoses se sobrepõem, revelando uma tendência para a formação de três grupos distintos: taxocenoses amazônicas, Cerrado e Mata Atlântica. A composição de espécies na fazenda Tanguro apresentou-se intermediária em relação aos agrupamentos formados por espécies Amazônicas e de Cerrado, ocorrendo espécies tanto com ampla distribuição, como endêmicas dos biomas Cerrado ou Amazônico. O padrão de utilização de habitat da taxocenose é terrícola, seguido de semi-arboricolas e fossorial. Há predominância de espécies de serpentes generalistas quanto a alimentação. Na análise de agrupamentos ecológicos, foram observados quatro grupos funcionais, mostrando que a complexidade da taxocenose é explicada tanto por fatores ecológicos como históricos.
Resumo:
O objetivo desta pesquisa foi analisar a variabilidade anual e sazonal das precipitações pluviométricas, tanto em sua dimensão temporal, como em sua distribuição espacial e determinar regiões pluviometricamente homogêneas, na bacia hidrográfica do Rio Mogi Guaçu. Foram utilizados dados mensais de precipitação pluvial de 40 postos pluviométricos, no período de 1975 a 1999. Na primeira etapa deste trabalho, analisaram-se os dados pluviométricos por meio da estatística descritiva, observando-se que alguns anos apresentavam características pluviométricas diferentes. Considerou-se nessa análise, os mapas pluviométricos anuais, de cada ano do período, e uma planilha cromática na classificação dos anos-padrão. Aos mapas e à planilha atribuíram-se cores, as quais obedeciam a uma escala definida pela Regra de Sturges. Dos anos classificados, escolheu-se 1983 (padrão chuvoso), 1994 (padrão seco) e 1995 (padrão habitual), para identificar possíveis oscilações nas chuvas sazonais. Posteriormente, fez-se uma análise de agrupamentos, utilizando-se, o método aglomerativo hierárquico, com o coeficiente de Ward, para a identificação de grupos de postos pluviométricos homogêneos, formou-se quatro grupos homogêneos. Esses grupos identificaram regiões homogêneas na bacia, em função da precipitação anual. Nessa análise, foi possível localizar grupos com o mesmo comportamento, ou seja, as regiões com maiores e menores índices pluviométricos.
Resumo:
Constituída por um conjunto de artigos de docentes da Faculdade de Arquitetura, Artes e Comunicação da Unesp e de outras instituições de ensino superior, esta obra tem como ponto de convergência a análise da mídia. Organizada pelo professor Mauro de Souza Ventura, coordenador do Programa de Pós-Graduação em Comunicação da Unesp, o livro busca compreender as dimensões socioculturais e de produção de sentido nos processos de elaboração, veiculação e recepção da comunicação midiática. Os aspectos abordados são diversos, mas os artigos podem ser reunidos em torno de três eixos - questões teórico-metodológicas, análises específicas de notícias e estudos sobre algumas especializações da comunicação da mídia. As análises transitam por temas como as ambivalências da chamada Teoria da Comunicação, o papel de storytellers dos jornalistas em sua produção na web, uma comparação das coberturas do caso da estudante Geysy Arruda feitas pelos jornais Folha e Estadão e o jornalismo científico na imprensa brasileira, entre outros.