881 resultados para Cadeias de Markov. Algoritmos genéticos
Resumo:
The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data, this study provides a common group of data sets (benchmark data sets) to be shared among researchers and used for comparisons with new methods
Resumo:
A 3D binary image is considered well-composed if, and only if, the union of the faces shared by the foreground and background voxels of the image is a surface in R3. Wellcomposed images have some desirable topological properties, which allow us to simplify and optimize algorithms that are widely used in computer graphics, computer vision and image processing. These advantages have fostered the development of algorithms to repair bi-dimensional (2D) and three-dimensional (3D) images that are not well-composed. These algorithms are known as repairing algorithms. In this dissertation, we propose two repairing algorithms, one randomized and one deterministic. Both algorithms are capable of making topological repairs in 3D binary images, producing well-composed images similar to the original images. The key idea behind both algorithms is to iteratively change the assigned color of some points in the input image from 0 (background)to 1 (foreground) until the image becomes well-composed. The points whose colors are changed by the algorithms are chosen according to their values in the fuzzy connectivity map resulting from the image segmentation process. The use of the fuzzy connectivity map ensures that a subset of points chosen by the algorithm at any given iteration is the one with the least affinity with the background among all possible choices
Resumo:
The course of Algorithms and Programming reveals as real obstacle for many students during the computer courses. The students not familiar with new ways of thinking required by the courses as well as not having certain skills required for this, encounter difficulties that sometimes result in the repetition and dropout. Faced with this problem, that survey on the problems experienced by students was conducted as a way to understand the problem and to guide solutions in trying to solve or assuage the difficulties experienced by students. In this paper a methodology to be applied in a classroom based on the concepts of Meaningful Learning of David Ausubel was described. In addition to this theory, a tool developed at UFRN, named Takkou, was used with the intent to better motivate students in algorithms classes and to exercise logical reasoning. Finally a comparative evaluation of the suggested methodology and traditional methodology was carried out, and results were discussed
Resumo:
In development of Synthetic Agents for Education, the doubt still resides about what would be a behavior that could be considered, in fact, plausible for this agent's type, which can be considered as effective on the transmission of the knowledge by the agent and the function of emotions this process. The purpose of this labor has an investigative nature in an attempt to discover what aspects are important for this behavior consistent and practical development of a chatterbot with the function of virtual tutor, within the context of learning algorithms. In this study, we explained the agents' basics, Intelligent Tutoring Systems, bots, chatterbots and how these systems need to provide credibility to report on their behavior. Models of emotions, personality and humor to computational agents are also covered, as well as previous studies by other researchers at the area. After that, the prototype is detailed, the research conducted, a summary of results achieved, the architectural model of the system, vision of computing and macro view of the features implemented.
Uma análise experimental de algoritmos exatos aplicados ao problema da árvore geradora multiobjetivo
Resumo:
The Multiobjective Spanning Tree Problem is NP-hard and models applications in several areas. This research presents an experimental analysis of different strategies used in the literature to develop exact algorithms to solve the problem. Initially, the algorithms are classified according to the approaches used to solve the problem. Features of two or more approaches can be found in some of those algorithms. The approaches investigated here are: the two-stage method, branch-and-bound, k-best and the preference-based approach. The main contribution of this research lies in the fact that no research was presented to date reporting a systematic experimental analysis of exact algorithms for the Multiobjective Spanning Tree Problem. Therefore, this work can be a basis for other research that deal with the same problem. The computational experiments compare the performance of algorithms regarding processing time, efficiency based on the number of objectives and number of solutions found in a controlled time interval. The analysis of the algorithms was performed for known instances of the problem, as well as instances obtained from a generator commonly used in the literature
Resumo:
Nonogram is a logical puzzle whose associated decision problem is NP-complete. It has applications in pattern recognition problems and data compression, among others. The puzzle consists in determining an assignment of colors to pixels distributed in a N M matrix that satisfies line and column constraints. A Nonogram is encoded by a vector whose elements specify the number of pixels in each row and column of a figure without specifying their coordinates. This work presents exact and heuristic approaches to solve Nonograms. The depth first search was one of the chosen exact approaches because it is a typical example of brute search algorithm that is easy to implement. Another implemented exact approach was based on the Las Vegas algorithm, so that we intend to investigate whether the randomness introduce by the Las Vegas-based algorithm would be an advantage over the depth first search. The Nonogram is also transformed into a Constraint Satisfaction Problem. Three heuristics approaches are proposed: a Tabu Search and two memetic algorithms. A new function to calculate the objective function is proposed. The approaches are applied on 234 instances, the size of the instances ranging from 5 x 5 to 100 x 100 size, and including logical and random Nonograms
Resumo:
The Scientific Algorithms are a new metaheuristics inspired in the scientific research process. The new method introduces the idea of theme to search the solution space of hard problems. The inspiration for this class of algorithms comes from the act of researching that comprises thinking, knowledge sharing and disclosing new ideas. The ideas of the new method are illustrated in the Traveling Salesman Problem. A computational experiment applies the proposed approach to a new variant of the Traveling Salesman Problem named Car Renter Salesman Problem. The results are compared to state-of-the-art algorithms for the latter problem
Resumo:
Symbolic Data Analysis (SDA) main aims to provide tools for reducing large databases to extract knowledge and provide techniques to describe the unit of such data in complex units, as such, interval or histogram. The objective of this work is to extend classical clustering methods for symbolic interval data based on interval-based distance. The main advantage of using an interval-based distance for interval-based data lies on the fact that it preserves the underlying imprecision on intervals which is usually lost when real-valued distances are applied. This work includes an approach allow existing indices to be adapted to interval context. The proposed methods with interval-based distances are compared with distances punctual existing literature through experiments with simulated data and real data interval
Resumo:
Este trabalho apresenta um algoritmo transgenético híbrido para a solução de um Problema de Configuração de uma Rede de Distribuição de Gás Natural. O problema da configuração dessas redes requer a definição de um traçado por onde os dutos devem ser colocados para atender aos clientes. É estudada neste trabalho uma maneira de conectar os clientes em uma rede com arquitetura em forma de árvore. O objetivo é minimizar o custo de construção da rede, mesmo que para isso alguns clientes que não proporcionam lucros deixem de ser atendidos. Esse problema pode ser formulado computacionalmente através do Problema de Steiner com Prêmios. Este é um problema de otimização combinatória da classe dos NPÁrduos. Este trabalho apresenta um algoritmo heurístico para a solução do problema. A abordagem utilizada é chamada de Algoritmos Transgenéticos, que se enquadram na categoria dos algoritmos evolucionários. Para a geração de soluções inicias é utilizado um algoritmo primaldual, e pathrelinking é usado como intensificador
Resumo:
The use of Multiple Input Multiple Output (MIMO) systems has permitted the recent evolution of wireless communication standards. The Spatial Multiplexing MIMO technique, in particular, provides a linear gain at the transmission capacity with the minimum between the numbers of transmit and receive antennas. To obtain a near capacity performance in SM-MIMO systems a soft decision Maximum A Posteriori Probability MIMO detector is necessary. However, such detector is too complex for practical solutions. Hence, the goal of a MIMO detector algorithm aimed for implementation is to get a good approximation of the ideal detector while keeping an acceptable complexity. Moreover, the algorithm needs to be mapped to a VLSI architecture with small area and high data rate. Since Spatial Multiplexing is a recent technique, it is argued that there is still much room for development of related algorithms and architectures. Therefore, this thesis focused on the study of sub optimum algorithms and VLSI architectures for broadband MIMO detector with soft decision. As a result, novel algorithms have been developed starting from proposals of optimizations for already established algorithms. Based on these results, new MIMO detector architectures with configurable modulation and competitive area, performance and data rate parameters are here proposed. The developed algorithms have been extensively simulated and the architectures were synthesized so that the results can serve as a reference for other works in the area
Resumo:
Objetivou-se avaliar o crescimento de novilhas de diferentes grupos genéticos no sistema de produção superprecoce. Utilizaram-se 132 novilhas dos seguintes grupos genéticos: 18 ¾ Canchim × ¼ Nelore (¾ CN); 18 ½ Canchim × ½ Nelore (½ CN); 24 Simbrasil -⅝ Simental × ⅜ Nelore; e 72 Three-cross ¼ Simental × ¼ Nelore × ½ Angus. As novilhas foram desmamadas aos 210 dias de idade, com 247,4 ± 16,5 kg de peso vivo (PV), mantidas em creep-feeding durante a fase de cria e confinadas por 132 ± 14 dias até atingirem 350 kg PV e 5 mm de gordura subcutânea, quando, então, foram abatidas. Os grupos genéticos não influenciaram o ganho de peso médio diário, porém a espessura de gordura subcutânea do dorso (EGS) e da garupa (EGG) foi maior nos animais Three-cross, que apresentaram os maiores valores iniciais (1,07 kg/dia). Não houve diferença na área de olho-de-lombo (AOL) inicial, porém a os animais Three-cross apresentaram os maiores valores iniciais. Nos animais do grupo Three-cross, a área de olho-de-lombo (AOL) final e ajustada para 100 kg de peso vivo (PV) foi inferior à observada nos demais grupos, porém o peso final foi superior ao do grupo Simbrasil, com tempo intermediário de confinamento. Ajustando-se os valores de AOL e EGG para o menor número de dias de confinamento (114 dias), animais Simbrasil apresentam maior valor de AOL final e os animais Three-cross e Simbrasil, maior EGG final.
Resumo:
Foram simuladas nove populações, cada uma com cinco replicações da variável ganho médio diário (GMD1) com distribuição normal e média 100, variando o tamanho dos grupos e os desvios-padrão. Cada replicação foi dividida de modo a formar grupos que representariam grupos de contemporâneos (GC) e de progênie dentro de GC. Cada GC tinha dez pais. Obtiveram-se três conjuntos: o conjunto 1 com 1.000 grupos de contemporâneos (GC), cada um com 100 observações e dez observações por pai; o conjunto 2, com 2.500 GC, 40 observações e quatro observações por pai; e o conjunto 3, com 5.000 GC, 20 observações e dois filhos por pai. em cada população, gerou-se GMD1, a qual foi transformada em outra variável, da seguinte forma: DIAS1 = 100/GMD1. Calcularam-se para cada pai, dentro de cada GC, as contribuições de cada GC ao valor de cada pai, para GMD1 (Cx) e DIAS1 (Cy). Os efeitos do máximo e da média de DIAS1 no grupo sobre o valor absoluto de Cy foram significativos, mas o R² foi baixo (máximo de 16%). O mínimo de DIAS1 não influenciou o valor de Cy. O máximo e o mínimo de GMD1 sobre Cx foram significativos, mas os R² foram muito baixos (máximo de 2%). A média não influenciou Cx. em grupos de contemporâneos com um animal com valor de GMD muito baixo, o valor de DIAS desse animal será relativamente muito mais alto, o que afetará a média do grupo e os valores de todos os animais do grupo. Esse efeito se refletirá na avaliação de seus pais e será mais uma importante fonte de erros na avaliação genética do rebanho. Assim, a utilização de DIAS em substituição ao GMD como critério de seleção para o melhoramento de bovinos é contra-indicada, pois deverá reduzir a possibilidade de ganho genético para crescimento.
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Objetivou-se, no presente estudo, avaliar a produção de leite de caprinos leiteiros da região sudeste do Brasil, com intuito de verificar os fatores de meio e estimar os parâmetros genéticos pelo método dos mínimos quadrados (MMQ). Os controles de 1336 lactações foram inicialmente ajustados pela função multifásica (difásica) e calculou-se a produção de leite total (PLT). Os dados foram provenientes de sete propriedades e três raças (Parda Alpina, Saanen e Toggenburg). A média e o erro-padrão da PLT estimados pelo MMQ foram de 635,31 ±39,75 kg. A interação ano x estação do parto influenciou a PLT. em um dos anos estudados, a PLT foi menor para as cabras paridas no final da estação. Nas três estações de parto, observou-se comportamento quadrático da PLT, em função dos anos de parto. Para as três estações, a PLT aumentou de 1986 até meados de 1990, decrescendo em seguida. A idade de máxima PLT foi observada aos 46,65 meses. Das três raças estudadas, observou-se que as raças Parda Alpina e Saanen apresentaram alternância de superioridade na PLT em algumas fazendas, porém maiores que a Toggenburg. Os coeficientes de herdabilidade e repetibilidade da PLT estimados pelo MMQ foram de 0,296 ± 0,079 e 0,277 ± 0,033, respectivamente. Estes resultados revelam baixa confiabilidade em poucas observações dessas características ou na inconsistência das estimativas da função multifásica. Como a PLT é uma característica limitada ao sexo, sugere-se o teste de progênie como método de seleção mais eficiente para os reprodutores e uso de inseminação artificial como processo de disseminação do material genético selecionado.
Resumo:
Avaliou-se o desempenho e a qualidade dos ovos de codornas de corte de quatro grupos genéticos, utilizando-se 288 aves com 42 dias de idade, em delineamento em blocos ao acaso com quatro tratamentos (grupos genéticos A, B, C e D) e seis repetições de 12 aves cada. A partir da primeira semana de alojamento, estabeleceu-se o programa de luz, iniciando-se com 14 horas diárias de fotoperíodo, com aumentos sucessivos de 30 minutos por semana até que atingisse 17 horas diárias de fotoperíodo. Semanalmente, os ovos e as sobras de ração de cada parcela foram pesados, para determinação do peso médio dos ovos e do consumo médio diário de ração. A cada 28 dias, foram coletados e analisados três ovos/parcela/dia por três dias consecutivos, para avaliação da qualidade externa e interna. Foram detectadas diferenças significativas entre os grupos genéticos para massa de ovos e peso médio dos ovos, de modo que o grupo genético B apresentou média superior à dos demais. Para gravidade específica e porcentagem de casca, foram observadas diferenças significativas entre os grupos genéticos, com médias superiores para o grupo genético D. Os grupos genéticos testados apresentaram boa produção e qualidade de ovos, comprovando que estas codornas de corte podem ser utilizadas como matrizes de pintainhos de corte.